数据挖掘第二章代码啦啦啦
立即下载
资源介绍:
数据挖掘第二章代码啦啦啦
# -*- coding: utf-8 -*-
"""
Created on Wed Mar 8 13:09:56 2023
@author: 数据挖掘课程组
"""
from sklearn import datasets
from sklearn import preprocessing
from sklearn import tree
#步骤1: 加载数据集
iris = datasets.load_iris()
n_samples, n_features = iris.data.shape
X = iris.data
Y = iris.target
print('步骤1:加载iris数据集')
print('iris数据集中有%d个样本,%d个特征。' % (n_samples, n_features))
print('iris的前5个样本为:\n', X[0:5])
#步骤2: 数据预处理
min_max_scaler = preprocessing.MinMaxScaler()
X_scale = min_max_scaler.fit_transform(X)
print('步骤2:数据预处理')
print('规范化后iris的前5个样本:\n', X_scale[0:5])
#步骤3: 使用决策树算法构建分类器模型
classifier = tree.DecisionTreeClassifier()
classifier = classifier.fit(X, Y) #在训练集上训练
Y_predict = classifier.predict(X) #使用训练好的模型进行预测
print('步骤3:决策树模型构建…')
#步骤4:模型的评估
accuracy = (Y == Y_predict).sum() / Y.shape[0]
print('步骤4:模型评估')
print("决策树在训练集上的分类准确度为: %.3f" % (accuracy*100))