决策树分类预测过程可视化

[[203082]]

开始前的准备工作

首先导入所需库文件，numpy，pandas用于数值处理，DictVectorizer用于特征处理，graphviz用于模型可视化。

复制

#导入所需库文件  import numpy as np  import pandas as pd  from sklearn.feature_extraction import DictVectorizer  from sklearn import cross_validation  from sklearn import tree  import graphviz

导入所需的数据文件，用于训练和评估模型表现。

复制

#导入数据表  test=pd.DataFrame(pd.read_csv('TEST_ML_v2.csv',header=0,encoding='GBK'))

特征处理

第二步，对特征进行处理。

复制

#特征处理  X_df=test[['City', 'Item category', 'Period', 'Gender', 'Age', 'Market channels', 'Self-agent', 'Category', 'Loan channels']]  X_list=X_df.to_dict(orient="records")  vec = DictVectorizer()  X=vec.fit_transform(X_list)  Y=np.array(test['Status'])划分训练集和测试集数据。

划分训练集和测试集数据

复制

X_train,X_test,y_train,y_test=cross_validation.train_test_split(X.toarray(),Y,test_size=0.4,random_state=0)

训练模型并进行预测

使用训练集数据对决策树模型进行训练，使用测试集数据评估模型表现。

复制

#训练模型  clf = tree.DecisionTreeClassifier(max_depth=5)  clf=clf.fit(X_train,y_train)  clf.score(X_test,y_test)  0.85444078947368418

简单对测试集的***组特征进行预测，结果与实际值相符。

复制

#对测试集数据进行预测  clf.predict(X_test[0]),y_test[0]  (array(['Charged Off'], dtype=object), 'Charged Off')

查看具体的分类概率值。

复制

#查看分类概率  clf.predict_proba(X_test[0])  array([[ 1., 0.]])

决策树分类预测可视化

第三步，对决策树的分类预测过程进行可视化，首先查看分类结果及特征的名称。

复制

#获取分类名称  clf.classes_  array(['Charged Off', 'Fully Paid'], dtype=object)

对决策树进行可视化，feature_names为特征名称，class_names为分类结果名称。

复制

#决策树可视化  dot_data = tree.export_graphviz(clf, out_file=None,  feature_names=vec.get_feature_names(),  class_names=clf.classes_,  filled=True, rounded=True,  special_characters=True)  graph = graphviz.Source(dot_data)  graph

将分类结果保存为PDF格式文档。

复制

#导出PDF文档  graph.render("test_e1")

喜欢已喜欢

335 2017-09-11 13:33:44 大数据数据可视化决策树

父子分类关系查询使用的SQL语句介绍

EJB的分类及其各自的功能和应用

最新发布

马斯克推出政务机器人：用AI批量取代公务员人工智能在过程控制中的应用前景有柳岩问：高并发库存扣减一致性问题，怎么用 Redis 解决？运维老鸟才知道：三个 Ansible 脚本玩转千台服务器和面试官聊聊：那次让我成长最快的 K8s 故障十个开源工具让你的编程“游戏”更加强大惊艳到了，每个开发人员都应该要知道的六个 HTML 属性！ C#异步编程终极指南：高并发场景下如何避免系统崩溃？实战代码全公开 C#+AI暴力变现：自动生成小红书爆款笔记，单账号月流水破10万源码解析 Android Binder 如何做到 IPC 只拷贝一次？mmap 机制全解！

您正在使用低版本浏览器，为了获得更良好的体验，建议您升级浏览器，为您推荐：