scikit-learn库决策树模型结果运用

2019年7月6日 238次阅读来源: 曹骥

前三篇文章我们对经典的贷款还款逾期问题进行了模型的建立和参数调整，并将结果可视化。

模型建立了，自然是要拿来用了。这里我们就看看模型的简单运用。

《scikit-learn库决策树模型结果运用》

import sklearn
import pydotplus
import pandas as pd 
from sklearn import tree
#导入各种库
df=pd.read_excel(r'C:\Users\数据\Desktop\Model\决策树1.0.xlsx')
df_data=df.iloc[:,:3]
df_target=df.iloc[:,3]
#导入数据，并将数据分为自变量和应变量

model=tree.DecisionTreeClassifier()  #选择模型，并设置参数（这里没有设置参数）
model=model.fit(df_data,df_target)   #训练数据

with open(r'C:\Users\数据\Desktop\Model\tree.dot','w') as f:
    f=tree.export_graphviz(model,out_file=f)
#将训练的模型保存

dot_data=tree.export_graphviz(model, out_file=None, feature_names=df_data.columns, class_names=['Not Cheat', 'Cheat'], filled=True, rounded=True, special_characters=True)
graph=pydotplus.graph_from_dot_data(dot_data)
graph.write_pdf(r'C:\Users\数据\Desktop\Model\tree.pdf')
#将模型可视化并保存