我已经使用SPSS生成一个CHAID树.它对连续变量进行自动分级并返回卡方值和自由度,这在R.Below的汇总函数中找不到是一个部分样本输出.
Node 0 1 Total PC Parent Variable Sig.a Chi-Square df Split Values
N Percent N Percent N Percent
0 148025 84.0% 28111 16.0% 176136 100.0% 0
1 102390 93.9% 6643 6.1% 109033 61.9% 0 0 SALES1 0.000 42991.370 4 <= .000
2 12600 91.3% 1194 8.7% 13794 7.8% 0 0 SALES1 0.000 42991.370 4 (.000,149.990]
3 15140 83.7% 2942 16.3% 18082 10.3% 0 0 SALES1 0.000 42991.370 4 (149.990,1044.000]
R返回的是:
https://stackoverflow.com/questions/32739093/what-are-the-available-chaid-summary-functions-in-r
我已经找到了方法来利用树输出并像这个例子一样玩它:
chaid regression tree to table conversion in r
是否有函数在R或python中获得SPSS类型的输出,还是必须使用R中的partykit包手动完成所有这些操作?
最佳答案 我最近在python中为CHAID
here编写了一个开源软件包