我想比较CART和CHAID算法,我选择rpart(cart算法)和party(chaid算法)来看看它们之间的区别.
我的数据是关于血压的:
派对功能让我回报:
library(party)
# par <- ctree_control(minsplit=20, minbucket=10)
arbre <- ctree(bpress_level ~ ., data = df)
arbre
plot(arbre)
rpart包返回给我:
library(rpart)
fit <- rpart(bpress_level ~ .,
method="class", data=df)
printcp(fit) # display the results
plotcp(fit)
plot(fit, uniform=TRUE,
main="Classification Tree for pressure level")
text(fit, use.n=TRUE, all=TRUE, cex=.8)
我不明白为什么树木决定如此不同,这是正常的吗?
为什么派对包该算法忽略了像烟,压力,性别….
先感谢您.
最佳答案 首先,ctree([party])不使用CHAID算法.它与CHAID非常相似,但不是CHAID. CHAID只能在数据属于分类时应用.
当然,还有许多其他递归分区算法或多或少类似于可以处理混合数据类型的CHAID.例如,CTree算法(条件推断树)也基于重要性测试,并且在包partykit中的ctree()中可用.