例如,我有基本的堆积图: ggplot(钻石,aes(x =因子(颜色),填充=因子(切割)))geom_bar(position =“fill”) 我的小子钻石的“克拉”值大于3: subset(diamonds,ca…
标签:r
使用R中的.mids对象创建训练数据集
我有缺少组件的数据,所以我运行了鼠标算法(来自包鼠标).该函数返回一个.mids对象,我想将其拆分为训练和测试数据集以评估模型拟合.我希望训练和测试数据也是.mids形式,以便它们可以与各种其他功能(如池)结合使用,以根…
R tkrplot布局问题
我有一个问题,在R中使用tkrplot绘制的右边和下面的图表中有额外的空间,如下所示.我已经尝试过更改hscale和vscale,但所有这一切都会放大/缩小每个绘图的整体大小,以及额外的不需要的空间. 生成这些代码的代码…
如何在SPARKR DataFrame中的列的每个值上应用函数?
我对SPARKR比较新.我下载了SPARK 1.4并设置了RStudio来使用SPARKR库.但是,我想知道如何将函数应用于分布式DataFrame的列中的每个值,有人可以帮忙吗? 例如, 这非常有效 myFunc &l…
R:使用支持向量机预测月度销售数据的两种方法
我有一个关于时间序列和SVM的问题.我已经问过强大的互联网,但不幸的是信息很少,而且主要关注的是交易数据. 我的情况如下:目前,我尝试从Arima预测切换到更复杂的模型.目前,我尝试理解并实现SVM模型.我找到了一些关于…
同时使用SparkR和Sparklyr
据我所知,这两个软件包为Apache Spark提供了类似但大多不同的包装函数. Sparklyr更新,仍然需要在功能范围内发展.因此,我认为当前需要使用这两个包来获得全部功能. 由于两个软件包实际上都包含了对scala…
用图R创建xlsx的最快方法
我有数据列表和我希望两个写入xlsx文件的图表列表(每个元素分隔表格).示例数据: require(ggplot2) require(data.table) n <- 10 N <- 100 dtList &…
从命令行渲染R演示文稿
有没有办法从命令行创建R演示文稿? https://support.rstudio.com/hc/en-us/articles/200486468-Authoring-R-Presentations 我将以下R Pres…
华夫饼包:颜色与数据中的零/ 0混合
我的数据的一个例子: 1 99 85 15 8 92 1 99 10 90 0 100 问题是最后一组数字:当包含0时,华夫饼的行为就像是100.零似乎被忽略了.有办法防止这种情况吗? 工作:绿色= 10,橙色= 90 …
simple_triplet_matrix出错 – 无法使用RWeka来计算短语
使用TM,我将DocumentTermMatrix与字典列表进行比较以计算总数: totals <- inspect(DocumentTermMatrix(x, list(dictionary = d))) 这适用…
在ggplot2中强制密度图的颜色
我有两个重叠密度函数,我创建如下: require(ggplot2) set.seed(2) a =rnorm(100) b = rnorm(100,.5,1.2) c = rnorm(100,.3,1.2) data …
如何在极坐标图(coord_polar)中连接geom_line的端点和起点?
我有点卡住在极坐标图中获取一条线的端点以连接起始点. 我的数据: df <- structure(list(ri = c(0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 11…