修改ggplot的图例符号
介绍 最新版本的ggplot2 3.2.0使我们能够像这样改变图例中的符号。 library(ggplot2) ggplot(economics_long, aes(date, value01, colour = variable)) +……
陆勤 2019-06-30
R画树状图:一种轻量级方法
R画树状图 树状图是用于表示层次关系的图,例如从分层聚类获得的层次关系。它们常用于生物学,尤其是遗传学,用于揭示一组基因或者分群的关系。 R中已有一些方法可以画树形图(请查看[这里](http://www.sthda.com/english……
陆勤 2019-06-18
连续变量分布之直方图
直方图是一种适合描述连续变量分布的图形。 作图逻辑: 连续变量分箱 统计每个箱子的样本数 每个箱子的样本数表示直方图的高度 注意点: 分箱(粗与细, 人工干预和自动处理) 直方图展示与统计学的关联,以指导合理解读数据 R语言实现直方……
陆勤 2019-05-24
使用R语言的blorr包做逻辑回归
我们很高兴向您介绍blorr包,这是一组用于在R中构建和验证二进制逻辑回归模型的工具,它是为初学/中级R用户设计的。 全面回归输出 变量选择过程 双变量分析,模型拟合统计和模型验证工具 各种图形和底层数据 如果您知道如何使用glm()构……
陆勤 2019-05-12
R语言面试问题集2
续接《[R语言面试问题集1](http://www.shujuren.org/article/972.html "R语言面试问题集1")》, 本文汇总15个R语言面试问题。 R语言面试问题集2 16. 聚类是什么?kmeans聚类和层次聚类……
陆勤 2019-05-11
快速提高ggplot图的可读性和视觉吸引力的一步
图形清晰地传达了一个点,这是一个很棒的东西。 当你看到它时你就知道了。 这种图形让你停下来说“哇!”。 有各种不同的图形符合这种描述,但它们通常有一些共同点: 清晰度:图形的信息很清楚 简单:删除了无关的细节 视觉吸引力:图形应该令人满意……
陆勤 2019-05-06
公司需要模型的可解释性
对于机器学习模型的可解释性有很多方法,但是它们都缺少什么呢? [LIME的ICE和部分依赖图](https://uc-r.github.io/lime "LIME的ICE和部分依赖图")不能告诉我拟合关系的准确性。此外,ICE没有确切地告诉……
陆勤 2019-05-02
R学习与实践教程
在这个内核中,我收集了我所写的所有R语言教程,按级别划分。 初学者:在这个级别,我假设你没有编程背景或刚刚开始使用R. 中级:在这个级别,我假设您熟悉如何使用R的基础知识,但仍然熟悉语法。 高级:在这个级别,我认为你很乐意编写代码来在R中……
陆勤 2019-05-01
用R探索自行车租赁行为
自行车已经成为城市旅行中增长最快的方式之一,这就是为什么Lyft和Uber进入了两轮车的游戏中。Lyft最近收购了全球最大的自行车租赁公司,将与优步(Uber)的Jump和福特(Ford)的GoBikes展开竞争。这两家公司在旧金山分别实现……
陆勤 2019-04-20
如何用R建模GBM?
本文使用梯度提升机(GBM)来找出是什么驱动了自行车租赁行为。 与其他决策树算法相比,GBM是独一无二的,因为它按顺序构建模型,给予那些在先前模型中预测不佳的情况下的较高权重,从而逐步提高准确性,而不是简单地采用随机森林算法的所有模型的平均……
陆勤 2019-04-20
descriptr包做描述性统计分析
> 做描述性统计分析 安装 # Install release version from CRAN install.packages("descriptr") # Install development version……
陆勤 2019-04-12
rfm包做RFM分析
> rfm包:RFM分析的工具 概述 用于RFM(recency, frequency and monetary)分析的工具。从事务级和客户级数据生成RFM评分。使用热图、直方图、条形图和散点图来可视化recency, frequency和……
陆勤 2019-03-31
R可能让您惊喜的10件事
在过去的几周里,我与一些来自计算机科学领域的人进行了一些互动,他们对R编程语言颇有微词。许多批评集中在R聚焦于统计分析的局限性上。 的确,R有一个非常全面的[CRAN](https://cran.r-project.org/ "CRAN")……
陆勤 2019-03-20
如何整合多种ggplot的图像用于出版
数据科学的生命周永远不会在缺乏交流分析或研究的结果下完成。实际上,数据可视化是R作为一种数据科学语言,相比于最受欢迎的Python获得优势的其中一个领域。对于R程序员来说,ggplot2事实上是一种特定领域可视化的语言。现在竞争变成了个体如……
jamieDee 2019-03-18
ROC曲线的一些R包
在最近的一篇文章中,我介绍了ROC曲线背后的一些理论,并概述了它们在表征机器学习模型性能方面的发展历史。 在这篇文章中,我将描述如何在CRAN中搜索绘制ROC曲线的包,并强调六个有用的包。 虽然一开始我有一些想谈论的包的想法,像ROCR和p……
陆勤 2019-03-12