R可能让您惊喜的10件事
在过去的几周里,我与一些来自计算机科学领域的人进行了一些互动,他们对R编程语言颇有微词。许多批评集中在R聚焦于统计分析的局限性上。 的确,R有一个非常全面的[CRAN](https://cran.r-project.org/ "CRAN")……
陆勤 2019-03-20
如何整合多种ggplot的图像用于出版
数据科学的生命周永远不会在缺乏交流分析或研究的结果下完成。实际上,数据可视化是R作为一种数据科学语言,相比于最受欢迎的Python获得优势的其中一个领域。对于R程序员来说,ggplot2事实上是一种特定领域可视化的语言。现在竞争变成了个体如……
jamieDee 2019-03-18
ROC曲线的一些R包
在最近的一篇文章中,我介绍了ROC曲线背后的一些理论,并概述了它们在表征机器学习模型性能方面的发展历史。 在这篇文章中,我将描述如何在CRAN中搜索绘制ROC曲线的包,并强调六个有用的包。 虽然一开始我有一些想谈论的包的想法,像ROCR和p……
陆勤 2019-03-12
如何通过R建立流程图:DiagrammeR
自从我学会了Markdown并且在RStudio使用R notebook生成高质量的PDF报告,我希望不再使用Microsoft Office。事实上,通过R Markdown,我可以完成所有事情,除非我需要制作流程图。流程图是一种代表工作……
jamieDee 2019-03-11
R导出可编辑图到ppt:结合使用ggplot2以及officer
最近我面临以下的问题:创建数以百计的图片以便我们的客户仍旧可以编辑。这意味着我需要把图表导出到Excel、PPT或者其它客户熟悉的工具,而不是像往常那样把图片直接以pdf或者png形式导出。尽管我还是希望使用R解决这个问题,因为我可以进行……
jamieDee 2019-03-03
使用R的caret对银行定期存款订阅进行分类
> 本文使用来自葡萄牙一家银行机构的直接营销活动数据来预测客户是否会订阅定期存款。我们将与R的caret包一起工作来实现这一点。 在本文中,我们将使用来自葡萄牙银行机构的直接[营销活动数据](https://archive.ics.uci……
陆勤 2019-02-19
定量金融模型与交易框架
介绍quantmod: 1、获取数据 2、使用quantmod制图 3、采用数据生成信号 可以通过一个quantmod函数下载不同来源的数据,包括: Yahoo! Finance (OHLC data) Federal Reserve B……
jamieDee 2019-02-15
R中的NLP生态系统概述
> 在BNOSAC, R经常用于执行文本分析,因为它是一个优秀的工具,可以提供数据科学家在业务设置中执行文本数据分析所需的任何东西。 对于不熟悉丰富的R包在文本分析方面提供的所有可能性的用户,我们制作了这个小思维图,展示了在BNOSAC建立……
陆勤 2019-02-14
R与Python?{reticulate}助你在R中使用Anaconda Python
这片简短的博客阐明在{reticulate}包下,如何在R Notebook简单的使用R和Python。为了完成这项任务,你可能需要升级RStudio到[最新版本](https://www.rstudio.com/products/rst……
jamieDee 2019-01-29
{tidyxl}将excel文件转换为机器可读的csv文件
我不会写很长的介绍,我们都知道Excel在商业界广泛应用,它拥有大量非常好的特性,特别是对于那些不懂得编写程序的商业从业者。但是,如果Excel提供的功能不能满足个人意愿,那就会比较麻烦。通常,人们把Excel当做一个汇报的工具,虽然它实……
jamieDee 2019-01-26
R语言做深度学习
> 如何用R语言做深度学习? 我带着这个问题,开始了我的学习与实践。 阅读本文,你可以获得: R语言做深度学习工作环境创建 R语言快速实现神经网络模型 R语言做深度学习的资料 深度学习的应用场景 感谢RStudio公司开发的keras包……
陆勤 2019-01-25
如何将多个ggplot图组合成可公开的图
数据科学的生命周期离不开分析/研究结果的交流。事实上,数据可视化是R作为一种数据科学语言相对于最著名的Python具有优势的领域之一。由于ggplot2是R程序员的可视化DSL(领域特定语言),现在的竞争变成了如何有效地使用ggplot2包……
陆勤 2019-01-22
使用pdftools包获取pdfs的数据
通常情况下数据都包装在pdfs里面,值得庆幸的是有很多途径可以从中提取出数据。一个非常好的包就是pdftools(Github link),这篇博客将描述该包的一些基本函数。 首先,我们寻找一些包含有趣信息的pdf文件。为了完成目标,我使用……
jamieDee 2019-01-18
LMM线性混合模型by nlme
介绍 线性混合模型是数据模型中一种重要的类别,它可以分析存在相关关系的数据,模型里面包含固定效应以及随机效应,随机效应描述的是在不同层次的不同水平中,各变量对总体观察变量的贡献。 数据导入 本文选择的数据来自Andrzej Gałecki……
jamieDee 2019-01-06
使用spotifyr聚类Springsteen专辑
spotifyr包很棒,让我们来探索音乐的各个方面,如节奏、舞蹈性和化合价。在这篇文章中,我们将从相同点和不同点来探讨布鲁斯·斯普林斯汀的专辑。 # devtools::install_github('charlie86/spotifyr'……
陆勤 2019-01-02