定量金融模型与交易框架
介绍quantmod: 1、获取数据 2、使用quantmod制图 3、采用数据生成信号 可以通过一个quantmod函数下载不同来源的数据,包括: Yahoo! Finance (OHLC data) Federal Reserve B……
jamieDee 2019-02-15
R中的NLP生态系统概述
> 在BNOSAC, R经常用于执行文本分析,因为它是一个优秀的工具,可以提供数据科学家在业务设置中执行文本数据分析所需的任何东西。 对于不熟悉丰富的R包在文本分析方面提供的所有可能性的用户,我们制作了这个小思维图,展示了在BNOSAC建立……
陆勤 2019-02-14
R与Python?{reticulate}助你在R中使用Anaconda Python
这片简短的博客阐明在{reticulate}包下,如何在R Notebook简单的使用R和Python。为了完成这项任务,你可能需要升级RStudio到[最新版本](https://www.rstudio.com/products/rst……
jamieDee 2019-01-29
{tidyxl}将excel文件转换为机器可读的csv文件
我不会写很长的介绍,我们都知道Excel在商业界广泛应用,它拥有大量非常好的特性,特别是对于那些不懂得编写程序的商业从业者。但是,如果Excel提供的功能不能满足个人意愿,那就会比较麻烦。通常,人们把Excel当做一个汇报的工具,虽然它实……
jamieDee 2019-01-26
R语言做深度学习
> 如何用R语言做深度学习? 我带着这个问题,开始了我的学习与实践。 阅读本文,你可以获得: R语言做深度学习工作环境创建 R语言快速实现神经网络模型 R语言做深度学习的资料 深度学习的应用场景 感谢RStudio公司开发的keras包……
陆勤 2019-01-25
如何将多个ggplot图组合成可公开的图
数据科学的生命周期离不开分析/研究结果的交流。事实上,数据可视化是R作为一种数据科学语言相对于最著名的Python具有优势的领域之一。由于ggplot2是R程序员的可视化DSL(领域特定语言),现在的竞争变成了如何有效地使用ggplot2包……
陆勤 2019-01-22
使用pdftools包获取pdfs的数据
通常情况下数据都包装在pdfs里面,值得庆幸的是有很多途径可以从中提取出数据。一个非常好的包就是pdftools(Github link),这篇博客将描述该包的一些基本函数。 首先,我们寻找一些包含有趣信息的pdf文件。为了完成目标,我使用……
jamieDee 2019-01-18
LMM线性混合模型by nlme
介绍 线性混合模型是数据模型中一种重要的类别,它可以分析存在相关关系的数据,模型里面包含固定效应以及随机效应,随机效应描述的是在不同层次的不同水平中,各变量对总体观察变量的贡献。 数据导入 本文选择的数据来自Andrzej Gałecki……
jamieDee 2019-01-06
使用spotifyr聚类Springsteen专辑
spotifyr包很棒,让我们来探索音乐的各个方面,如节奏、舞蹈性和化合价。在这篇文章中,我们将从相同点和不同点来探讨布鲁斯·斯普林斯汀的专辑。 # devtools::install_github('charlie86/spotifyr'……
陆勤 2019-01-02
银行信贷数据集探索性数据分析
本文为了迭代一个探索性数据分析的通用模式,首先使用银行信贷数据进行探索性数据分析,希望能够得到一个通用的强大探索性解决方案。 数据导入 数据是来自klaR的GermanCredit数据. library(pacman) p_load(tid……
HopeR 2018-12-29
Centos7服务器上安装R和Rstudio
> 为了增加计算力来处理和整合更多和更杂的数据集,运维同事给我们分配了服务器。服务器是用Centos7的Linux系统,为了完成数据科学任务,我们需要在服务器上面搭建R平台。 通过阅读本文,你可以获得: 服务器上面安装R和RStudio ……
陆勤 2018-12-28
关于 Rstudio 1.2 新功能介绍
RStudio公司与2018年10月2号发布了preview release RStudio 1.2版 IDE。 目前官网里还是提供1.1版下载。如果想下载1.2版的请到下载地址: (Rstudio 1.2) 5.更容易生成PPT Rs……
Tony D 2018-12-14
R的整洁交叉验证教程
介绍 这篇文章将使用{tidymodels}软件包集合中的几个软件包,即{recipes},{rsample}和{parsnip}以整洁的方式来训练随机森林。 我还将使用{mlrMBO}来调整随机森林的超参数。 设置 让我们加载所需要的包:……
陆勤 2018-12-13
6个技巧,让你的可视化看起来更专业
当我开始使用R时,像任何初学者一样,我想要一个真正能够工作的代码和一个最低限度可理解的图像,并且很长一段时间这是我的主要目标,但是一旦这一点完成后,我意识到我的可视化看起来很糟糕,特别是在比较和审查其他博客和网站之后,我开始搜索如何改进我的……
陆勤 2018-12-13
使用LIME探索模型
> 编者按:模型的解释性对于模型的应用和可信,有着重要意义。同时,也可以让模型更透明,更公平,也更好地服务大众,以降低模型多带来的风险。如何对黑盒模型的解释性做探索和研究,本文的LIME方法在一定程度上可以发挥作用和达成目的。 最近在工作……
陆勤 2018-11-23