搜索到 880 条结果

您可能要找:

自学机器学习向导
自学机器学习向导 这里,你在学习机器学习的过程中,可以做很多的事情。这里有很多来自书籍和课程的资源给你提供参考,甚至你可以参加比赛和属性使用工具。在这篇文章里,我想对这些活动提供一些架构,并在你从程序员转变为机器学习专家的旅途中给你提供一些……
firedata 2016-03-08
使用R绘制几种常用的双坐标轴图形
之前公众号推送了一系列关于使用ggplot2包绘制统计图形的文章,有网友询问是否可以绘制双轴的统计图形。很抱歉,Hradly在设计ggplot2包时就没有将双轴图形功能考虑进来。难道R语言就无法绘制双轴图形了吗?非也,R不仅是统计学家的标准……
lsxxx2011 2016-02-19
使用R绘制其他图形之热图及网络图
热力图是一种非常常用的统计图形,该图将两个变量(一般是离散变量)的交叉汇总信息以颜色的形式展现出来,而映射给颜色变量的是连续型数值变量,下面就以例子说明热力图的优势: #模拟数据集 set.seed(123) Year <- re……
lsxxx2011 2016-02-15
用dplyr包进行数据操作
dplyr包是由Hadely Wickham编写的,并用于数据操作的包。这个包给我们用户提供了一个关于探索性数据分析以及操作中,一些功能强大,而且容易操作的函数的一个程序包。这里,我会讲述几个关于dplyr包里最常用的几个函数。 在这篇文章……
firedata 2016-02-02
用reshape2包进行数据操作
在这篇文章中,我会向大家展示如何使用reshape2包把从范围较广的数据转化成长格式,反之亦然。这篇文章由Hardely Wickham编写。 长格式与宽格式 在宽格式数据中,每一列都代表一个变量。例如,在mtcars数据集中,我们可以看到……
firedata 2016-01-26
数值型数据的探索分析
数据分析过程中,往往需要对数据作基本的探索性分析,查看数据是否存在问题,如缺失值数量、是否存在明显的异常值、数据是如何分布的、数据的集中趋势和离散趋势等。 探索性分析一般包括三大部分,即数据的分布情况、数据的集中与离散趋势和数据的分布形态……
lsxxx2011 2016-03-08
统计学思考导论读书笔记-回归分析(上)
统计学思考导论读书笔记-回归分析(上) 回归分析,本质上就是讨论两个或多个变量之间的相互关系;具体一点的说,就是自变量与因变量之间的关系的探讨。而回归分析在统计学中是一个非常基础的统计模型,同时也是统计模型里的重中之重,在生活中拥有广泛的用……
firedata 2016-03-07
统计学思考导论读书笔记-回归分析(下)
统计学思考导论读书笔记-回归分析(下) 4.R方和残差 这一部分的内容,我们将要引入残差这个概念来讨论一个模型的拟合度。残差,是用来检验预测值和实际值之间所存在的偏差,于是,我们在R中,把所有变量的残值和所有的变量的残值的偏差进行比较所得到……
firedata 2016-03-07
统计学思考导论读书笔记-假设性检验(上)
统计学思考导论读书笔记-假设性检验(上) 在实际生活中,如果我们在进行统计活动的时候面临着2个可选的方案,除了要用到之前讲过的平均数、中位数、方差、置信区间、甚至各种理论模型以外,我们还需要考虑别的因素。比如,在进行统计分析的时候,我们有必……
firedata 2016-03-03
统计学思考导论读书笔记-假设性检验(下)
统计学思考导论读书笔记-假设性检验(下) 1. 假设性检验的期望 接下来,我们还是从cars数据文件出发。不过这次我们并不是要从汽车的价格来谈起,这一次我们从汽车在高速公路和城市的耗油量之差这一角度来分析: 图1 图2 接下来,我们画一……
firedata 2016-03-05
基于R语言的主成分和因子分析
主成分分析 主成分分析,是一种降维的分析方法,其考察多个变量间相关性的一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。 为什么要……
lsxxx2011 2016-01-08
Accelerate R applications by cuda on GPU讲座总结
[微课堂]Accelerate R applications by cuda on GPU 分享内容: 本次讲座会介绍在数据分析中用到的并行化技术,并以R为平台介绍如何开发移植和优化数据分析的各种算法,如深度学习,knn算法。GPU当今已成……
薛丽丹 2016-04-23
教你使用tidyr包进行数据预处理
之前介绍了如何使用data.table包、reshape包、plyr包和dplyr包进行数据预处理。 最后再跟大家介绍一下tidyr包。 有关data.table包、reshape2包、plyr包和dplyr包的介绍请参考: 《强大的da……
lsxxx2011 2016-01-28
统计学思考导论读书心得-抽样分布(上)
抽样分布 这一部分内容着重对样本进行讨论。如果说前面3个章节只是介绍了最基本的统计模型的话,这一章节则是引入样本的概率。 样本,即调查或研究的一部分个体称为研究,而抽样调查就是从一个整体抽取部分个体作为研究对象就称之为抽样调查;抽样分布,可……
firedata 2016-01-20
灵活的字符串处理包:stringr
在文本或非结构数据处理中往往需要正则表达式的强大功能,需要字符串的处理,下文就讲讲这几天梳理的stringr包中的函数。该包仍然由伟大的Hadley做贡献。 word(),从句子中提取词组(适用于英语环境下的使用) word(string,……
lsxxx2011 2016-04-01