搜索到 880 条结果

您可能要找:

数据科学的做和不做
数据科学的做和不做 不要仅仅从数据方面入手 你需要在开头准备一个问题 不要以为一个人什么都能做 你需要建立一个优秀的团队 不要单纯的使用一种工具 你需要根据实际使用最好的工具 不要吹嘘你的数据量怎么样 你需要自己去收集一些数据 不要忽略任何……
firedata 2016-04-26
多元统计分析之因子分析及R实现
一、 因子分析的思想 因子分析可以说是主成分的推广,也是一种把多个变量化成少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。因子分析也是数据缩减的一种多变量分析方法,它是从研究相关矩阵之间的内部……
薛丽丹 2016-04-26
多元统计分析之聚类分析及R实现
一、 聚类分析的概念和类型 (1) 概念 聚类分析法(cluster analysis)是研究物以类聚的一种现代统计分析方法。过去人们主要靠经验和专业知识作定性分类处理,很少利用数学方法,定性分类更难以实现准确分类。为了克服定性分类的不足,……
薛丽丹 2016-04-26
R语言做数据挖掘教程
引言 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科……
薛丽丹 2016-04-26
统计学思考导论读书笔记-样本比较(一)
10.两个样本的比较 1.样本的比较 现在,我们讲讲推断统计中两个变量之间的关系问题。 之前的章节中,我们都是采用单个方法进行函数分布问题的求解。然而,在实际的统计问题中,我们往往需要多种测量方法来了解两个变量之间的关系,尤其是一个变量的结……
firedata 2016-03-06
统计学思考导论读书笔记-样本比较(二)
4.t检验分析两样本均值 除了按照上面的方法,根据两样本的方差求出两样本的期望之差外,我们还可以引入假设检验对它们的差进行检验。先前在假设性检验的时候就已经讲了H0原假设和H1备择假设,也求出了一个假设的拒绝域。同样的,我们也可以根据假设性……
firedata 2016-03-06
大数据来袭,你想做什么职位?
昨天我们大致简述了数据科学家的基本概念及一些基本要求。现在我们将详细介绍一些关于数据行业的职位及要求,希望能给大家的学习及求职带来帮助。   大家需要注意的是,不是我们每个人都一定得做数据科学家,毕竟数据这个概念也着实宽泛,需要我们掌握的技……
薛丽丹 2016-04-27
R + 数据库 = 非常完美
[![R会议演讲](http://img.shujuren.org/pictures/JG/5722294b6fcb6.JPG "R会议演讲")](https://nyucynthia2012.wordpress.com "R会议演讲") ……
飞翔的独角兽 2016-04-28
关于未来数据科学家的一些小贴士
关于未来数据科学家的一些小贴士 目前,我正在准备举行一场以本科生作为观众的座谈会,我也因此顺便写一下关于未来数据科学家的一些小贴士。这些小贴士主要是针对于学生(研究生或本科生)或者是其它那些想要进入这个数据科学领域的人设计的。 我曾请教了我……
firedata 2016-04-28
【4月29日】作者投稿精选
【4月29日】作者投稿精选 1[ R + 数据库 = 非常完美](http://www.shujuren.org/article/100.html " R + 数据库 = 非常完美") 推荐语:作者通过一个使用案例分享了R语言和数据库的完美……
陆勤 2016-04-28
大数据时代的集体“裸奔”??
大数据时代的集体“裸奔”?? 文/张涵诚 《大数据时代》的作者维克托•迈尔-舍恩伯格在他早年写下的《删除》一书中曾提到,大数据时代的来临改变了生物性遗忘的特质,信息经由数字存储的方式保存下来,就变成了不易删除的记忆,遗忘反而成为例外。在这种……
陆勤 2016-05-11
6种机器学习模型介绍
6种机器学习模型介绍 我曾经出于某种目的在机器学习相关的讨论中写了这样的一篇博客。 对于分类和回归问题,这里有很多不同的机器学习模型的选项,而且每一个都能被视作是解决同一个问题的黑匣子。然而,每个模型都来自不同的算法的实现方法,并且不同的数……
firedata 2016-04-28
几种分布概述(正态分布/卡方分布/F分布/T分布)
正态分布: 正态分布(Normal distribution)又名高斯分布(Gaussiandistribution),若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了……
结实 2016-04-29
你懂数据工作流程吗?
大家都明白,我们做数据的首要目的就是要做出一系列的数据产品。当然,数据产品可以一个某产品的推荐报告、一个数据图表、或者是帮领导做出明智决策的可行性报告。总之,,数据科学应该产生一些对现实有用的结果,而这些结果就是所说的数据产品。我们做出数据……
薛丽丹 2016-04-29
如何进行机器学习
如何进行机器学习 最近,有一位工程师问我,她说她怎样才能把对机器学习的兴趣转化为她的全职工作。这个学科有着很不错的前景,因为整一个学科直到最近才和传统的工程行业分开来,而且,目前只有几位专家在一些大公司用它进行生产活动,它们的工作和传统产……
firedata 2016-04-30