搜索到 175 条结果

您可能要找:

需求高涨的数据科学家
从技术方面来看,硬盘价格下降,NoSQL数据库等技术的出现,使得和过去相比,大量数据能够以廉价高效的方式进行存储。此外,像Hadoop这样能够在通用性服务器上工作的分布式处理技术的出现,也使得对庞大的非结构化数据进行统计处理的工作比以往更快……
陆勤 2016-04-22
27本免费的数据挖掘书籍
27本免费的数据挖掘书籍 你应该知道,这里是 DataOnFocus;而我们在这里很乐意分享一些信息,尤其是数据科学及其相关学科的信息。然而,什么样的方式是学习一个具体课题的最好的方法呢?看这方面的书籍,并且从你获得的新的知识中进行实践。……
firedata 2016-04-23
过好眼前的苟且,才配得上拥有诗和远方
文/结实 对于数据人来说,我们的诗和远方是什么?是在大数据时代背景下尽情滴施展拳脚。对于企业来说,诗和远方是深度挖掘数据价值,支持业务的持续优化;实现以数据驱动业务的商业模式。无论个人还是企业,诗和远方都还没有真正来临,大多数集中在概念阶……
结实 2016-04-24
每位数据科学家都应该要知道的12个统计和机器学习方法
每位数据科学家都应该要知道的12个统计和机器学习方法 以下的内容是我个人列出的一个清单,写的是在2016年中,每位数据科学家都应当知道的12个统计和机器学习方法。 1.统计假设性检验(t检验、卡方检验和方差分析) 2.多元回归分析(线性模型……
firedata 2016-04-25
信息图:用Python做数据科学
信息图:用Python做数据科学 我想通过学习Python语言来学习数据科学,所以我在谷歌上搜索:“我想通过学习Python语言来学习数据科学。”而在谷歌,不一会儿的功夫就列出所有关于Python语言学习的链接。然后,你会对于无数可行的关于……
陆勤 2016-04-25
R语言做数据挖掘教程
引言 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科……
薛丽丹 2016-04-26
成为数据科学家的新规则
成为数据科学家的新规则 >概括:你需要在数据科学的入门阶段做些什么事呢? 这篇文章是写给每一位想成为数据科学家的人,而且包括了刚刚开始本科学习的年轻人,或者是那些已经在某个行业干了两三年的人要谋求新的职位。 这篇文章并不是写给那些想要追求……
firedata 2016-05-02
目前数据科学和机器学习中使用的最多的20个包
目前数据科学和机器学习中使用的最多的20个包 CRAN包库有6778个常用的包。哪些是你知道的?下面对此进行以下的分析,同时在文章底部另请参见原始数据链接。 这些R包都是Kagglers里的技术大牛最青睐的,而且被很多写过相关文章的笔者所……
陆勤 2016-05-12
数据科学
数据科学 数据科学旨在挖掘数据以推动个人对本学科的兴趣,使他们可以通过利用统计学、机器学习和数据分析来观察一些可获得的数据集的一些属性和本质。 在数据科学中,我们通过把各路数据工程师和数据科学家召集在一起,并让他们帮助我们的顾客从它们的数……
陆勤 2016-05-13
如何正确选择机器学习算法??
如何正确选择机器学习算法?? > 我们都是数据人,数据是有价值的。 机器学习算法很多,没有所谓可以"通吃一切”或者“解决所有问题”的机器学习算法。如何选择正确的机器学习算法呢??这个问题值得我们思考和实践!! 我是一个机器学习推崇者,当有人……
陆勤 2016-05-20
R可视化3——图形展示参数设置
R可视化3——图形展示参数设置 在R的绘制图形函数中存在大量可被调优的参数,参数的不同都会给我们图形可视化带来不一样的效果。然而,许多标准帮助文件和其他方式对于初学者开始时难以把握。在本文中,我们将看到如何控制轴的每个方面,包括轴标签、标度……
薛丽丹 2016-06-01
R数据处理——tidyr包
R数据处理——tidyr包 在进行数据处理时,tidyr包这往往与dplyr包一起使用。我们将演示的tidyr包下面四个功能: gather—宽数据转为长数据。类似于reshape2包中的melt函数 spread—长数据转为宽数据。类似……
薛丽丹 2016-06-03
Python做机器学习:搭建环境
作者:陆勤 利用Python做机器学习,首先要搭建工作环境。 Python语言是什么?机器学习是什么?为什么选择Python做机器学习? 1 python语言是什么? Python语言是一门好用、广用的计算机编程语言和开发环境。关于Pyt……
陆勤 2016-06-21
Python做机器学习——基本语法
严禁修改,可以转载,请务必注明作者和数据人网以及原文链接。 Python做机器学习——基本语法。 >数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习。 平台的理念:人人投稿,知识共享;人人……
陆勤 2016-06-22
Python做机器学习——装载数据集
严禁修改,可以转载,请注明作者和数据人网以及原文链接。 Python做机器学习——装载数据集 >数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习。 平台的理念:人人投稿,知识共享;人人分析,……
陆勤 2016-06-24