搜索到 38 条结果

您可能要找:

Spark学习经历
Spark是一个基于内存计算的框架,Spark快速、高效、分布式处理。 大数据时代里面,大规模数据分析和处理,需要机器学习,也就是一种大规模机器学习。Spark非常擅长做这个事情,因此,有必要学习、钻研和应用Spark。 Spark学习和……
陆勤 2016-01-01
我们都是数据人,您意识到了吗?
我们都是数据人,您意识到了吗? 文/陆勤 我们都是数据人,既是数据的生产者、又是数据的消费者。 数据生产者的场景,比比皆是。 电商平台,购买喜欢的物品,生产了与购买相关的数据;社交圈子,分享各自的见解,生产了与分享相关的数据;搜索引擎,寻……
陆勤 2016-04-17
R语言做数据挖掘教程
引言 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科……
薛丽丹 2016-04-26
成为数据科学家的新规则
成为数据科学家的新规则 >概括:你需要在数据科学的入门阶段做些什么事呢? 这篇文章是写给每一位想成为数据科学家的人,而且包括了刚刚开始本科学习的年轻人,或者是那些已经在某个行业干了两三年的人要谋求新的职位。 这篇文章并不是写给那些想要追求……
firedata 2016-05-02
R语言读书心得3-数据的导入导出
1.6数据的导如何导出 在R语言进行数据分析和数据挖掘的时候,我们首先要做的,就是要寻找相关的数据,然后找到相关的算法和模型对此进行分析和挖掘,并把它转化为最终结果。而这里,我将要介绍几种方法来实现数据的导入和导出。 1.6.1从键盘上输入……
firedata 2016-05-13
小白学Hadoop——认识Hadoop
严禁修改,可以转载,请务必注明作者和[数据人网](http://shujuren.org "数据人网")及原文链接。 许多公司说自己是数据公司或者要成为数据公司,小白“可乐了”,因为小白就是一个玩数据的人。小白在公司里面做着这些与数据相关的……
陆勤 2016-06-18
HOW TO KICKSTART YOUR DATA SCIENCE CAREER
严禁修改,可以转载,请务必注明出自数据人网和原文链接。 This is a guest post from Michael Li of The Data Incubator. The The Data Incubator runs a fr……
陆勤 2016-07-20
用Spark 和DBSCAN对地理定位数据进行聚类
严禁修改,可以转载,请注明出自[数据人网](http://shujuren.org "数据人网")和原文链接。 机器学习,特别是聚类算法,可以用来确定哪些地理区域经常被一个用户访问和签到而哪些区域不是。这样的地理分析使多种服务成为可能,比如……
陆勤 2016-07-24
How to Become A Data Scientist
严禁修改,可以转载,请务必注明出自数据人网和原文链接。 Over the past few years the role of predictive modeler has broadened and received a lot of ……
陆勤 2016-07-27
使用Spark MLlib训练和提供自然语言处理模型
严禁修改,可以转载,请务必注明出自[数据人网](http://shujuren.org "数据人网")和原文链接。 Idibon位于旧金山的一家专注于自然语言处理(NLP)的创业公司。从海量非结构化数据中识别关键信息或是定制化实时交互是一些……
陆勤 2016-07-29
Field Guide to Hadoop|Hadoop书籍
Field Guide to Hadoop An Introduction to Hadoop, Its Ecosystem, and Aligned Technologies 书籍描述 If your organization is ……
陆勤 2016-08-02
Spark Cookbook|Spark书籍
Spark Cookbook Over 60 recipes on Spark, covering Spark Core, Spark SQL, Spark Streaming, MLlib, and GraphX libraries 书……
陆勤 2016-08-03
机器学习路线图
机器学习路线图 1. 引言 也许你和这个叫『机器学习』的家伙一点也不熟,但是你举起iphone手机拍照的时候,早已习惯它帮你框出人脸;也自然而然点开今日头条推给你的新闻;也习惯逛淘宝点了找相似之后货比三家;亦或喜闻乐见微软的年龄识别网站结果……
陆勤 2016-08-17
Hadoop和Spark框架的异同
Hadoop和Spark框架的异同 谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是停留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。 1 解决问……
陆勤 2016-09-02
一文读懂Hadoop、HBase、Hive、Spark分布式系统架构
一文读懂Hadoop、HBase、Hive、Spark分布式系统架构 机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统,hadoop用户分布式存储和map-reduce计算,spark用于分布式机器学习,hive是分布式数据……
陆勤 2016-09-04