一文读懂Hadoop、HBase、Hive、Spark分布式系统架构
一文读懂Hadoop、HBase、Hive、Spark分布式系统架构 机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统,hadoop用户分布式存储和map-reduce计算,spark用于分布式机器学习,hive是分布式数据……
陆勤 2016-09-04
Hadoop和Spark框架的异同
Hadoop和Spark框架的异同 谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是停留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。 1 解决问……
陆勤 2016-09-02
Spark Cookbook|Spark书籍
Spark Cookbook Over 60 recipes on Spark, covering Spark Core, Spark SQL, Spark Streaming, MLlib, and GraphX libraries 书……
陆勤 2016-08-03
Field Guide to Hadoop|Hadoop书籍
Field Guide to Hadoop An Introduction to Hadoop, Its Ecosystem, and Aligned Technologies 书籍描述 If your organization is ……
陆勤 2016-08-02
使用Spark MLlib训练和提供自然语言处理模型
严禁修改,可以转载,请务必注明出自[数据人网](http://shujuren.org "数据人网")和原文链接。 Idibon位于旧金山的一家专注于自然语言处理(NLP)的创业公司。从海量非结构化数据中识别关键信息或是定制化实时交互是一些……
陆勤 2016-07-29
小白学Hadoop——认识Hadoop
严禁修改,可以转载,请务必注明作者和[数据人网](http://shujuren.org "数据人网")及原文链接。 许多公司说自己是数据公司或者要成为数据公司,小白“可乐了”,因为小白就是一个玩数据的人。小白在公司里面做着这些与数据相关的……
陆勤 2016-06-18
Spark学习经历
Spark是一个基于内存计算的框架,Spark快速、高效、分布式处理。 大数据时代里面,大规模数据分析和处理,需要机器学习,也就是一种大规模机器学习。Spark非常擅长做这个事情,因此,有必要学习、钻研和应用Spark。 Spark学习和……
陆勤 2016-01-01