搜索到 358 条结果

您可能要找:

如何七周成为数据分析师
作者:秦路 >编者导读:标题虽有点‘夸张’,但作者分享的七周学习路程,以及每周学习的重点,很有借鉴意义和参考价值,关键是读者可以根据自己的情况找到学习的方向和重点。接下来,就是“师傅领进门,修行靠自己”。 得承认我有标题党之嫌,更准确说,……
陆勤 2016-11-26
公开数据集
作者:扫地僧 从数据中学习,首先需要有数据。 我们在学习机器学习或者数据挖掘方法的时候,想应用各种算法,我们首先的需要有数据,因为有了数据,我们才好做数据准备、数据预处理、数据分析和数据建模等工作。 本文分享一些公开数据集,我们可以在这些……
陆勤 2016-12-08
数据探索性分析
作者:扫地僧 从数据中学习,对于数据集,如何学习? 现在决定未来,已有预测未知。 对数据集做探索性分析,认识数据现在和已有的信息和知识,为揭露未知,预测未来打基础。 第一步:准备数据集 采用《[公开数据集](http://shujuren……
陆勤 2016-12-11
R语言数据分析挖掘核心技术进修班
一、培训对象 各企业从事数据挖掘与分析的技术及管理人员,各高校相关专业负责人和骨干老师、高年级本科生及研究生。 二、培训目标 (1)让学员尽快掌握R语言的基本用法,掌握如何利用R丰富的网上资料和帮助系统,学会基本的编程方法。 (2)结合……
孙驰 2016-12-14
机器学习的最佳入门学习资源
这是一篇很难写的文章,因为我希望这篇文章能对学习者有所启发。我在空白页前坐下,并且问自己了一个很难的问题:什么样的库、课程、论文和书籍对于机器学习的初学者来说是最好的。 文章里到底写什么、不写什么,这个问题真的让我很烦恼。我必须把自己当做……
陆勤 2016-12-14
数据分析案例--以上海二手房为例
如果你手上有一批数据,你可能应用统计学、挖掘算法、可视化方法等技术玩转你的数据,但你没有数据的时候,我该怎么玩呢?接下来就带着大家玩玩没有数据情况下的数据分析。 本文从如下几个目录详细讲解数据分析的流程: 1、数据源的获取; 2、数据探索与……
lsxxx2011 2016-12-28
数据应用:大数据在金融行业的应用
作者:傅志华先生 数据显示,中国大数据IT应用投资规模以五大行业最高,其中以互联网行业占比最高,占大数据IT应用投资规模的28.9%,其次是电信领域(19.9%),第三为金融领域(17.5%),政府和医疗分别为第四和第五。 根据国际知名咨……
数据跨界 2017-01-01
数据应用:医疗和生命科学用例
用例1:电子病历数据 应用方向 围绕医疗数据的大型项目不断出现。这些项目包括: 开发学习型医疗系统,用以支持循证临床决策,要求基于实时的、准确的、最新的、以病人为中心的临床信息进行分析处理; 利用电子临床观察数据,高效、快速地把科学发现转换……
数据跨界 2017-01-02
数据应用:运营商大数据应用的思考
作者:中国移动研究院大数据与IT技术研究所的段翔 首先大数据我们知道这个时代正在来临,这里有一个调查,随着全球移动互联网和工业和生活数字化的进程,数据现在成为一个比较加速爆炸式增长。我们看这个调查报告,这个数据已经非常夸张,我们看这个数据……
数据跨界 2017-01-03
大数据应用渐入佳境 2017年将深入更多行业
作者:丁常彦 自从2008年大数据概念诞生伊始,关于大数据的理论研究和应用实践一直在持续推进。在中国,大数据产业历经几年积累也呈现出蓬勃发展的景象。尤其在一系列政策和规划的指引下,大数据的应用已经渐入佳境。 日前,《“十三五”国家战略性新兴……
数据跨界 2017-01-07
2017年数据领域的八大发展趋势
在2017年数据社区将会有大量的机会出现,并伴随一些危机性的挑战,下面是对上述问题的纵观。 1.更多的数据科学家将开始使用深度学习 纵观2016年深度学习领域所取得的主要成就,与那些让深度学习变得更加简单的工具发布,以及直接让现有大数据平……
数据跨界 2017-01-09
10个2017的预测:数据科学、机器学习和物联网
>随着物联网的崛起,依赖于人工智能、深度学习和自动数据科学的机器或设备间通信的算法 ,更多的过程将实现自动化(如驾驶、医疗诊断和治疗)。我最近也在编写文章来描述机器学习、物联网、人工智能、深度学习和数据科学之间的差异。 近日, Vince……
数据跨界 2017-01-12
大数据2016年大事记
2016年刚刚过去,2017年已经来临。值此辞旧迎新之际,让我们盘点一下2016年大数据分析领域发生的大事件,摸清过去一年的脉搏,展望未来一年的趋势。 至少可以说,2016年是大数据风起云涌的一年。没人知道2017年将发生什么,但这不会阻止……
数据跨界 2017-01-13
浅谈C5.0与CART算法的比较--理论理解
一、决策树的发展 决策树是目前比较流行的一种分类算法,实质上是一种自上而下的归纳学习算法。该算法最早由Quinlan在1986年提出,当时称为ID3算法,该算法是基于信息增益进行节点变量的选择,但该选择方法会倾向于属性值比较多的那些变量(如……
lsxxx2011 2017-01-19
干货--C5.0与CART算法实战
在上一期的[干货--C5.0与CART算法实战](http://mp.weixin.qq.com/s?__biz=MzIxNjA2ODUzNg==&mid=2651435355&idx=1&sn=8020e9e69e740c054e52c2……
lsxxx2011 2017-01-19