搜索到 1013 条结果

您可能要找:

如何学习Python语言?循序渐进,实践为本
从Python菜鸟到Python Kaggler的旅程 (译注:Kaggle是一个数据建模和数据分析竞赛平台) 假如你想成为一个数据科学家,或者已经是数据科学家的你想扩展你的技能,那么你已经来对地方了。本文的目的就是给数据分析方面的Pyth……
陆勤 2016-01-01
Python数据结构及切片
一、数据结构 Python中存在三种重要的数据结构,即列表、元组和字典,下面将一一介绍这三种数据结构。 列表: 列表是处理一组有序项目的数据结构,每个项目之间用逗号隔开,列表中的项目应该包括在方括号中。一旦创建了列表,就可以往列表中添加、删……
lsxxx2011 2016-01-19
Spark学习经历
Spark是一个基于内存计算的框架,Spark快速、高效、分布式处理。 大数据时代里面,大规模数据分析和处理,需要机器学习,也就是一种大规模机器学习。Spark非常擅长做这个事情,因此,有必要学习、钻研和应用Spark。 Spark学习和……
陆勤 2016-01-01
Logistic模型的客户流失预警分析
Logistic模型的客户流失预警分析 在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价、身高、GDP、学生成绩等,发现这些被预测的变量都属于连续型变量。然而有些情况下,被预测变量可能是二元变量,即成功或失败、流失或……
lsxxx2011 2016-01-06
程序员应当掌握机器学习
程序员应当掌握机器学习 程序员之所以要掌握机器学习这个领域就是因为机器学习是一个很独特的领域,它能让程序员在某个领域做出巨大的贡献。 在这篇文章中,作为一个程序员的你,你会获悉,当你浏览到一些你所需要掌握的技能以及这些技能所体现的你曾不知道……
firedata 2016-02-16
机器学习算法预览
机器学习算法预览 在这篇文章中,我要带大家预览一下机器学习中最热门的算法。预览主要的机器学习算法可在某种程度上给你这样的一种感觉,让你知道什么样的方法是可靠的。 这里有很多算法都是可靠的,这也许会让你感觉吃不消,看到这么多算法的名字的时候,……
firedata 2016-02-25
机器学习正在流行
机器学习正在流行 现在,了解机器学习领域到底在什么方面是如此吸引人的是很重要的。了解为什么现在机器学习很流行可以作为你学习、研究机器学习的目的所在。这里,我们可以强调这些正在发展的领域当中,如何这些开发的问题以及用什么方法,可能这些都成为了……
firedata 2016-03-05
聚类EM算法
1、EM应用场景 最大期望经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域,即EM算法常用于聚类领域。 EM算法有很多的应用,最广泛的就是GMM混合高斯模型、聚类、HMM等等。 EM算法在高斯混合模型GMM(Ga……
陆勤 2016-01-20
聚类算法总结
聚类算法总结 一、层次聚类 1、层次聚类的原理及分类 1)层次法(Hierarchicalmethods)先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类。不停的合并,直到合……
陆勤 2016-01-18
R语言可视化基础
之前我曾经翻译过一篇文章,标题为“为什么我们要开始学习数据化及其操作”,它讲到了我们为什么要首先学习,其次再学习相关的操作。在文章里面,作者是这样说的:“这里有几个原因可以解释我为什么会推荐首先学习数据可视化操作,不过,最重要的,我给出的……
firedata 2016-03-20
R语言实战读书心得导论
在分享我读《R语言实战》时的所见所闻之前,我想先和大家简单的聊一聊大数据这个词语,因为R语言是一门开源的统计类语言,它拥有强大的统计分析能力,而如今我们人类已经生活在信息时代,甚至我们又提出了大数据的时代;据统计,未来5年所产生的数据总量……
firedata 2016-03-16
人工智能的阶段性认识
Statistical learning (统计学习) 或者 machine learning (机器学习) 是 artificial intelligence (AI,人工智能) 前沿的学科,前者基于 statistics 的基础发展而来……
Ewen 2016-04-17
R语言与Tableau集成之可视化应用
Tableau是一款非常棒的数据可视化商业软件,通过拖拉拽的方式迅速的实现数据可视化。而且该软件可以连接任何一种数据库,在处理大型数据时一点都不逊色。下面展示几幅Tableau绘制的图形: 面积图、条形图的综合使用。 该图反映的是201……
lsxxx2011 2016-02-21
R语言之控制流的使用方法
一般在数据处理或建模过程中会使用到R语言中的控制流,控制流主要有以下三类,即 1)if或switch分支语句 2)for循环 3)while循环 下面就说说这几种控制流,并讲解我工作中的用法。 一、if或switch分支语句 首先看一下if……
lsxxx2011 2016-02-26
R强大秘笈—R扩展包
R好用,R开源,R适合做算法设计和验证,这一切都与R扩展包紧密关联着。 目录: R包是什么? R包分类? R扩展包如何管理? R包应用? R包是什么? 答:R包是一个集合体,它包括函数、数据集、文档、预编译代码等内容。 R包分类? 答:R……
陆勤 2016-01-04