搜索到 293 条结果

您可能要找:

如何学习Python语言?循序渐进,实践为本
从Python菜鸟到Python Kaggler的旅程 (译注:Kaggle是一个数据建模和数据分析竞赛平台) 假如你想成为一个数据科学家,或者已经是数据科学家的你想扩展你的技能,那么你已经来对地方了。本文的目的就是给数据分析方面的Pyth……
陆勤 2016-01-01
Python数据结构及切片
一、数据结构 Python中存在三种重要的数据结构,即列表、元组和字典,下面将一一介绍这三种数据结构。 列表: 列表是处理一组有序项目的数据结构,每个项目之间用逗号隔开,列表中的项目应该包括在方括号中。一旦创建了列表,就可以往列表中添加、删……
lsxxx2011 2016-01-19
Spark学习经历
Spark是一个基于内存计算的框架,Spark快速、高效、分布式处理。 大数据时代里面,大规模数据分析和处理,需要机器学习,也就是一种大规模机器学习。Spark非常擅长做这个事情,因此,有必要学习、钻研和应用Spark。 Spark学习和……
陆勤 2016-01-01
Logistic模型的客户流失预警分析
Logistic模型的客户流失预警分析 在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价、身高、GDP、学生成绩等,发现这些被预测的变量都属于连续型变量。然而有些情况下,被预测变量可能是二元变量,即成功或失败、流失或……
lsxxx2011 2016-01-06
R语言可视化基础
之前我曾经翻译过一篇文章,标题为“为什么我们要开始学习数据化及其操作”,它讲到了我们为什么要首先学习,其次再学习相关的操作。在文章里面,作者是这样说的:“这里有几个原因可以解释我为什么会推荐首先学习数据可视化操作,不过,最重要的,我给出的……
firedata 2016-03-20
R语言实战读书心得导论
在分享我读《R语言实战》时的所见所闻之前,我想先和大家简单的聊一聊大数据这个词语,因为R语言是一门开源的统计类语言,它拥有强大的统计分析能力,而如今我们人类已经生活在信息时代,甚至我们又提出了大数据的时代;据统计,未来5年所产生的数据总量……
firedata 2016-03-16
R语言与Tableau集成之可视化应用
Tableau是一款非常棒的数据可视化商业软件,通过拖拉拽的方式迅速的实现数据可视化。而且该软件可以连接任何一种数据库,在处理大型数据时一点都不逊色。下面展示几幅Tableau绘制的图形: 面积图、条形图的综合使用。 该图反映的是201……
lsxxx2011 2016-02-21
R语言之控制流的使用方法
一般在数据处理或建模过程中会使用到R语言中的控制流,控制流主要有以下三类,即 1)if或switch分支语句 2)for循环 3)while循环 下面就说说这几种控制流,并讲解我工作中的用法。 一、if或switch分支语句 首先看一下if……
lsxxx2011 2016-02-26
R强大秘笈—R扩展包
R好用,R开源,R适合做算法设计和验证,这一切都与R扩展包紧密关联着。 目录: R包是什么? R包分类? R扩展包如何管理? R包应用? R包是什么? 答:R包是一个集合体,它包括函数、数据集、文档、预编译代码等内容。 R包分类? 答:R……
陆勤 2016-01-04
R语言编码风格
标注及名称 文件名称 文件名称应当有意义,并且以 .R 作结。 # Good fit-models.R utility-functions.R # Bad foo.r stuff.r 如果是一系列文件,序列号应当在文件之前。 0-down……
Ewen 2016-04-17
用R演示逻辑回归过程-婚姻出轨案例
理论 Logistic回归适用于二值响应变量(0,1)。模 型 假 设Y服从二项分布,线性模型的拟合形式为: 其中,π= μ(Y)是Y的条件均值(即给定一系列X的值时Y =1的概率),(π/1-π)为Y=1时的优势比,log(π/1-π)……
结实 2016-04-27
如何学习R语言?
这里有无数的资源可以帮助你从不同的方面学R,然而对于初学者的你来说可能会觉得这样让你感到吃不消。而且R又是一门动态语言,它时刻都在变化,所以我们需要时常更新我们的工具以及技术到最新的版本。 这就是为什么R-bloggers和DataCamp……
陆勤 2016-01-01
机器学习算法R常用函数总结
预测函数:predict() type="prob"判别该量度的昆虫归类为A、B和C的概率;type="response":判别该量度的昆虫的类别; 预测分类的概率的函数predict(…, type)参数type: R语音里面不同模型……
陆勤 2016-01-18
rattle:数据挖掘的界面化操作
R语言是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。这里的统计计算可以是数据分析、建模或是数据挖掘等,通过无数大牛提供的软件包,可以帮我们轻松实现算法的实施。 一些读者觉得R语言零碎的东西太多了,无法记住那么……
lsxxx2011 2016-02-23
R数据分析案例:逻辑回归
逻辑回归,也称之为逻辑模型,用于预测二分结果变量。在逻辑模型当中,输出结果所占的比率就是预测变量的线性组合。 这篇文章将要使用下面这几个包,而且你们需要保证在运行我所举的例子的时候,你已经把这些包都装好了。如果你还没装好这些包,那么,运行i……
firedata 2016-03-03