搜索到 880 条结果

您可能要找:

统计学思考导论读书心得
统计学思考导论读书心得 前段时间看完这本书以后,我学到了一些最基本的统计学理论、公式,以及相关的概率模型和分布。这本书结合R语言讲述了基本的统计学,下面,我想要分几篇文章来分享一下我最近所学的内容。 那么,我们先看一下abalone这个文件……
firedata 2016-01-06
过好眼前的苟且,才配得上拥有诗和远方
文/结实 对于数据人来说,我们的诗和远方是什么?是在大数据时代背景下尽情滴施展拳脚。对于企业来说,诗和远方是深度挖掘数据价值,支持业务的持续优化;实现以数据驱动业务的商业模式。无论个人还是企业,诗和远方都还没有真正来临,大多数集中在概念阶……
结实 2016-04-24
神经网络何去何从
毫无疑问,神经网络在经历了上个世纪90年代的发展低谷期之后,现在已经迎来了蓬勃发展期。各种高大上的领域(人工智能、图像识别、模式识别、PHM、文本理解、语音识别......)均早已被深度神经网络所覆盖。就连2016年上半年人工智能的代表作A……
falsemail 2016-04-24
当看裸体的时候,卷积神经网络会看到什么
当看裸体的时候,卷积神经网络会看到什么 作者 RYAN COMPTON 时间 2016.04.19 发表于ENGINEERING 我们上周在Clarifai正式宣布不安全的工作(NSFW)成人内容识别模型。本周,我们的一个数据科学家将指……
zengqingfu1442 2016-04-24
机器学习的分类算法及实例
机器学习算法的分类: 什么是机器学习? 机器学习就是基于过去的观察进行相关预测的技术。一些被标记的数据集运用于机器学习算法的输入,而且它的结果会根据分类的规则进行输出,并给出了预测分类。 分类问题实例 文本分类(例如,垃圾邮件处理) 机器……
firedata 2016-04-24
机器学习算法中的过拟合与欠拟合
机器学习算法中的过拟合与欠拟合 机器学习的表现很差的原因要么是数据发生了过拟合或者欠拟合。 在本文中你将了解到机器学习中的泛化以及伴随着的过拟合和欠拟合问题。 让我们开始吧。 机器学习中的逼近目标函数过程 监督式机器学习通常理解为逼近一个……
江南消夏 2016-04-24
怎样入手学习R的算法
怎样入手学习R的算法 >R是目前学习R语言中应用最广泛的平台。当你认真起来学习R的时候你会找到学习R的窍门。 它之所以功能强大是因为很多机器学习的算法都是现有的。然而其中一个问题是这些算法都是由第三方提供的,这似乎让这些算法的使用看起来没……
陆勤 2016-04-25
每位数据科学家都应该要知道的12个统计和机器学习方法
每位数据科学家都应该要知道的12个统计和机器学习方法 以下的内容是我个人列出的一个清单,写的是在2016年中,每位数据科学家都应当知道的12个统计和机器学习方法。 1.统计假设性检验(t检验、卡方检验和方差分析) 2.多元回归分析(线性模型……
firedata 2016-04-25
统计学思考导论读书笔记-置信区间(一)
8.置信区间 什么是置信区间?来自百度的解释是: 置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数……
firedata 2016-03-01
信息图:用Python做数据科学
信息图:用Python做数据科学 我想通过学习Python语言来学习数据科学,所以我在谷歌上搜索:“我想通过学习Python语言来学习数据科学。”而在谷歌,不一会儿的功夫就列出所有关于Python语言学习的链接。然后,你会对于无数可行的关于……
陆勤 2016-04-25
统计学思考导论读书笔记-置信区间(二)
2.置信区间的普通测量 之前的置信区间测量都是基于足够多的试验次数下进行的,因此其结果能稳定在某一个理论的值。但是,如果我们只能通过有限次而且试验次数很少的情况下是否也能应证前面所说的理论呢? 现在,我们就针对这个问题进行探讨。通常情况下,……
firedata 2016-03-02
统计学思考导论读书笔记-参数估计
7.参数估计 这一部分就是对原始数据进行参数的预测。 1.期望的估计值 当我们遇到和概率以及相关理论模型问题的时候,我们自然就会想到通过数据取样求出其平均值得估计值。下面,我们用cars数据文件作为例子,来探讨一下 期望的估计问题: 这是……
firedata 2016-02-26
大数据可精细化推进“供给侧”改革
大数据可精细化推进“供给侧”改革 需要产业发展推荐引擎系统和中国产业信息平台   需求和供给的相对平衡是国民经济的平稳的决定性因素。要达到这个平衡,国家提出要供给侧改革。看过很多供给侧改革的文章,大部分比较宏观,而笔者认为精细化推进"供给……
陆勤 2016-04-26
优秀的数据科学家需要掌握哪些技能?
如果要创建一个关于如何成为数据科学家的博客,我想首先我们应该给出个定义“什么才是数据科学家”。 我所读过的最好的定义之一是由Hilary Mason给出的,其中写到:数据科学家是清洗、探索、解释数据并最终建立一个较优的模型,并且掌握了计算……
薛丽丹 2016-04-26
多元统计分析之主成分分析及R实现
一、 什么是主成分分析 主成分分析(Principal Component Analysis,PCA), 是将多指标化成少数几个综合指标的一种综合统计方法。主成分分析方法通过降维技术把多个变量化为少数几个主成分的方法,并且这些主成分保留原始……
薛丽丹 2016-04-26