搜索到 880 条结果

您可能要找:

参数和非参数机器学习算法
参数和非参数机器学习算法 什么是参数机器学习算法并且它与非参数机器学习算法有什么不同? 本文中你将了解到参数和非参数机器学习算法的区别。 让我们开始吧。 学习函数 机器学习可以总结为学习一个函数$$(f)$$,其将输入变量$$(X)$$映……
江南消夏 2016-04-29
机器学习:产生聚类的算法
机器学习:产生聚类的算法 聚类是非监督学习中常用的一种方法,它用于发现一组与其它临近的数据里的知识。它常用于顾客的区分和异常值的检测。 它基于每个数据点之间的“距离”(相似逆)这一概念,并且,它还对某个数据点以及与它相邻的点都进行相关预测和……
firedata 2016-04-29
成为数据科学家的新规则
成为数据科学家的新规则 >概括:你需要在数据科学的入门阶段做些什么事呢? 这篇文章是写给每一位想成为数据科学家的人,而且包括了刚刚开始本科学习的年轻人,或者是那些已经在某个行业干了两三年的人要谋求新的职位。 这篇文章并不是写给那些想要追求……
firedata 2016-05-02
【5月2日】作者投稿精选
[1 如何进行机器学习?](http://shujuren.org/article/108.html "1 如何进行机器学习?") 作者分享进行机器学习的一些经验方法和时间手段,具有很强的使用价值。阅读5颗星 [2 成为数据科学家的新规则]……
陆勤 2016-05-02
机器学习之梯度下降法
我们都知道,算法优化是机器学习的一个重要组成部分,也是机器学习算法的核心。在在这篇文章中你会发现一个简单的优化算法,可以适用于使用很多机器学习算法。相信读完这篇文章你会有很深的感悟。 一、梯度下降法 梯度下降法是一个优化算法,是用于寻找具有……
薛丽丹 2016-05-04
R语言读书心得1-进入R
1.数据的导入和基本操作 我相信,各位学习R语言的朋友都应该多少都应该看了《R语言实战》这本书。我个人认为,《R语言实战》确实是一本适合刚刚接触R语言的朋友学习,同时也适合已经入门的人士把这本精读下来。可以说,如果能把这本书精度下来,最少,……
firedata 2016-05-05
金融信用风险建模之 R 实战案例
金融信用风险建模之 R 实战案例 Cynthia Li, CFA 2016-05-05 银行贷款 -- 信用违约 1. 定义 * 银行与借款人之间的协议 --- 贷款+按揭偿还本金和利息 2. 预期损失 Expected loss (EL……
飞翔的独角兽 2016-05-06
一个好用的时间序列分析R包astsa
astsa R包简介 时间序列分析在数据的趋势性分析、模式识别、信号提取和回归预报等方面应用非常广泛(如果你还没有尝试过此方面的分析,那就开始研究下周边的房价走势吧:)),得益于R的开源环境,已有大量的相关R包可供使用,详见CRAN Tas……
阿广Max 2016-05-07
R语言读书心得2-基本数据结构
1.5 数据集的创建 我们使用R语言的其中一个目的就是对已知的数据集进行相关的处理。为了处理这些数据,我们需要把我们已经有的数据导入到R进行分析以得到相应的结果。说到数据的导入,有三种方法:第一种就是直接在键盘上输入相关数据,而R语言的数据……
firedata 2016-05-07
处理缺失值的常规方法总结
title: "处理缺失值的常规方法总结" author: "Cynthia Li, CFA" date: "May 6, 2016" 前言 现实生活中的数据是纷繁杂乱的,收集来的数据有缺失和录入错误司空见惯,所以学习如果处理这些常见问……
飞翔的独角兽 2016-05-09
Netflix的影片推荐系统
Netflix影片推荐系统 我们都是数据人,数据是有价值的。 数据应用是利用数据价值创造价值的过程。 Netflix影片推荐系统是一个典型的数据应用。 Netflix的简介。 >Netflix是一家在线影片租赁提供商。公司能够提供Netf……
陆勤 2016-05-10
机器学习的巨大精彩和影响
机器学习的巨大精彩和影响 机器学习有着巨大的精彩和影响。 为什么这么说,让我们看数据科学家Jeremy Howard在TED的分享。
陆勤 2016-05-10
大数据和机器学习给10大职业带来冲击和威胁
大数据和机器学习给10大职业带来冲击和威胁 >我们都是数据人,数据是有价值的。我们已经进入到大数据时代,让机器自主学习已改善性能,越发重要,也越发普遍。大数据和机器学习带来挑战和危机,只有“顺势而为”,才不致于“落伍与淘汰”! 大数据和机器……
陆勤 2016-05-11
22个对于数据科学家来说容易犯的错误
22个对于数据科学家来说容易犯的错误 对于软件工程师或数据科学家来说,下列错误是很容易犯(随意顺序): 列表如下: 在团队没有尽自己的能力出力。 把自己看成以为天才。 使用一些上司看不懂的专业术语。 当一名完美主义者:完美总是和不好的投……
陆勤 2016-05-12
目前数据科学和机器学习中使用的最多的20个包
目前数据科学和机器学习中使用的最多的20个包 CRAN包库有6778个常用的包。哪些是你知道的?下面对此进行以下的分析,同时在文章底部另请参见原始数据链接。 这些R包都是Kagglers里的技术大牛最青睐的,而且被很多写过相关文章的笔者所……
陆勤 2016-05-12