机器学习在信用评分卡中的应用
互联网金融,特别是P2P信贷在过去几年可以说经历了大起大落的过山车。在经历了2016、2017年的高速发展后,随着整体经济环境遇冷、政策层面监管趋严,行业已进入洗牌周期。特别是随着18年7月P2P暴雷潮的出现,更是为行业前途蒙上一层迷雾。 ……
数据跨界 2019-03-21
传统机器学习技术概述
虽然新闻天天提到机器学习、深度学习和人工智能,但这些领域已经存在了几十年。然而,如果你越过自动驾驶汽车和数字助理,你会发现,今天应用的大多数都是传统的。 在本文,传统意味着我们多年来一直在做的事情和是更先进的机器学习的基础。下面,我们将介……
陆勤 2019-01-28
进行机器学习和数据科学常犯的错误
> 我们研究了数据科学过程中的典型错误,包括错误的数据可视化、错误的缺失值处理、错误的分类变量转换等等。让我们学会如何避免。 这是这个系列的第2部分,请在这里找到第1部分—[如何从头构建数据科学项目](http://shujuren.org……
陆勤 2018-12-29
如何从头开始构建数据科学项目
> 使用柏林租赁价格分析的实例,包括如何从网络中抽取数据并进行清洗,获得更深入的见解,以及使用外部API设计特征等等。 有许多关于数据科学和机器学习的在线课程将指导您完成理论,并为您提供一些代码示例和对非常干净数据的分析。 然而,为了开始实……
陆勤 2018-12-29
目标函数的经典优化算法介绍
> 本文使用通俗的语言和形象的图示,介绍了随机梯度下降算法和它的三种经典变体,并提供了完整的实现代码。 目标函数是衡量预测值和实际值的相似程度的指标。通常,我们希望得到使代价尽可能小的参数集,而这意味着你的算法性能不错。函数的最小可能代价被……
数据跨界 2018-12-28
机器学习项目清单
> 为了进一步完善我们的内部模型,本文将概述AurélienGéron的机器学习项目清单,参见他的畅销书“动手学习Scikit-Learn&TensorFlow”。 我发现编写和比较特定过程的各种解释的活动,以实现自己对所述过程的解释是有价……
陆勤 2018-12-27
掌握机器学习中数据准备的六个步骤
> 为了分析和机器学习计划准备数据,团队可以加速机器学习和数据科学项目,以提供身临其境的客户体验,通过下面六个关键步骤来加速和自动化数据到洞察管道。 当今组织继续寻找快速,准确地准备数据的方法,以解决他们的数据挑战并实现机器学习(ML)。……
陆勤 2018-12-27
支持向量机是什么?我为什么要使用它?
>支持向量机已经成为一种非常流行的算法。在本文中,我试图对其工作原理给出一个简单的解释,并给出几个使用Python scikit库的示例。 支持向量机是什么? 支持向量机是一种有监督的机器学习算法,可以用于分类或回归问题。它使用一种称为核技……
陆勤 2018-12-12
逻辑回归——详细概述
逻辑回归在20世纪早期被用于生物科学。它后来被用于许多社会科学应用。因变量(目标)为分类变量时采用Logistic回归。 例如, 预测电子邮件是垃圾邮件(1)还是(0) 肿瘤是否恶性(1)(0) 考虑一个场景,我们需要对电子邮件是否为……
陆勤 2018-12-11
机器学习的不同类型
有监督的和无监督的主要是由许多机器学习工程师和数据极客使用。 强化学习对于解决问题非常强大且复杂。 有监督学习 从[上期文章](http://shujuren.org/article/787.html "上期文章")我们知道,机器学习以数……
陆勤 2018-12-10
机器学习介绍
在我们理解机器学习之前,让我们先来谈谈为什么需要机器学习,以及我们为什么要关心它? 如果我让你写一个两个数字相加的程序,你可能会写它,但是如果我让你用同一个程序做乘法呢? 它还可以工作吗? 绝对不能够了。那个程序只做加法。 另一个例子是如……
陆勤 2018-12-07
GraphLab机器学习框架
> GraphLab是用c++编写的一种新的机器学习并行框架。它是一个开源项目,设计时考虑了真实世界数据的规模、多样性和复杂性。 1 GraphLab安装 首先,进入GraphLab官网。 https://turi.com/ 申请一个学术用……
陆勤 2018-11-22
Keras深度学习介绍
> 在本文中,我们将使用[Keras](https://keras.io/ "Keras")构建一个简单的神经网络。我们假设您对机器学习包(如[scikit-learn](http://scikit-learn.org/stable/ "s……
陆勤 2018-10-31
从头开始编写任何机器学习算法的6个步骤:感知器案例研究
> 从头开始编写机器学习算法是一种非常有益的学习体验。 我们在此过程中强调了6个步骤。 有些算法比其他算法更复杂,所以从一些简单的算法开始,从一些非常简单的算法开始,比如单层感知器。 我将以感知器为例,带您经历以下6步过程,从头开始编写算……
陆勤 2018-10-25
随机森林算法
你好,你在本文中,可以看到这些内容: 随机森林是什么? 随机森林如何工作? 随机森林的优势 随机森林的应用 随机森林是什么? 随机森林是一种非参数的集成学习方法,森林里面的每一棵决策树是通过重采样训练数据集而生成的。与单一树对比,随机……
陆勤 2018-10-20