第三章:Classification
> 坚持读好书,坚持理论与实践紧密结合。 我在阅读《Hands-on Machine Learning With Scikit-learn, Keras and Tensorflow 2nd Edition[EPUB]》英文电子书籍,欢迎大……
陆勤 2019-05-23
第二章: End-to-End Machine Learning Project
> 坚持读好书,坚持理论与实践紧密结合。 我在阅读《Hands-on Machine Learning With Scikit-learn, Keras and Tensorflow 2nd Edition[EPUB]》英文电子书籍,欢迎大……
陆勤 2019-05-19
机器学习项目模板(R语言)
介绍一个机器学习项目模板,您可以用R语言来实现端到端的机器学习项目。 机器学习项目模板 # 1. Prepare Problem 问题准备 # a) Load libraries 加载所需R包 # b) Load dataset 加载所需数……
陆勤 2019-05-18
第一章:The Machine Learning Landscape
> 坚持读好书,坚持理论与实践紧密结合。 我在阅读《Hands-on Machine Learning With Scikit-learn, Keras and Tensorflow 2nd Edition[EPUB]》英文电子书籍,欢迎大……
陆勤 2019-05-15
购物篮分析实用介绍—关联规则
介绍 曾经想过为什么商品在零售/在线商店以一种特殊的方式展示。为什么根据您添加到购物车的内容向您推荐某些项目?这要归咎于市场购物篮分析或关联规则挖掘。 资源 下面是与这篇文章有关的所有资源的链接: [幻灯片](https://slide……
陆勤 2019-05-07
使用正则化线性模型和XGboost对价格建模
我们想要建模房子的价格,我们知道价格取决于房子的位置,房子的面积,建成年限,翻新的年限,卧室的数量,车库的数量等等。因此,这些因素促成了这种模式——优质地段通常会导致更高的价格。然而,在同一区域内,面积相同的所有房子的价格并不完全相同。价格……
陆勤 2019-05-05
EDA:最简单的自然语言处理数据增广方法
数据增广常用于计算机视觉。在视觉领域,你几乎肯定可以翻折、旋转或镜像一幅图片,而不用担心它的标记发生变化。然后,在自然语言处理(NLP)领域,情况完全不同。改变一个词有可能改变整个句子的意思。所以,没有简单的方法能做到数据增广。真的是这样……
数商 2019-05-04
不要只关心怎么优化模型,这不是机器学习的全部
可解释的机器学习方向的研究员、《可解释的机器学习》书作者 Christoph Molnar 近日就发表了一篇博客,提醒领域内的各位警醒这种风气,开始注意机器学习的应用中那些不应该被忽视的问题。雷锋网AI 科技评论编译如下。 先讲一个小故事。……
数据跨界 2019-04-26
“请解释”黑盒机器学习模型的解释性
2019年2月,波兰政府对银行法进行了修订,赋予客户在做出信贷拒绝时获得解释的权利。这是在欧盟实施GDPR的直接后果之一。这意味着,如果决策过程是自动的,银行需要能够解释为什么不发放贷款。 2018年10月,《世界新闻头条》报道了[亚马逊的……
陆勤 2019-04-25
xgboost算法理解
在做数据和模型的工作中,会使用到xgboost算法。它赢得广大数据工作者的喜爱。 本文介绍xgboost算法的基本思想。 xgboost算法的基本思想:实际上它是boosting的基本思想的变体,boosting的基本思想可以看作为在当前模……
陆勤 2019-04-20
如何构建用于检测信用卡诈骗的机器学习模型?
机器学习是我们日常接触到的许多产品的长期发展动力,从类似于Apple的Siri和Google的智能助手,到类似于亚马逊的建议你买新产品的推荐引擎,再到Google和Facebook使用的广告排名系统。最近,机器学习又由于“深度学习”的发展开……
数据跨界 2019-04-19
机器学习特征工程的基本技术
介绍 什么是特征,为什么我们需要特征工程?基本上,所有的机器学习算法都使用一些输入数据来创建输出结果。这个输入数据包含一些特征,这些特征通常以结构化列的形式呈现。算法需要具有特定特性的特征才能正常工作。因此,出现了对特征工程的需求。我认为特……
陆勤 2019-04-02
如何训练你的基因组
人工智能,机器学习,深度学习:这些名词听起来是不是很像科幻小说里面的图像?或许是,但它们在当今基因组应用中可以称得上是非常强大的工具,可以理解基因序列的变异以及多大的变异能够导致人类群体发病、发展乃至进化。 高通量测序(HTS)、组学以及全……
jamieDee 2019-04-01
特征工程设计思路
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。 下图便是进行特征工程的所有顺序和……
数据跨界 2019-03-31
机器学习在信用评分卡中的应用
互联网金融,特别是P2P信贷在过去几年可以说经历了大起大落的过山车。在经历了2016、2017年的高速发展后,随着整体经济环境遇冷、政策层面监管趋严,行业已进入洗牌周期。特别是随着18年7月P2P暴雷潮的出现,更是为行业前途蒙上一层迷雾。 ……
数据跨界 2019-03-21