搜索到 206 条结果

您可能要找:

开始使用Python和Jupyter Notebook进行数据分析
让我们讨论一下用Python做数据分析。在本教程中,您将在使用Python和pandas探索数据集时学习一些简单的数据分析过程。 在我们开始之前,请确保您已经为这个实践设置了环境。请安装[Python 3.6](https://www.py……
陆勤 2019-02-01
使用R的caret对银行定期存款订阅进行分类
> 本文使用来自葡萄牙一家银行机构的直接营销活动数据来预测客户是否会订阅定期存款。我们将与R的caret包一起工作来实现这一点。 在本文中,我们将使用来自葡萄牙银行机构的直接[营销活动数据](https://archive.ics.uci……
陆勤 2019-02-19
适合初学者的Python数据科学
为什么是Python? Python是一种流行的高级面向对象编程语言,被大量的软件开发人员广泛使用。Guido van Rossum在1991年设计了Python,Python软件基金会开发了Python。但问题是,基于OOP概念的编程语言……
陆勤 2019-02-25
基于Hadoop的商业银行大数据平台研究与实现
以移动互联网、云计算、大数据和人工智能为代表的新一轮科技创新,正在快速改变传统的生产与管理方式,对商业银行的经营模式甚至中介功能形成全面冲击,商业银行能否用好大数据,加快创新实现转型,决定了其未来的可持续发展能力。传统以关系型数据仓库为基础……
数据跨界 2019-02-26
零基础学习大数据的路线和方向
大数据本质是:数据挖掘深度和应用广度的结合。对海量数据进行有效的分析和处理,而不单单是数据量大就叫大数据。 随着人们对大数据的认识越来越深入,很多零基础人员看到了大数据的未来,也想学习这个前沿技术,踏入时代的领军行业。但是一直没有一个很好的……
数据跨界 2019-03-04
Scala系列之控制流语句
Scala中的输入与输出 在Scala中经常会涉及到变量值的输入和输出,输入是指通过键盘将数据信息传送到Scala环境的内存中,输出则是指将内存中的数据返回到指定的地方(如电脑屏幕、本地文件或数据库等)。 两种输入方法 通过等号赋值的方法……
lsxxx2011 2019-03-10
10本机器学习和数据科学免费必读书籍
1 [《Python Data Science Handbook》](https://github.com/jakevdp/PythonDataScienceHandbook "《Python Data Science Handbook》……
陆勤 2019-03-11
Scala系列之自定义函数
前言 函数,其最大的好处在于避免了代码的重复编写,可以使编程过程更加地高效。尽管在《[大数据之脚踏实地学12--Scala数据类型与运算符](https://mp.weixin.qq.com/s?__biz=MzIxNjA2ODUzNg==……
lsxxx2011 2019-03-17
你要了解的九个大数据技术
Hadoop是大数据领域最流行的技术,但也并不是唯一。还有很多其他技术可用于解决大数据问题。除了Apache Hadoop外,另外9个大数据技术也是要了解的。 1.Apache Flink 是一个高效、分布式、基于Java实现的通用大数据分……
数商 2019-03-18
如何整合多种ggplot的图像用于出版
数据科学的生命周永远不会在缺乏交流分析或研究的结果下完成。实际上,数据可视化是R作为一种数据科学语言,相比于最受欢迎的Python获得优势的其中一个领域。对于R程序员来说,ggplot2事实上是一种特定领域可视化的语言。现在竞争变成了个体如……
jamieDee 2019-03-18
机器学习在信用评分卡中的应用
互联网金融,特别是P2P信贷在过去几年可以说经历了大起大落的过山车。在经历了2016、2017年的高速发展后,随着整体经济环境遇冷、政策层面监管趋严,行业已进入洗牌周期。特别是随着18年7月P2P暴雷潮的出现,更是为行业前途蒙上一层迷雾。 ……
数据跨界 2019-03-21
优质的在线机器学习课程
> 问题:有哪些优质的在线机器学习课程值得花时间学习? 优质的原则: 深受众人喜欢与好评 有配套代码研究 不需要花钱就能参与学习,只要坚持投入时间,就能够有收获 理论与实践并重 1 机器学习-Andrew Ng > 本课程涵盖的主题包括……
陆勤 2019-03-22
Python语言做数据分析教程
引言 那是几年前的事了。在SAS工作了5年多之后,我决定离开我的舒适区。作为一名数据科学家,我正在寻找其他有用的工具!幸运的是,我很快就决定了——Python是我的开胃菜。 我一直有编写代码的倾向。这是做我真正热爱的事情的时候。代码。事实证……
陆勤 2019-03-26
R和Python做数据可视化
R和Python使我们拥有生成复杂而有吸引力的统计图形的能力,以便获得洞察力和探索我们的数据。两者都具备良好的处理数百万数据点的能力(根据平台的不同可能有数十亿)。 用Python可视化数据 Seaborn构建在Matplotlib之上,……
陆勤 2019-03-28
机器学习特征工程的基本技术
介绍 什么是特征,为什么我们需要特征工程?基本上,所有的机器学习算法都使用一些输入数据来创建输出结果。这个输入数据包含一些特征,这些特征通常以结构化列的形式呈现。算法需要具有特定特性的特征才能正常工作。因此,出现了对特征工程的需求。我认为特……
陆勤 2019-04-02