机器学习 数据预处理
机器学习 数据预处理(一) >数据分析、机器学习等过程中,对数据进行预处理操作过程是必不可少的。日常工作过程中,几乎八成的时间都是做着数据预处理的工作。 本文从基本的数据处理流程入手,整理对应涉及到的python基本操作代码. 目录 - 读……
苦茶之约 2019-09-11
PEP8 -- python代码的格式指南
缩进 延续行连接各部分可以直接使用Python大括号、中括号以及小括号里面的垂直式隐线,或者使用悬挂缩进。当使用悬挂缩进时需要考虑以下问题:第一行不该有参数,更远的缩进使用时可以清晰的区分它本身是一个延续行。 正确: # Aligned w……
jamieDee 2019-05-14
利用Python语言做逻辑回归算法
逻辑回归算法是一种用于二分类的机器学习算法。线性回归我们用这个式子: 问题是这些预测对于分类来说是不合理的,因为真实的概率必然在0到1之间。为了避免这个问题,我们必须使用一个函数对p(X)建模,该函数为X的所有值提供0到1之间的输出。Lo……
陆勤 2019-05-14
从python中的xgboost中提取决策规则
我想在我的即将推出的模型中使用python中的xgboost。但是,由于我们的生产系统是SAS,我试图从xgboost中提取决策规则,然后编写SAS评分代码以在SAS环境中实现此模型。 我已经通过了多个链接。以下是其中一些: 如何从pyth……
数据跨界 2019-05-06
如何学习Python做数据科学的5个步骤
为什么学习Python做数据科学? 在我们探索学习Python做数据科学之前,我们应该简要地回答一下为什么首先应该学习Python。 简而言之,掌握Python是数据科学职业所需要的宝贵技能之一。 虽然Python并不总是这样,但它是数据……
陆勤 2019-04-21
飞象工场Spider课程回顾
飞象工场Spider课程回顾 [TOC] > 上节课在棕榈学院学习了Python的基础课程,并解除了基本的API调用,和K线图的制作。这节课算是一个进阶课程——爬虫的搭建。如有搞不定的内容,可以查看我的上一篇文稿《棕榈学院Python课程回……
适合初学者的Python数据科学
为什么是Python? Python是一种流行的高级面向对象编程语言,被大量的软件开发人员广泛使用。Guido van Rossum在1991年设计了Python,Python软件基金会开发了Python。但问题是,基于OOP概念的编程语言……
陆勤 2019-02-25
开始使用Python和Jupyter Notebook进行数据分析
让我们讨论一下用Python做数据分析。在本教程中,您将在使用Python和pandas探索数据集时学习一些简单的数据分析过程。 在我们开始之前,请确保您已经为这个实践设置了环境。请安装[Python 3.6](https://www.py……
陆勤 2019-02-01
用Python做监督学习
机器学习的一般目标是建立不需要显式编程就可以从数据中学习的模型。在机器学习的众多子领域中,通常最受关注的是所谓的监督学习。它是最容易理解的,特别是对于这个领域的新手来说,它为机器学习这个广阔的世界提供了一个很好的介绍。监督学习中的“监督”指……
陆勤 2019-01-29
pandas0.24本月将放弃对Python2的支持
Python库的下一个版本panda 0.24.0将不支持Python 2。pandas是一个流行的Python库,广泛用于数据操作和数据分析。它用于数值表和时间序列数据等领域。 周三,pandas维护者Jeff Reback在推特上写到……
陆勤 2019-01-23
如何分析“数据分析师”的岗位?
前言 在《[手把手带你抓取智联招聘的“数据分析师”岗位!](https://mp.weixin.qq.com/s?__biz=MzIxNjA2ODUzNg==&mid=2651436585&idx=1&sn=f38ed46e622b987……
lsxxx2011 2018-11-23
利用Keras长短期记忆(LSTM)模型预测股票价格
> LSTMs在序列预测问题中非常强大,因为它们能够存储过去的信息。这在我们的案例中很重要,因为股票的前一个价格对于预测其未来的价格是至关重要的。 > 编者按:本教程演示了如何开始使用LSTM模型预测时间序列。股票市场数据是一个很好的选择……
陆勤 2018-11-23
麋鹿分布图制作(一)——调用百度API查询地名的坐标
最近在做保护生物学的论文,查论文的过程中发现之前的麋鹿分布图是手绘的,看起来真的是。。。,因此我决定重新画一下这个图。 这个地图的绘制我分为两个部分:(一)调用百度API查找地点的经纬度,(二)用python的basemap模块绘制分布图。……
有道词典单词本导出并转化成EXCEL
今天想复习一下有道词典里面收藏的单词,结果只能导出.bin, .xml, .txt格式,但是我想把它放在excel里更容易操作排序、染色等,所以就提取了xml格式,然后用python转成了xlsx格式。具体代码如下: import xml.……
手把手带你抓取智联招聘的“数据分析师”岗位!
前言 很多网友在后台跟我留言,是否可以分享一些爬虫相关的文章,我便提供了我以前写过的爬虫文章的链接(如下链接所示),大家如果感兴趣的话也可以去看一看哦。在本文中,我将以智联招聘为例,分享一下如何抓取近5000条的数据分析岗信息。 往期爬虫链……
lsxxx2011 2018-11-07