2015年02月的内容

Python

numpy的ndarray与pandas的series和dataframe之间互转

numpy的ndarray与pandas的series和dataframe之间互转
在大数据分析中,比较常用的两个数据分析包就是numpy和pandas,而pandas正是基于numpy构建的含有更高级数据结构和工具的数据分析包,在金融领域应用更是广泛。在实际的工程中,经常遇到的问题就是numpy的ndarray数据结构与pandas的series和datafr...

fireling 9年前 (2015-02-13) 41029℃ 0评论 63喜欢

数据挖掘与机器学习

使用sklearn进行数据预处理

使用sklearn进行数据预处理
一、标准化(Z-Score),或者去除均值和方差缩放 公式为:(X_train-mean)/std 计算时对每个属性/每列分别进行。 将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。 方法1:使用sklea...

fireling 9年前 (2015-02-11) 10683℃ 0评论 5喜欢

网络爬虫

5. 网络爬虫-使用Cookie登陆

5. 网络爬虫-使用Cookie登陆
我们经常有这样的上网经历,就是如果你采用用户名密码登陆一个网站之后,如果在一段不长的时间内,再次访问这个本来需要你登陆的网站,你会很轻易地访问,而不需要再次输入用户名密码。这种“免登陆”的体验无疑给用户带来了非常好的体验,那为什么会“免登陆”呢?是什么在起作用呢? 答案就是Coo...

fireling 9年前 (2015-02-10) 18123℃ 0评论 25喜欢

Python

Python安装依赖包的几种方法

Python安装依赖包的几种方法
Python之所以强大,很大一个原因在于它有无数的依赖包。只要安装配置好环境,即可方便调用相关库函数,实现你想要的功能。 总结来说,Python安装依赖包有3种常见方法: 第一种,就是直接使用Python内置的Distutils安装,使用它能够进行Python模块的安装和发布。 ...

fireling 9年前 (2015-02-05) 12642℃ 0评论 17喜欢

Python

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱(转)

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱(转)
曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python...

fireling 9年前 (2015-02-05) 9272℃ 0评论 13喜欢

Linux

Linux下程序如何执行进程

Linux下程序如何执行进程
计算机如何执行进程呢?这是计算机运行的核心问题。即使已经编写好程序,但程序是死的。只有活的进程才能产出。现在我们看一下从程序是如何执行进程的。 下面是一个简单的C程序,假设该程序已经编译好,生成可执行文件vamei.exe。 (选取哪一个语言或者具体的语法并不是关键,大部分语言...

fireling 9年前 (2015-02-04) 5414℃ 0评论 2喜欢