分类:Python

numpy的ndarray与pandas的series和dataframe之间互转

numpy的ndarray与pandas的series和dataframe之间互转
在大数据分析中,比较常用的两个数据分析包就是numpy和pandas,而pandas正是基于numpy构建的含有更高级数据结构和工具的数据分析包,在金融领域应用更是广泛。在实际的工程中,经常遇到的问题就是numpy的ndarray数据结构与pandas的series和datafr...

fireling 2年前 (2015-02-13) 5711℃ 0评论 1喜欢

关于使用sklearn进行数据预处理-归一化标准化正则化

关于使用sklearn进行数据预处理-归一化标准化正则化
一、标准化(Z-Score),或者去除均值和方差缩放 公式为:(X_train-mean)/std 计算时对每个属性/每列分别进行。 将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。 方法1:使用sklea...

fireling 2年前 (2015-02-11) 2813℃ 0评论 4喜欢

Python安装依赖包的几种方法

Python安装依赖包的几种方法
Python之所以强大,很大一个原因在于它有无数的依赖包。只要安装配置好环境,即可方便调用相关库函数,实现你想要的功能。 总结来说,Python安装依赖包有3种常见方法: 第一种,就是直接使用Python内置的Distutils安装,使用它能够进行Python模块的安装和发布。 ...

fireling 2年前 (2015-02-05) 1905℃ 0评论 1喜欢

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱(转)

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱(转)
曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python...

fireling 2年前 (2015-02-05) 2848℃ 0评论 9喜欢

Python基础-引用、浅复制、深复制的对比

Python基础-引用、浅复制、深复制的对比
在Python中,字符串、列表、字典是能够很容易进行相互转换的,这无疑增加了Python数据结构的灵活性。但是作为几大数据结构中的成员,它们又存在一些非常值得我们注意的差别,很典型的情况就是进行引用与复制时,注意不同对象结构下带来结果的不同。 在C/C++中,复制分为深复制和浅复...

fireling 2年前 (2015-01-28) 1602℃ 0评论 5喜欢

Python中字符串编码的问题

Python中字符串编码的问题
字符串在Python内部的表示是unicode编码,在编码转换时通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。 比如从文件读入utf-8编码格式的字符串s, s.decode(...

fireling 2年前 (2015-01-28) 1555℃ 0评论 2喜欢