在大数据分析中,比较常用的两个数据分析包就是numpy和pandas,而pandas正是基于numpy构建的含有更高级数据结构和工具的数据分析包,在金融领域应用更是广泛。在实际的工程中,经常遇到的问题就是numpy的ndarray数据结构与pandas的series和datafr...
fireling
10年前 (2015-02-13) 41970℃ 0评论
63喜欢
一、标准化(Z-Score),或者去除均值和方差缩放
公式为:(X_train-mean)/std 计算时对每个属性/每列分别进行。
将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。
方法1:使用sklea...
fireling
10年前 (2015-02-11) 11370℃ 0评论
5喜欢
我们经常有这样的上网经历,就是如果你采用用户名密码登陆一个网站之后,如果在一段不长的时间内,再次访问这个本来需要你登陆的网站,你会很轻易地访问,而不需要再次输入用户名密码。这种“免登陆”的体验无疑给用户带来了非常好的体验,那为什么会“免登陆”呢?是什么在起作用呢?
答案就是Coo...
fireling
10年前 (2015-02-10) 19362℃ 0评论
25喜欢
Python之所以强大,很大一个原因在于它有无数的依赖包。只要安装配置好环境,即可方便调用相关库函数,实现你想要的功能。
总结来说,Python安装依赖包有3种常见方法:
第一种,就是直接使用Python内置的Distutils安装,使用它能够进行Python模块的安装和发布。
...
fireling
10年前 (2015-02-05) 13321℃ 0评论
17喜欢
曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python...
fireling
10年前 (2015-02-05) 9915℃ 0评论
13喜欢
计算机如何执行进程呢?这是计算机运行的核心问题。即使已经编写好程序,但程序是死的。只有活的进程才能产出。现在我们看一下从程序是如何执行进程的。
下面是一个简单的C程序,假设该程序已经编译好,生成可执行文件vamei.exe。
(选取哪一个语言或者具体的语法并不是关键,大部分语言...
fireling
10年前 (2015-02-04) 5953℃ 0评论
2喜欢