最新发布 第8页

宁哥的小站专注数据挖掘、机器学习方向。

数据挖掘与机器学习

李航博士:浅谈我对机器学习的理解

李航博士:浅谈我对机器学习的理解
转李航博士的一篇关于机器学习理解的文章: 算算时间,从开始到现在,做机器学习算法也将近八个月了。虽然还没有达到融会贯通的地步,但至少在熟悉了算法的流程后,我在算法的选择和创造能力上有了不小的提升。实话说,机器学习很难,非常难,要做到完全了解算法的流程、特点、实现方法,并在正确的数...

fireling 1年前 (2015-12-16) 1528℃ 0评论 3喜欢

网络爬虫

网易新闻排行榜抓取回顾

网易新闻排行榜抓取回顾
对网易新闻排行榜的抓取,是我以前学爬虫做的一个小实验。像下图,我的目的就是想把网易新闻排行榜这个页面下的所有新闻的标题和对应的链接都下载下来,分专题保存。 抓取页面很容易,但是有一点,在页面分析的时候,我发现并不是所有专题的页面结构是一样的。用正则表达式分析的话,速度确实慢了点...

fireling 1年前 (2015-11-19) 7838℃ 0评论 30喜欢

数据挖掘与机器学习

文本挖掘系统探究

文本挖掘系统探究
GitHub传送门 文本挖掘系统 Text Mining System 系统说明 集成了文本过滤、去重及邮件实时通知的功能 集成了文本关键词提取的功能 集成了文本分类即打标签的功能 集成了文本推荐即热点评价的功能 支持中英文 关于分词 英文分词,采用nltk工具包进行分...

fireling 1年前 (2015-11-17) 1330℃ 0评论 0喜欢

数据结构与算法

关于数组奇偶调序问题的总结

关于数组奇偶调序问题的总结
数组的奇偶调序问题,主要考察的是对数组下标或者数组指针的灵活操作。“双下标”策略或者“双指针”策略是屡试不爽的一个方案。 奇偶调序无非有两大类情况:奇偶边排,奇偶混排。 所谓“奇偶边排”,就是奇数排在一边,偶数排在一边。比如说我们让奇数都调整到偶数的前面。 我们可以维护两个i...

fireling 1年前 (2015-11-06) 511℃ 0评论 0喜欢

数据结构与算法

两道算法面试题

两道算法面试题
总结两道面试题: 题目1:在n个数中寻找第k大的数 具体思路如下: 使用选择或冒泡法,排出前k个数,然后选择第k个数,时间复杂度为O(kn) 使用快速排序,将n个数排序,然后选择第k个数,时间复杂度为O(nlogn) 使用长度为k的数组存储前面k个数,然后排序,时间复杂度为O...

fireling 1年前 (2015-10-21) 1323℃ 0评论 0喜欢