最新发布 第8页

宁哥的小站专注数据挖掘、机器学习方向。

数据挖掘与机器学习

李航博士:浅谈我对机器学习的理解

李航博士:浅谈我对机器学习的理解
转李航博士的一篇关于机器学习理解的文章: 算算时间,从开始到现在,做机器学习算法也将近八个月了。虽然还没有达到融会贯通的地步,但至少在熟悉了算法的流程后,我在算法的选择和创造能力上有了不小的提升。实话说,机器学习很难,非常难,要做到完全了解算法的流程、特点、实现方法,并在正确的数...

fireling 1年前 (2015-12-16) 1623℃ 0评论 3喜欢

网络爬虫

网易新闻排行榜抓取回顾

网易新闻排行榜抓取回顾
对网易新闻排行榜的抓取,是我以前学爬虫做的一个小实验。像下图,我的目的就是想把网易新闻排行榜这个页面下的所有新闻的标题和对应的链接都下载下来,分专题保存。 抓取页面很容易,但是有一点,在页面分析的时候,我发现并不是所有专题的页面结构是一样的。用正则表达式分析的话,速度确实慢了点...

fireling 1年前 (2015-11-19) 8391℃ 0评论 32喜欢

数据挖掘与机器学习

文本挖掘系统探究

文本挖掘系统探究
GitHub传送门 文本挖掘系统 Text Mining System 系统说明 集成了文本过滤、去重及邮件实时通知的功能 集成了文本关键词提取的功能 集成了文本分类即打标签的功能 集成了文本推荐即热点评价的功能 支持中英文 关于分词 英文分词,采用nltk工具包进行分...

fireling 1年前 (2015-11-17) 1397℃ 0评论 0喜欢