最新发布 第9页

宁哥的小站专注数据挖掘、机器学习方向。

大数据与分布式

“Pandas”化你的Spark DataFrames

“Pandas”化你的Spark DataFrames
此文为宁哥翻译文章,原文章请看这里。 关于DataFrame 上一篇博客我讲到了《基于Python的数据科学技术栈的综述》。这一篇让我们关注一个非常重要的概念:DataFrame。 DataFrame非常适合处理结构化数据和半结构化数据,它们基本上是一些行的集合,而每一列都有自...

fireling 8年前 (2016-05-24) 12695℃ 9喜欢

数据挖掘与机器学习

文本挖掘系统

文本挖掘系统
文本挖掘系统 Research of Text Mining System 系统说明 集成了文本过滤、去重及邮件实时通知的功能 集成了文本关键词提取的功能 集成了文本分类即打标签的功能 集成了文本推荐即热点评价的功能 支持中英文 系统架构图 关于分词 英文分词,采用nl...

fireling 8年前 (2016-05-20) 6347℃ 7喜欢