最新发布 第7页

宁哥的小站专注数据挖掘、机器学习方向。

大数据与分布式

Master/Slave分布式计算模式介绍

Master/Slave分布式计算模式介绍
对于计算密集型任务来说,我们可以采用多进程或多线程方式进行操作,也可以采用多台机器进行并行计算,实现效率的大大提升,总得来说,精髓在于对于大数据的“分而治之”。 在分布式系统中,一个比较常用的计算结构就是Master/Slave模式。简单来说,Master/Slave与进程与线...

fireling 1年前 (2016-01-14) 1513℃ 0评论 1喜欢

大数据与分布式

如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系?(转)

如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系?(转)
大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各的用处,互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤,你可以用小刀或者刨子去皮。但是每个工具有自己的特性,虽...

fireling 1年前 (2016-01-14) 707℃ 0评论 1喜欢

数据挖掘与机器学习

将SVM用于多类分类

将SVM用于多类分类
SVM是一种典型的二类分类器,是采用最大间隔化策略来确定特征空间中最优超平面的,也就是说它只能回答属于正类还是负类的问题。而现实中要解决的往往是多类分类问题,如何将一个二类分类器转换成一个多类分类器呢? 一对多方法 比如有k个类别,每次分类都把1个类别作为正样本,其余k-1个类...

fireling 1年前 (2015-12-17) 912℃ 0评论 3喜欢