MILKPython 机器学习工具包
MILK(MACHINE LEARNING TOOLKIT) 是 Python 语言的机器学习工具包。
它主要是在很多可得到的分类比如 SVMS、K-NN、随机森林以及决策树中使用监督分类法,它还可执行特征选择。这些分类器在许多方面相结合,可以形成不同的例如无监督学习、密切关系传播和由 MILK 支持的 K-means 聚类等分类系统。
MILK 关注速度和内存的使用,因此大多数对性能比较敏感的代码都是用 C++ 编写的。为了方便起见,基于 Python 实现了接口。
示例代码
测试对一些 features,labels
数据的分类情况,通过交叉验证测量:
import numpy as np import milk features = np.random.rand(100,10) # 2d array of features: 100 examples of 10 features each labels = np.zeros(100) features[50:] += .5 labels[50:] = 1 confusion_matrix, names = milk.nfoldcrossvalidation(features, labels) print 'Accuracy:', confusion_matrix.trace()/float(confusion_matrix.sum())
如果想要使用分类器,可以创建一个 learner object 并调用它的 train()
方法:
import numpy as np import milk features = np.random.rand(100,10) labels = np.zeros(100) features[50:] += .5 labels[50:] = 1 learner = milk.defaultclassifier() model = learner.train(features, labels) # Now you can use the model on new examples: example = np.random.rand(10) print model.apply(example) example2 = np.random.rand(10) example2 += .5 print model.apply(example2)
特性
-
支持向量机。使用封装了 pythonesque 的 libsvm solver
-
LASSO 算法
-
K-means 使用的内存小,可有效地对数百万个实例进行集群
-
随机森林
-
自组织地图
-
逐步判别分析特征选择
-
非负矩阵分解(Non-negative Matrix Factorization,NMF)算法
-
AP(Affinity Propagation)聚类算法
评论
Waffles机器学习工具包
Waffles英文原意是蜂蜜甜饼,在这里却指代一个非常强大的机器学习的开源工具包。Waffles里包含的算法特别多,涉及机器学习的方方面面,推荐系统位于 其中的Waffles_recommend to
Waffles机器学习工具包
0
scikit-learnPython 机器学习工具包
scikit-learn 是一个 Python 的机器学习项目。是一个简单高效的数据挖掘和数据分析工
scikit-learnPython 机器学习工具包
0
scikit-learnPython 机器学习工具包
scikit-learn是一个Python的机器学习项目。是一个简单高效的数据挖掘和数据分析工具。基于 NumPy、SciPy 和 matplotlib 构建。Installation依赖scikit
scikit-learnPython 机器学习工具包
0
Sklearn-pandas通用型的机器学习工具包
Sklearn-pandas既可以视为一个通用型的机器学习工具包,也可是视为一些特定算法的实现。它在具体的机器学习任务中主要充当支持者的角色。这里所谓支持者的角色,按照其官网的解释即是说:Sklear
Sklearn-pandas通用型的机器学习工具包
0
auto-sklearn自动化的机器学习工具包
auto-sklearn是一个自动化的机器学习工具包,是scikit-learn估算器的直接替代品:>>> import autosklearn.classification>
auto-sklearn自动化的机器学习工具包
0
DMTK微软分布式机器学习工具包
DMTK是微软分布式机器学习工具包。DMTK包括以下几个项目:DMTKframework(Multiverso):参数服务器架构的机器学习LightLDA:用于大规模主题模型的可扩展、快速、轻量级系统
DMTK微软分布式机器学习工具包
0