TextGrocery短文本分类工具
TextGrocery 是一个基于SVM算法的短文本分类工具,内置了结巴分词,让文本分类变得简单。
示例代码:
>>> from tgrocery import Grocery # 新开张一个杂货铺,别忘了取名! >>> grocery = Grocery('sample') # 训练文本可以用列表传入 >>> train_src = [ ('education', '名师指导托福语法技巧:名词的复数形式'), ('education', '中国高考成绩海外认可 是“狼来了”吗?'), ('sports', '图文:法网孟菲尔斯苦战进16强 孟菲尔斯怒吼'), ('sports', '四川丹棱举行全国长距登山挑战赛 近万人参与') ] >>> grocery.train(train_src) # 也可以用文件传入 >>> grocery.train('train_ch.txt') # 保存模型 >>> grocery.save() # 加载模型(名字和保存的一样) >>> new_grocery = Grocery('sample') >>> new_grocery.load() # 预测 >>> new_grocery.predict('考生必读:新托福写作考试评分标准') education # 测试 >>> test_src = [ ('education', '福建春季公务员考试报名18日截止 2月6日考试'), ('sports', '意甲首轮补赛交战记录:米兰客场8战不败国米10年连胜'), ] >>> new_grocery.test(test_src) # 准确率 0.5 # 同样可以用文本传入 >>> new_grocery.test('test_ch.txt') # 自定义分词器 >>> custom_grocery = Grocery('custom', custom_tokenize=list)
评论
LibShortTextPython短文本分类
LibShortText是一个开源的Python短文本(包括标题、短信、问题、句子等)分类工具包。python-libshorttext是对LibShortText的优化和封装。
LibShortTextPython短文本分类
0
UIDevice-HelpersUIDevice 分类工具
UIDevice-Helpers是一款UIDevice分类工具,非常容易接收设备的信息。
UIDevice-HelpersUIDevice 分类工具
0
Classifier4J轻量级的分类工具
Classifier4J是一个轻量级的分类工具,支持贝叶斯分类、向量空间模型、信息摘要等。简单实例代码:SimpleClassifierclassifier=newSimpleClassifier()
Classifier4J轻量级的分类工具
0
DropIt多功能文件自动分类工具
DropIt是个灵活的自动处理和组织文件和文件夹的工具。当用户需要组织整理文件的时候,DropIt能帮用户揽下大部分搜索和手动打开移动文件的工作。用户只需要将一组不同的文件和文件夹拖到悬浮的DropI
DropIt多功能文件自动分类工具
0
ACEAutocompleteBarUITextField 分类
ACEAutocompleteBar 是一个简单的 UITextField 分类,用来显示一些输入文
ACEAutocompleteBarUITextField 分类
0