From a874429a61fac75ccbc36bf720877ea131777305 Mon Sep 17 00:00:00 2001 From: gitclebeg Date: Mon, 13 Apr 2015 17:41:07 +0800 Subject: [PATCH] add test result to report --- README.md | 11 ++++++----- 1 file changed, 6 insertions(+), 5 deletions(-) diff --git a/README.md b/README.md index 011edda..8bb8995 100644 --- a/README.md +++ b/README.md @@ -7,20 +7,21 @@ ###本程序依赖data目录下面的data.zip和dictionary.zip先解压缩 data 目录下面的 data.zip到当前目录。 * 新增说明3:增加基于 TF-IDF(词向量) 特征的文本分类程序。 -1. 主程序:DfIdfClassifier +1. 主程序:DfIdfClassifier.java 2. 效果 - +``` CATEGORY nment others government 233 46 others 110 390 准确度: 0.8 总共正确数 : 623 总数:779 - +``` * 新增说明2:增加基于 N-Gram(词向量) 特征的文本分类程序,目的是找出自己领域相关的文本,然后再从这个领域相关的文本中判断正负面。 1. 测试语料:data/text_classification.zip 解压缩即可 -2. 运行程序:NGramClassifier 即可。 +2. 运行程序:NGramClassifier.java 即可。 +``` 效果: Total Accuracy=0.9550706033376123 95% Confidence Interval=0.9550706033376123 +/- 0.014546897368198444 @@ -29,7 +30,7 @@ reference \ response government,others government 271, 8 others 27, 473 - +``` * 新增说明1:2015-04-10测试了不用中文分词器,分词之后 LingPipe 情感分类的准确率,同时测试了去除停用词之后的情感分类的准确率。