Are you sure you want to delete this task? Once this task is deleted, it cannot be recovered.
|
10 years ago | |
---|---|---|
data | 10 years ago | |
libs | 10 years ago | |
src | 10 years ago | |
.gitignore | 10 years ago | |
README.md | 10 years ago | |
pom.xml | 10 years ago |
##基于自然语言处理的情感分析工具
##请注意:
- pom.xml 文件中 lingpipe-core jar 没办法从中央仓库下载已经集成到 libs 目录里面,而 pom.xml 中只能使用绝对路径,请注意修改
- pom.xml 文件中 hanlp jar 包可能需要手动下载,然后添加到 maven 仓库
###本程序依赖data目录下面的data.zip和dictionary.zip先解压缩 data 目录下面的 data.zip到当前目录。
CATEGORY nment others
government 233 46
others 110 390
准确度: 0.8
总共正确数 : 623
总数:779
效果:
Total Accuracy=0.9550706033376123
95% Confidence Interval=0.9550706033376123 +/- 0.014546897368198444
Confusion Matrix
reference \ response
government,others
government 271, 8
others 27, 473
###1、基于词典和贝叶斯模型的情感分析
主程序:eshore.cn.it.sentiment.Sentiment 此类通过
data/Sentiment_Dictionary中的正负面词语建立模型。
测试: eshore.cn.it.sentiment.SentimentTest
通过这个类就可以测试 data/500trainblogxml中的某个文件夹下面的博客的情感。
###2、直接利用lingpipe的情感分析模块测试情感分析
直接运行程序: eshore.cn.it.sentiment.ChinesePolarityBasic
程序就会通过: data/polarity_corpus/hotel_reviews/train2训练
然后自动测试: data/polarity_corpus/hotel_reviews/test2
最后给出程序测试结果。
# Test Cases=4000
# Correct=3541
% Correct=0.88525