diff --git a/自然语言处理/短语挖掘与新词发现/苏剑林/main_sujianlin.py b/自然语言处理/短语挖掘与新词发现/苏剑林/main_sujianlin.py index 1b93b41..07c5632 100644 --- a/自然语言处理/短语挖掘与新词发现/苏剑林/main_sujianlin.py +++ b/自然语言处理/短语挖掘与新词发现/苏剑林/main_sujianlin.py @@ -17,7 +17,7 @@ myre = {2:'(..)', 3:'(...)', 4:'(....)', 5:'(.....)', 6:'(......)', 7:'(.......) min_count = 10 #录取词语最小出现次数 min_support = 30 #录取词语最低支持度,1代表着随机组合 min_s = 3 #录取词语最低信息熵,越大说明越有可能独立成词 -max_sep = 4 #候选词语的最大字数 +max_sep = 7 #候选词语的最大字数 t=[] #保存结果用。 t.append(pd.Series(list(s)).value_counts()) #逐字统计