|
|
@@ -12,9 +12,13 @@ |
|
|
|
`ideaseg` 提供三个模块包括: |
|
|
|
|
|
|
|
1. `core` ~ 核心分词器模块 |
|
|
|
2. `elasticsearch` ~ ElasticSearch 的 ideaseg 分词插件 (默认版本 7.10.2) |
|
|
|
2. `elasticsearch` ~ ElasticSearch 的 ideaseg 分词插件 (最高支持 7.10.2 版本) |
|
|
|
3. `opensearch` ~ OpenSearch 的 ideaseg 分词插件 (默认版本 2.4.1) |
|
|
|
|
|
|
|
**关于 `ElasticSearch` 的版本说明,由于从 7.11.1 版本开始 Elastic 修改 ES 的许可证,同时修改了插件的权限策略, |
|
|
|
不再允许插件对文件进行读写。由于 `HanLP` 本身的模型数据很大,为了提升速度其处理机制需要在插件的数据目录下生成一些相当于缓存的文件。 |
|
|
|
因此,如果你使用的是 `ElasticSearch` 请尽量用 7.10.2 或者以下的版本,推荐使用 `OpenSearch` 。** |
|
|
|
|
|
|
|
此外 `data` 包含 `HanLP` 的模型数据。 |
|
|
|
|
|
|
|
由于 `ElasticSearch` 的插件机制严格绑定引擎本身的版本,而且版本众多,因此本项目不提供预编译的二进制版本,你需要执行下载源码进行构建。 |
|
|
|