有没有什么方法可以重新训练现有的OpenNLP模型??例如,从OpenNLP中向现有模型添加新的项目?假设我想添加一些新的条目到现有的en-ner-date.bin,因为有些单词没有被检测为日期。
我看到过类似于model builder-add on的东西,但没有具体的例子来说明如何使用它。如有任何帮助,我们将不胜感激。
p5fdfcr11#
你不能 * 简单地操作现有的二进制OpenNLP模型文件。你必须训练自己的模型,使其具有特定的功能,即检测训练中文本样本中的命名实体。请参阅OpenNLP model download page上的提示:模型可用于测试或入门。请为所有其他用例训练您自己的模型。此外,引用 Apache OpenNLP 开发人员手册:预先训练的模型可能不适用于所需的语言,无法检测重要的实体或在新闻领域之外的性能不够好。这些都是在新语料库或由从应分析的数据中提取的私有训练数据扩展的语料库上对名称查找器进行自定义训练的典型原因。更多详情请参见“名称和培训”部分。
1条答案
按热度按时间p5fdfcr11#
你不能 * 简单地操作现有的二进制OpenNLP模型文件。你必须训练自己的模型,使其具有特定的功能,即检测训练中文本样本中的命名实体。请参阅OpenNLP model download page上的提示:
模型可用于测试或入门。请为所有其他用例训练您自己的模型。
此外,引用 Apache OpenNLP 开发人员手册:
预先训练的模型可能不适用于所需的语言,无法检测重要的实体或在新闻领域之外的性能不够好。这些都是在新语料库或由从应分析的数据中提取的私有训练数据扩展的语料库上对名称查找器进行自定义训练的典型原因。
更多详情请参见“名称和培训”部分。