java – GATE对NLP有多好?

我正在尝试构建一个基本上必须执行命名实体识别(NER)的NLP应用程序.我遇到了
GATE.根据我的理解,这是一个构建NLP应用程序的框架.我测试了ANNIE,与GATE一起分发的IE系统但是我的域的NER结果不符合预期.事实上,任何NER,如Stanford CoreNLP或NLTK,都没有给我所需的结果.所以我决定调整现有系统以获得理想的结果.

关于GATE我喜欢的东西很少:
1.组件的模块化:例如在ANNIE中,Tokenizer,Gaztteer,Sentence splitter,POS tagger等组件可以相互独立使用.
它的规则语言称为JAPE,它有一种编写规则或模式的非常好的方式.

但我想知道的关于GATE的一些事情是:
1. GATE的其他主要优势是什么?特别是NER?
2. GATE添加新组件的灵活性如何?例如有一天,如果我想在GATE内使用NLTK的POS标签?
3.如果我想在GATE中使用自定义机器学习模型?
4.我知道谢菲尔德大学的NLP小组参与了GATE,但我想知道GATE社区的活跃程度以及对GATE的支持程度如何?
5. GATE可以用于商业软件吗?

热衷于实际使用GATE的人的建议

最佳答案 虽然很晚,可能对某人有用.

>正如您已经提到的,如果有效编写,JAPE语法将非常有用.嵌入式GATE也是我考虑的另一大优势,因为我们可以在JAVA中调整我们想要的方式.
>同样,GATE embedded可用于添加新组件,您可以在其中构建自己的插件.但是,如果您想使用斯坦福工具,这些工具已在GATE中随时可用.你可以即插即用.
> GATE已经有很多算法,我猜他们(谢菲尔德大学)正在不断建立它.
> GATE support team非常活跃,您可以订阅他们的邮件列表并在有任何问题时提出问题,他们会尽快回复.
>我想是的.但是,如果您直接联系GATE team,他们会更好地回答您.

点赞