nlp – 非英语术语提取

我正在寻找一个用多种语言进行术语提取的开源项目.

我已经找到了Yahoo BOSS Term Extraction Web Service,这很好.但是,它除英语外没有处理其他语言.

您是否知道任何支持更多语言的开源术语提取项目?

谢谢!

最佳答案 从我在生产中使用过的包装或者刚刚玩过的包装中,以下是最全面和最积极维护的包装:

> GATE – 用于广泛自然语言处理任务的计算机体系结构,可在GNU公共许可证下获得
> Ling-Pipe(Java) – 一套用于人类语言语言分析的Java库,可以将实体提及链接到数据库条目,发现关系,集群文档,……
> OpenNLP(Java) – 用于自然语言处理(NLP)的Java机器学习工具包.它支持最常见的NLP任务.
> NLTK(Python) – NLTK是构建Python程序以处理人类语言数据的领先平台.
> Proxem Antelope(.Net) – 面向对象的高级自然语言处理环境
> Scala-NLP(斯卡拉)
> Stanford NLP(Java)

此外,还有一些很好的Web API,例如:

> Zemanta
> Open-Calais

点赞