NLP:lemmaGen c的词形还原

我正在增强聊天机器人,我希望找到输入句子中的单词的引理.聊天机器人写的是c,我找到了一个名为LemmaGen的免费开源词典化工具.我已经下载了2.2版的c版,但它没有关于如何引用甚至使用它的文档.

过去有没有人有过LemmaGen的经验?任何信息都会有所帮助.
非常感谢

最佳答案 我没有使用c版本,但我确实使用了C#版本. LemmaGen用于C#非常简单直接.首先用模型文件的参数初始化Lemmatizer类型的对象然后你可以将它的公共方法称为Lemmatize字,表示为字符串.因此,您所要做的就是对文本进行标记,然后将每个标记逐个变为lematize.方法返回表示输入字的引理的字符串.

我猜使用C版本是类似的.

点赞