有没有找到动词时间特征的算法?这意味着它是“事件”,“成就”,“成就”还是“国家”?如Zeno Vendler的论文“动词和时代”中所述?
http://semantics.uchicago.edu/kennedy/classes/s07/events/vendler57.pdf
或者也许有人知道实施此类事情的最佳方式是什么?
谢谢!
最佳答案 据我所知,如果不使用数据库,就无法做到这一点.然后,“算法”本身将是数据库结构和对其进行查询的联合.
例如,具有英语单词表的关系数据库,每两列:单词和一个或多个词性,是可以想到的最基本的语言处理数据库.更复杂的一个也有一个动词表,有两列,单词和“时间特征”.
例如,单词“be”总是描述一个状态.因此,看到单词be(或其变形:is,are,was等)的程序可以立即将该条款识别为描述存在状态.显然,完成这个词会立即表示成就,“成就”总是表示成就.但不要忘记,在您列出的四个类别中,只有“州”和“事件”是相互排斥的(除了现在的分词,例如句子“正在发生的事件.”).除此之外,一个国家也可以是一项成就或成就(“我是奥运会金牌得主”.)也可以是一项活动(“我明天毕业.”).
成就和成就也是主观的术语,取决于说话者和读者的敏感性.诸如“成就”,“成就”和“成功”之类的词语是对成就感的刻意表达,因此可以总是被归类为这样.但是,这是先验信息,因此需要实现关系数据库.
最后,某些词语的“时间特征”会根据句子中的其他词语而改变.例如,在“我闻起来很好”的句子中,“气味”是一种现状动词.在“我闻到培根.”这句话中,它是一个动作动词.这些动词是动作动词后跟名词(及物),动词状态动词后面跟着形容词(谓词主格),动作动词后面跟着(不及时).因此,解析器必须检查句子中跟随它的单词,一个作为名词或形容词,并从中识别动词在句子中的作用.这是知道每个单词的词性的数据库之间的共同努力,并且算法能够正确地解析句子(并且简单地知道它需要完全解析它).
这只是对词法计算的简要概述,以及我对该主题的了解.还有更多内容,显然,用文字填充数据库及其词性,定义,角色等等是乏味的.可能存在预先填充了词法计算机科学家需要实现这样一个系统的信息的数据库(但我并不声称知道在哪里可以找到它们).
希望我帮助过,祝你好运!