酒店情感分析

对于预料集,可以从这个数据堂拿数据:http://www.datatang.com/

其中关于酒店情感数据分析部分:http://www.datatang.com/data/shop-page.html?k=%E9%85%92%E5%BA%97%E6%83%85%E6%84%9F

对于酒店情感分析,很重要的一点就是语料库要好,同时,分词时需要的有好的情感词库,这样才能得到更好的分词结果。

在得到好的分词结果后, 还需要人工的对词进一步筛选,得到最终的分词结果(这个过程可能需要经历几个反复迭代的过程),然后才是统计词频,建立词的特征,进而表征整个文档的特征,这里便可以使用TF-IDF提取文档中词的特征,同样可以采用Word2Vec来提取词的word embedding,进而表征整个文档的特征。为之后的情感分析,语义分析等做好充分的准备。

之前听了哈工大车万翔老师的一个报告,里面讲到了NLP中的关键技术,句法分析和语义分析,如下是听完的感受:

直接了当的讲了几个主要点。NLP无非就是:分词=>词性标注=>命名实体标注=>句法分析=>语义分析=>上层的知识抽取,问答系统,这次主要讲语法分析和词法分析,介绍了这方面的发展,感觉这方面水很深,很多人投入,但是效果并不是特别好,准确率相对很低,很多模棱两可的结果。之前自动化所的老师讲关于NLP的内容时,一再强调NLP中的关键技术,对于句法分析和语义分析是十分关键的部分,这两个模块做得怎么样,直接关系到后面高级的处理能否得到好的应用结果。

    原文作者:Nicholas_Liu2017
    原文地址: https://blog.csdn.net/Nicholas_Liu2017/article/details/73823499
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞