新闻资讯

深圳私人侦探推荐

情感分析_情感分析_文本情感分析工具

文本情感分析 赵妍妍, 秦兵, 刘挺 - 软件学报, 2010 - jos.org.cn 按粒度,情感分析可分为词语级、短语级、句子级、篇章级、多篇章级;按文本类别,可分为基于新闻评论和基于产品的情感分析。情感分析的研究任务:情感信息的抽取、分类以及检索与归纳。一、情感信息抽取(评价词语、评价对象、观点持有者)1. 评价词语的抽取:基于语料库的抽取;基于词典的抽取;基于图的方法。2. 评价对象的抽取:基于规则/模板的方法(词序列、词性、句法规则、关联规则挖掘);评价对象最为产品属性,考察评价对象与领域指示词的关联度来获取;多粒度的话题模型方法。3. 观点持有者抽取:命名实体识别技术(人名或机构名)、语义角色标注;分类任务,看做序列标注问题,使用 CRF 融合特征抽取;名词短语作为候选情感分析,使用 ME 模型计算。4. 组合评价单元的抽取:主观表达式:Wiebe 的主观表达式库(抽取 n 元词语/词组作为候选,对比训练预料判断)评价短语抽取(程度副词‐评价词语):情感词典的方法;依存句法解构(ADV,ATT,DE)。评价搭配抽取(评价词语‐评价对象):基于模板的方法(8 个共现模板、句法关系模板)。

二、情感信息分类1. 主客观信息分类:文本是否含情感知识方法;组合评价单元判断;情感模板识别;基于分类器和分类特征的二元分类任务(词语特征,标点、人称代词、数字特征,基于图);2. 主观信息情感分类(句子级、篇章级):基于情感知识、基于特征分类的方法(n‐gram 词语特征和词性特征、位置特征、评价词特征)。三、情感信息的检索与归纳1. 情感信息检索2. 情感信息归纳基于产品属性的情感文摘:识别评论信息中的产品属性,抽取描述产品属性的情感句,判断其倾向性。基于情感标签的情感文摘:标签可定义为评价搭配形式,建立标签库,相似度聚类的方法聚类得到相似的情感标签,每一类视为潜在的话题(即产品属性)。基于新闻评论的文摘四、情感分析的评测与资源1. 情感分析的评测:TREC,NTCIR 的 MOAT(新闻观点检测,情感问答,跨语言情感分析),国内的 COAE。2. 情感分析的语料:康奈尔大学的影评数据集,UIC 的 Hu 和 Liu 的产品领域的评论语料,Wiebe 的 MPQA 新闻评论深度标注语料,MIT 的多角度餐馆评论语料,中科院的中文酒店评论语料。3. 词典资源:GI(generalinquirer)评价词词典,NTU 评价词词典(繁体中文),主观词词典(英文),HowNet 评价词词典(简体中文、英文)问题:情感信息抽取忽略词语所在语境的影响;评价对象的情感分类,而非句子级或篇章级;基于情感标签的情感文摘的深入研究;基于层次结构的多策略中文微博情感分析和特征抽取谢丽星, 周明, 孙茂松 - 中文信息学报, 2012 - nlp.csai.tsinghua.edu.cn 三种情感分析方法的研究:表情符号的规则方法、情感词典的规则方法、基于 SVM 的层次结构的多策略方法。

情感分析_文本情感分析工具_情感分析

主题无关的情感分析:不关心情感极性所描述的对象,有基于词典的方法、有监督的机器学习和无监督的方法。主题相关的情感分析:基于规则的方法;基于特征(属性)的方法。主客观分类特征、极性分类特征:链接、表情、情感词典、情感短语、上下文微博消息句子构成特征:首句、尾句情感极性,正负中情感句数主题相关的句子筛选:包含主题词的句子、零指代情感、主题词相邻的一定范围内。本文中主题无关的最佳组合方法:单句用一步三分类,特征为表情+词典+短语+上下文,整体为句子组成 SVM,特征为首句尾句极性+三种情感极性句子数。主题相关的特征(本文提供主题词来获取数据):测试三种主题相关句子筛选方法。本文后续工作:构建网络用语词典;深入研究主题相关的特征;构建图模型。Cross‐LingualMixtureModelforSentimentClassification X Meng, F Wei, X Liu, M Zhou, G Xu… - Proceedings of the 50th …, 2012 - dl.acm.org 问题:英语的标记数据比其他语言多,很多现存的方法都是直接用机器翻译将源语言翻译为目标语言,以获取标记数据,但是翻译后的词典覆盖率有限,且翻译本身的准确性限制。

联系我们

CONTACT US

广州及时雨私家侦探(广州本地私家侦探公司)

微信:185-2064-4544

电话:185-2064-4544

地址:广州市天河区

广州出轨调查