新闻资讯

广州越秀区私家侦探公司

文本情感分析

文本情感分析(Sentiment Analysis),是在大数据背景下计算机把各种人类情感转化成数据进而分析文本的态度倾向的操作。文本感情分析,又叫做“倾向性分析”或“意见挖掘”(OpinionMining),是指对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程;属于计算语言学的范畴,涉及到人工智能、机器学习、数据挖掘、信息检索、自然语言处理等多个研究领域。

情感分析还可以细分为(1)情感极性(倾向)分析,(2)情感程度分析,(3)主客观分析等。

(1)情感极性分析的目的是对文本进行褒义、贬义、中性的进行判断。

(2)情感程度分析主要是对同一情感极性中再进行划分或者细分,以描述该极性的强度。例如“喜爱”和“热爱”都是褒义词,但是“热爱”相对来说褒义的程度更加强烈一些。

(3)主客观分析主要目的是识别文本中哪些部分是客观称述而不带情感色彩,哪些是带有情感的主观描述。在对于微博,或者商品评论,这个分析步骤一般都忽略,因为微博和商品评论本身就一定存在强烈的情感色彩,而且客观描述的情感值理论上是为零,不影响最终的情感分析结果。

按照应用领域的不同,可以将文本情感分析技术分为:

(1)基于产品评论的文本情感分析:处理用户发表的产品评论文本,一般用于消费者辅助决策和商业舆情监控;

(2)基于新闻评论的文本情感分析:处理用户对新闻事件发表的评论文本,多用于帮助政府相关部门进行舆情监控,对大众做出正确舆论引导。

情感分析是文本分类的一个分支,对带有情感色彩(褒义贬义/正向负向)的主观性文本进行分析,以确定该文本的观点、喜好、情感倾向。

例如说,文本“这衣服令人爱不释手”归为正向,“这衣服很难看”归为负向。当然也有层次更多的分类。

被研究的主观性文本包括顾客对某个产品的评论,大众对某个新闻热点事件的观点等。通过这些文本,商家可以广泛了解消费者意见供生产及销售决策参考,相关行政机构也可以及时了解社会舆情改善管理。人工分析显然需要耗费大量成本,在大数据网络时代,使用适当算法,可以迅速高效完成这类任务。基于网络大数据的情感分析,对商业和社会管理具有很大价值。

目前有基于情感词典的情感分析和基于机器学习的情感分析这两种主流方法。

基于情感词典,是指根据已构建的情感词典,对待分析文本进行文本处理抽取情感词,计算该文本的情感倾向。最终的分类效果取决于情感词典的完善性。

基于机器学习情感文本,是指选取情感词作为特征词情感文本,将文本矩阵化,利用逻辑回归(Logistic Regression), 朴素贝叶斯(Naive Bayes),支持向量机(SVM)等方法进行分类。最终分类效果,取决于训练文本的选择以及正确的情感标注。

当然,特定情况下研究某些文本时也可以将两种方法结合起来。

比如说,某些领域的文本没有标注,该领域的情感词典也不够完善,而人工标注需要耗费大量成本。当数据的采集相对于人工成本小很多时,可以选取部分文本,利用基本情感词典的方法粗略地计算这些文本的情感得分值,选取分值偏高或偏低的文本作为已标注的训练文本,再结合机器学习的方法进行分析。

情感分析自从2002年提出之后,获得了很大程度的研究,特别是在线评论的情感倾向性分析,获得了很大的发展。目前基于在线评论文本的情感倾向性分析的准确率,最高能达到90%以上。但是由于深层情感分析必然涉及到语义的分析,以及文本中情感转移现象的经常出现,所以基于深层语义的情感分析以及篇章级的情感分析进展一直不是很大。目前研究主要集中于情感词的正面负面分类,标注语料,情感词的提取等。

文本情感分析的应用非常广泛,可以应用到许多行业,其中最重要的几个应用包括:实现情感机器人,自动提供抉择支持,网络舆情风险分析,信息预测等。

联系我们

CONTACT US

广州及时雨私家侦探(广州本地私家侦探公司)

微信:185-2064-4544

电话:185-2064-4544

地址:广州市天河区

广州出轨调查