新闻资讯

侦探价格

情感文本_文本情感分析 python_情感电台文本

龙源期刊网 文本情感分析综述 作者:杨立公 朱俭 汤世平 来源:《计算机应用》2013 年第 06 期 摘要:以文本颗粒度为视角,从情感词抽取、语料库和情感词典构建、评价对象与意见持 有者分析、篇章级情感分析、实际应用五个方面对文本情感分析文献进行了梳理,并做出必要 评述。指出当前情感分析系统的准确率普遍不高,进一步研究的重点在于:自然语言处理的研 究成果在文本情感倾向分析中更广泛和贴切的应用;选取文本情感倾向分类的特征和方法;利 用现有语言工具和相关资源,规范、快速地构造语言工具和相关资源并应用。 关键词:文本情感分析;情感词;语料库;情感词典;意见持有者 0 引言 互联网的快速发展促进了其自身由“阅读式互联网”向“交互式互联网”转变。网络不仅成为 人们获取信息的重要来源,也成为人们发表自己的观点和分享自己的体验,直接表达喜、怒、 哀、乐等各种情感的重要平台。 当前,针对网络文本内容的处理技术主要着眼于客观性信息,相应信息检索一般为关键词 检索,信息抽取技术主要抽取文本描述的特定事件发生的时间、地点、相关人物、过程、属性 等,信息抽取结果大多是客观性事实,并按照客观主题进行分类。

面对大量来自微博、论坛、 博客的非结构化或半结构化评论文本,迫切需要通过计算机快速、有效地完成意见性文本信息 分类和情感信息的抽取,然后通过挖掘和分析文本中的立场、观点、看法、情绪、好恶等主观 信息,对文本的情感倾向做出判断。 1 文本情感分析概述 文本情感分析又称意见挖掘,是指通过计算技术对文本的主客观性、观点、情绪、极性的 挖掘和分析,对文本的情感倾向做出分类判断。随着计算机和网络技术的发展,人类开始研究 如何让计算机能理解和运用人类社会的自然语言,这一研究取得了丰硕的成果情感文本,这些成果为文 本情感分析奠定了基础。文本情感分析是自然语言理解领域的重要研究分支,涉及统计学、语 言学、心理学、人工智能等领域的理论与方法。 文本情感分析首先需要对文本来源进行处理,对网络文本进行主客观分类。网络文本信息 可以广义地分成两种类型:客观性文本和主观性文本。客观性文本就是我们对于实体、事件以 及它们属性的客观性陈述;主观性文本通常是我们对于实体、事件以及它们属性的主观性评 价,包含着丰富的主观性的意见、情感、观点和态度等。主客观分类从主客观混合的文本中将 描述事实的客观性文本与表达意见的主观性文本区分开来,将主观语言的文本抽取出来,过滤 掉不带情感色彩的文本。

这一阶段研究的主要目的是为文本情感极性分析提供主观性文本。 龙源期刊网 2 情感词抽取 情感词又称极性词、评价词语,特指带有情感倾向性的词。通常情况下,情感词有褒义和 贬义两类倾向性。情感词抽取和判别即是词汇级情感分析的基础工作,更是句子级和篇章级情 感分析的基础,因此引起了学者的广泛关注和研究。情感词抽取目前主要分为基于语料库和基 于词典的两种研究方法。基于语料库的情感词抽取和判别主要是利用大语料库的统计特性,优 点在于简单易行。 1997 年,Hatzivassiloglou 等[1]发表了在词汇级进行情感倾向性分析的研究。他们指出, 在例句“thiscarisbeautifulandspacious”中,如果“beautiful”是褒义的,那么因为两个形容词之间使 用连词“and”情感文本,可以推测“spacious”也是褒义的。同样,连词“or”、“but”等都可以设定处理规 则,通过大规模语料库提取关联的形容词,并使用通过线性回归模型分析这些形容词的情感极 性,最后通过聚类算法将形容词分组,达到 82%的准确率。Wiebe 等[2-7]对主观性文本进行系 统的分析研究,他们使用了一种相似度分布的词聚类方法在大语料库上完成了形容词性的评价 词语的获取。

联系我们

CONTACT US

广州及时雨私家侦探(广州本地私家侦探公司)

微信:185-2064-4544

电话:185-2064-4544

地址:广州市天河区

广州出轨调查