首 页  | 公司简介 | 新闻报道 | 研发理论 | 产品中心 | 技术服务 | 招聘英才 | 联系我们
  • 利用文本情感分析 建立客观评价体系
  • 发布时间:2009-05-20
  •       子曰:“不患人之不己知,患不知人也。”几千年前的孔子担心的不是别人不了解自己,而是自己不了解别人。同样,在信息高度发达的今天,一些政府部门和知名企业也陷入了这样的困局,名声在外,然而他人对自己的评价尚难看清。获悉正负评价的比例,问题集中点等成为政府与企业关注的焦点。在多年的中文信息处理研发中,大正语言凭借HNC语义技术开发了文本情感分析系统,帮助客户建立客观评价体系。
  •       一、文本情感分析的定义
  •       所谓文本情感倾向性分析,就是对说话人的态度(或称观点、情感)进行分析,也就是对文本中的主观性信息进行分析。由于立场、出发点、个人状况和偏好的不同,民众对生活中各种对象和事件所表达出的信念、态度、意见和情绪的倾向性必然存在很大的差异。这种差异尤其体现在论坛、博客等反映草根观点的网络媒体上。长期以来要了解关于某个问题的报道是正面的还是反面的,是消极的还是中立的,往往需要求助于调查公司。这些公司的员工仔细阅读有关某个机构、个人、事件或问题的所有文字,然后就这些评论的态度做出反馈。这不仅耗费大量人力和财力,而且过程相当缓慢。互联网海量信息的增长,手工作业无法跟上时代的发展。
  •       二、大正语言文本情感系统技术原理
  •       大正语言依靠HNC技术,将中文信息处理由字词、句子上升为对整段及篇章的理解,使文本情感智能分析成为可能。具体来讲,大正语言文本情感倾向分析技术突破关键词技术的局限性,不再拘泥于词语本身来分析情感倾向性。因为,词语的情感倾向除了褒贬性之外,还包括倾向性的强烈程度。例如,“谴责”的强度就远远超过了“批评”和“指责”,而这种强度关键词技术很难做到,必须取决于特定的上下文环境,例如,“骄傲”在表示自豪概念时,是褒义词,而在表示自满概念时,则是贬义词。要获得正确的倾向性判断,必须依赖语境的情感性分析.
  •       在研究中,大正语言首先将句类分析作为突破口。在解决了语义块构成、专名识别等复杂语言现象之后,着手研究语境单元萃取技术,依据情景框架识别与背景生成与使用,即通过上下文环境,文本背景等达成对单元语境的认知;完成了从句子情感倾向性分析、篇章情感倾向性研究向海量信息的整体倾向性预测的过渡,进而理解整篇文章的情感倾向。
  •        以上几个环节缺一不可,如果仅仅将篇章作为一个整体,笼统地进行主观性分析存在很大局限性,其本质缺陷在于假设整个文本是针对同一个对象进行评论。而真实文本往往由包含多个对象,不同的对象所涉及到的观点、态度等主观性信息是有差异的。从另一方面看,篇章内的对象总数仍是有限的,不足以支撑对于整体倾向性的挖掘。因此,大正语言更多的研究集中在篇章内进行情感倾向性论述的分析,以及在大规模数据集上进行整体倾向性分析,在基础研究之上完成语境生成,从不同信息源抽取出的、针对某个话题的情感倾向性信息进行集成和分析,进而挖掘出态度的特点和走势。目前,该研究已取得一定的成绩。
  •       三、文本情感分析成功应用
  •       大正语言正在为我国某高新技术开发区开发舆情分析系统。该系统对全国主流媒体包括广播、电视、报纸、网络等进行跟踪,汇总抓取与之相关信息,并采用多维度的分类方法,依据信息所包含的倾向性归类甄别,帮助其快速了解各方评价。对园区企业的评价体系更是收效显著。所属企业的经营的、服务的、企业文化的、产品的各类评价汇聚成列、纲举目张,极大地方便了园区工作人员了解园区企业状况,为其制定园区宏观政策、决定园区发展方向以及确定园区重点企业等提供了决策依据。
  •       大正语言正在展开与政府网站合作。作为政府对外服务的窗口,政府网站一个重要功能是将各方老百姓反映的问题汇总,然后再转发给各级主管部门进行处理。目前,该项工作一直在稳步进行中,且取得了良好的效果。但是,由于数据库庞大、问题分散等原因,老百姓反映问题的集中度、问题的性质、评价等很难量化,主管部门无法获得准确信息,以考核相关部门实际工作状况、改进状况等,陷入“知其然,不知其所以然”的困境;大正语言舆情分析系统充分利用公司语义分析技术,特别是文本情感分析技术,采用多维度分类方法可以有效的解决了这一问题。
  •       除此之外,企业级的合作也在酝酿中,文本情感分析的价值被多方看好。打个比方来说,大家都知道海尔的品牌,海尔电脑、电视、冰箱、洗衣机等等可谓深入人心,然而,海尔到底哪款产品好,哪款产品有问题,企业很难做到“眼观六路、耳听八方”。大正语言文本情感分析技术借助技术手段使企业快速有效获得相关信息,迅速做出判断和响应。
  •       可以说,大正语言文本情感分析技术帮助政府和企业真正解决了“不知人”的难题!