
- 在线体验大正语言自动文摘
- 发布时间:2009-06-03
- 近日,大正语言产品中心新增了HNC自动文摘系统。这是公司在中文信息处理方面全新的探索与研究。
- 自动文摘是自然语言理解的一个重要应用方向。随着互联网的迅猛发展,信息的爆炸式增长使得快速、准确地查找信息变得更加困难。大正语言推出的HNC自动文摘系统是解决这一问题的有效手段,它可以对用户所选择的文章按照所选压缩比例进行内容压缩,将原文的主题思想或中心内容自动提取出来,使文摘具有概况性、客观性和可读性,并适用于任意领域。
- 在自动文摘已走过40年历史的今天,它的价值充分显露出来。这主要应该归功于电子出版系统和国际互联网络的蓬勃发展。当大量机读形式的文献潮水般涌来 的时候,人们想到了自动文摘。1993年12月在德国Wadern召开了历史上第一次以自动文摘为主题的国际研讨会。1995年,国际期刊Information Processing & Management出版了一期题为Summarizing Text的专刊,编者在序言中指出,这一期专刊的出版标志着自动文摘的时代已经到来。
- 大正语言自动文摘系统采用基于动态规划的文本分割方法来实现意义子主题的划分。系统采用HNC先进的词法分析技术,对文本进行分词,利用HNC的概念符号体系对词语语义进行描述,将原来的句子的词序列转变为HNC概念符号序列。发现词语潜在的相似性。
- HNC自动分类系统以概念联想脉络为主线,建立一种模拟大脑语言感知过程的自然语言表述模式和计算机理解处理模式,使系统在能更好的理解句子意思的基础上,达到文摘的更好的效果。
-

- 其特点及优势如下:
- HNC自动分类系统采用基于动态规划的文本分割方法来实现意义子主题的划分。该方法在公开的CHOI语料上性能较好,且自动识别子主题数目。
- 系统采用HNC先进的词法分析技术,对文本进行分词,利用HNC的概念符号体系对词语语义进行描述,将原来的句子的词序列转变为HNC概念符号序列。发现词语潜在的相似性。
- HNC自动分类系统以概念联想脉络为主线,建立一种模拟大脑语言感知过程的自然语言表述模式和计算机理解处理模式,使系统在能更好的理解句子意思的基础上,达到文摘的更好的效果。
- 自然语言有一个严重的缺陷,就是意义上密切相关的内容,表达符号上却往往不相关,对人脑来说,这都不是问题,因为人脑有联想的功能,而对计算机来说这是一个致命的障碍,HNC的符号表达弥补了自然语言的缺陷,帮助计算机客服障碍,提供处理手段,使我们的摘要结果更加准确。
- 敬请体验 http://products.hncit.com/autosum/