免费发布信息
 
当前位置: 首页 » 推广 » 商务服务 » 正文

灵玖大数据在中文语义分析完成新突破

放大字体  缩小字体 发布日期:2019-09-04  作者:张宝  15801695527   浏览次数:40
核心提示:中文中有一词多义,相比英文分析,中文语义分析的语义分析面临更多技术难题。灵玖大数据在研发过程中,充分考虑到了中文特殊性,


 

中文中有一词多义,相比英文分析,中文语义分析的语义分析面临更多技术难题。灵玖大数据在研发过程中,充分考虑到了中文特殊性,针对一词多义和文章中出现的新地点名均提出了解决方案,提高了中文语义分析的准确性。

汉语智能分词

中文分词是语义分析的基础阶段,是进行中文信息处理必备的核心部件。灵玖综合了各家所长,采用条件随机场(Conditional Random Field,简称CRF)模型。

 

条件随机场运用CRF模型,采用了先将汉语语言进行定性的方式分析语言,根据自然语言的运用环境对多义词进行定义,极大地提高了中文语言解析的准确性,一级词性标注准确率接近99%,准确率高、速度快、可适应性强。

 

除了对多义词的高准确率区分,在对一些地点和机构名的识别问题上,即使这类词没有事先存入系统,CRF模型同样能够自动挖掘出这类词。条件随机场极大地提高了识别的准确率,能够满足多样场景需求。

 

文本关键字提取

 

提取文章关键词对于读取文章的意义在于,在掌握文章的主题思想的前提下,了解文章关键字能够达到精华阅读效果,完成文章的语义查询和快速匹配。采用基于语义分析的语言统计模型,文档使用的范围也更加广泛,对新词的识别率也很高。

 

关键词提取组件的主要特点包括:

1、速度快:实现对海量网络文本处理,实现每小时50篇文档的高效处理模式。

2、处理精准:Top N的结果反应了文章的主要枝干方向。

3、精准排序:根据影响权重进行排序,关键词可以输出权重值;

4、开放式接口:作为LJParser的一部分,文章关键词能够提取组件采用灵活的开发接口,能够方便地融入到用户的业务系统中,以及支持各种操作系统和调用语言。

 

自动文本摘要

对文章进行摘要提取能够使用户快速掌握文章内容,提供工作效率。

自动摘要的中间件能够处理的不只是单篇文章的摘要提取,还包括对同类型的文章进行处理,提取出一篇简明扼要的摘要。同时,用户可以自由设定摘要的长度、百分比等参数;处理速度达到每秒钟20篇。

 

灵玖软件专注于大数据语义智能分析,凭借其在自然语言处理、信息检索、信息过滤、知识图谱等方向的领先核心技术积累,形成了面向大型企业和政府军队的一系列语义智能化软件系统。

 
 
[ 推广搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]
 
泰国四大性药 特别有名的男士性药
  • 泰国四大性药 特别有名的男士性药
  • 很多男人喜欢泰国的风月,泰国男士性药也很有名,下面我们来介绍一下泰国四大性药,男性性药品必买清单,这些也成了泰国文化的一部分。
  • 2018-10-24
泰国必买清单,泰国代购什么值得买?
如何提高员工的积极性 怎样留住员工
  • 如何提高员工的积极性 怎样留住员工
  • 任何企业组织都必须通过激励来留住最优秀的员工。没有经验丰富且合格的员工,企业无法实现预期目标。那么,如何提高员工的积极性,怎样留住员工呢?
  • 2018-09-01
怎么在网络上推广自己的产品?
  • 怎么在网络上推广自己的产品?
  • 现在,你已经有了自己的产品,但不知道接下来该做什么?在这篇文章中,您将学习怎么在网络上推广自己的产品,您可以选择能够为您的企业带来最佳结果的策略。
  • 2018-08-28


 
推荐图文
推荐推广
点击排行