X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到国家技术转移西南中心---区域技术转移公共服务平台,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
当前位置: 首页 >  科技成果  > 详细页

[01756218]广播电视新闻语料自动分词与频率统计系统

交易价格: 面议

所属行业: 广播电视

类型: 非专利

交易方式: 资料待完善

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
|
收藏
|

技术详细介绍

该系统总体设计合理,语料取样恰当,既遵循了国家统一的分词规范,又照顾到新闻用词的特点。其分词系统先进,所用词频统计方法能较真实地反映词条的平均使用频度,是一个较为先进的实用系统。所用分词系统,采用联想规则,缩小了分词用词库,提高了词库利用率,并较好地解决了歧义字段的切分问题,使分词准确率达到98·6%,在PS/2机器上的平均分词速度为每分钟480词。是我国首次研制成的专门对新闻语料全文进行自动分词的实用系统。对70万字的电视新闻语料进行词频、分散度和标准频度指数的统计,在国内尚属首次,为建立新闻词库提供了可靠的依据,对汉语教学等领域也有使用价值。
该系统总体设计合理,语料取样恰当,既遵循了国家统一的分词规范,又照顾到新闻用词的特点。其分词系统先进,所用词频统计方法能较真实地反映词条的平均使用频度,是一个较为先进的实用系统。所用分词系统,采用联想规则,缩小了分词用词库,提高了词库利用率,并较好地解决了歧义字段的切分问题,使分词准确率达到98·6%,在PS/2机器上的平均分词速度为每分钟480词。是我国首次研制成的专门对新闻语料全文进行自动分词的实用系统。对70万字的电视新闻语料进行词频、分散度和标准频度指数的统计,在国内尚属首次,为建立新闻词库提供了可靠的依据,对汉语教学等领域也有使用价值。

推荐服务:

Copyright © 2016    国家技术转移西南中心-区域技术转移公共服务平台     All Rights Reserved     蜀ICP备12030382号-1

主办单位:四川省科技厅、四川省科学技术信息研究所、四川省技术转移中心科易网