[00280831]基于组块的越南语短语树构建方法
交易价格:
面议
所属行业:
办公文教
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201610497061.2
交易方式:
技术转让
技术转让
技术入股
联系人:
昆明理工大学
进入空间
所在地:云南昆明市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明涉及基于组块的越南语短语树构建方法,属于自然语言处理技术领域。本发明首先对越南语短语树标注集进行上层组块和基层组块标注;选取上层组块和基层组块的特征集,再构建基于组块的越南语短语树库构建模型;利用组块分析工具对分词后的越南语句子进行组块分析,得到基于组块构建的初级越南语短语树库;利用短语树库校正器对基于组块构建的初级越南语短语树库进行校正,最后得到校正后的终级越南语短语树库。本发明避免了人工收集和标注越南语短语树库的过程,节省了人力和构建树库的时间;本发明提出的构建短语树的方法相比采用上下文无关文法构建越南语短语树库和最大熵构建越南语短语树库方法准确率明显提高。
本发明涉及基于组块的越南语短语树构建方法,属于自然语言处理技术领域。本发明首先对越南语短语树标注集进行上层组块和基层组块标注;选取上层组块和基层组块的特征集,再构建基于组块的越南语短语树库构建模型;利用组块分析工具对分词后的越南语句子进行组块分析,得到基于组块构建的初级越南语短语树库;利用短语树库校正器对基于组块构建的初级越南语短语树库进行校正,最后得到校正后的终级越南语短语树库。本发明避免了人工收集和标注越南语短语树库的过程,节省了人力和构建树库的时间;本发明提出的构建短语树的方法相比采用上下文无关文法构建越南语短语树库和最大熵构建越南语短语树库方法准确率明显提高。