X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到国家技术转移西南中心---区域技术转移公共服务平台,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
当前位置: 首页 >  科技成果  > 详细页

[01051803]越南文印刷体OCR识别引擎研发

交易价格: 面议

所属行业: 软件

类型: 非专利

交易方式: 资料待完善

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
|
收藏
|

技术详细介绍

1、任务来源:项目任务来源于桂科计字[2008]16号文件下达的广西科学研究与技术开发计划项目“越南文印刷体OCR识别引擎研发”,计划类别为“科技攻关与新产品试制”,合同编号为“桂科攻0816001-4”。2、技术原理及性能指标:项目以自主创新的越南文拉丁字母笔画描述法,通过区域特征、神经网络双引擎,来实现印刷体越南文字符的识别。达到的性能指标如下:①、对于所有越南字符的识别结果均使用Unicode编码进行保存。②、对输入的图片进行必要的预处理,包括必要的自动倾斜更正、去除指定颜色、保留指定颜色、灰度处理。③、对输入图像进行版面版面的分析,并提供版面分析的结果区域坐标集,能简单排除图像板块,对于表格进行表格识别(仅识别其中的越文文本)。④、对图象的行切分和字切分,并能提供识别的字坐标。⑤、对单字图象的特征选择和提取识别出其识别结果,按照一定格式存储识别结果(包括候选字、识别率)。⑥、所有识别结果可能用到的字符编码使用Unicode编码。⑦、dll链接库尽可能的简洁。字库文件和链接库文件数量小。⑧、识别文件格式至少包含:支持文件格式:BMP、TIF、TIFF、JPG、JPEG。⑨、标准印刷体测试稿的识别准确率达到99.5%以上。同时获得以下证书:软件产品登记证。3、技术的创造性与先进性。1)应用创新①、首个成熟的越南文字OCR识别技术。②、OCR-PDF(双层可检索)技术是国际上最流行的OCR识别技术。2)技术创新①、廖宏的发明专利“一种利用计算机对数字化档案文件压缩的方法”,该技术采用自主的先进压缩算法,二值、灰度和彩色图像文件的压缩率是通用图像格式TIFF文件的50%左右。②、同时使用神经网络、区域特征双识别引擎来提高识别准确率,并使用优化算法来加快识别速度。③、自主创新的笔画描述法基于越南文字符轮廓的提取、轮廓描述的笔画描述法,能较为精确地提炼出越南文字符特有的符号特征,适用上百种字体、多种变形(斜体、粗体等)。4、应用领域:项目可广泛应用于外语类院校及研究机构,有意开发越南语电子词典或翻译系统、扫描仪等数码产品的开发商,海关、航空及旅游服务商,手机出口商、消费类电子产品出口商、系统集成商、越南政府、学校、图书馆,以及有OCR业务需求的其他越南客商。
1、任务来源:项目任务来源于桂科计字[2008]16号文件下达的广西科学研究与技术开发计划项目“越南文印刷体OCR识别引擎研发”,计划类别为“科技攻关与新产品试制”,合同编号为“桂科攻0816001-4”。2、技术原理及性能指标:项目以自主创新的越南文拉丁字母笔画描述法,通过区域特征、神经网络双引擎,来实现印刷体越南文字符的识别。达到的性能指标如下:①、对于所有越南字符的识别结果均使用Unicode编码进行保存。②、对输入的图片进行必要的预处理,包括必要的自动倾斜更正、去除指定颜色、保留指定颜色、灰度处理。③、对输入图像进行版面版面的分析,并提供版面分析的结果区域坐标集,能简单排除图像板块,对于表格进行表格识别(仅识别其中的越文文本)。④、对图象的行切分和字切分,并能提供识别的字坐标。⑤、对单字图象的特征选择和提取识别出其识别结果,按照一定格式存储识别结果(包括候选字、识别率)。⑥、所有识别结果可能用到的字符编码使用Unicode编码。⑦、dll链接库尽可能的简洁。字库文件和链接库文件数量小。⑧、识别文件格式至少包含:支持文件格式:BMP、TIF、TIFF、JPG、JPEG。⑨、标准印刷体测试稿的识别准确率达到99.5%以上。同时获得以下证书:软件产品登记证。3、技术的创造性与先进性。1)应用创新①、首个成熟的越南文字OCR识别技术。②、OCR-PDF(双层可检索)技术是国际上最流行的OCR识别技术。2)技术创新①、廖宏的发明专利“一种利用计算机对数字化档案文件压缩的方法”,该技术采用自主的先进压缩算法,二值、灰度和彩色图像文件的压缩率是通用图像格式TIFF文件的50%左右。②、同时使用神经网络、区域特征双识别引擎来提高识别准确率,并使用优化算法来加快识别速度。③、自主创新的笔画描述法基于越南文字符轮廓的提取、轮廓描述的笔画描述法,能较为精确地提炼出越南文字符特有的符号特征,适用上百种字体、多种变形(斜体、粗体等)。4、应用领域:项目可广泛应用于外语类院校及研究机构,有意开发越南语电子词典或翻译系统、扫描仪等数码产品的开发商,海关、航空及旅游服务商,手机出口商、消费类电子产品出口商、系统集成商、越南政府、学校、图书馆,以及有OCR业务需求的其他越南客商。

推荐服务:

Copyright © 2016    国家技术转移西南中心-区域技术转移公共服务平台     All Rights Reserved     蜀ICP备12030382号-1

主办单位:四川省科技厅、四川省科学技术信息研究所、四川省技术转移中心科易网