[00008570]语音信号识别应用系统
交易价格:
面议
所属行业:
软件
类型:
非专利
技术成熟度:
正在研发
交易方式:
技术转让
联系人:
上海大学
进入空间
所在地:上海上海市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
技术投资分析:
说话人识别就是用语音信号(待识语音)和预先提取的注册用户特征信息来辨别或确定说话者的身份。本质上讲,说话人识别即对语音信号做模式识别,它由训练(提取说话人特征)和识别(根据待识语音对说话人身份做出判断)两个过程组成。
语音信号中既有说话内容方面的信息,又有关于说话者个人身份的信息——独特的声道特性和发音特点等使其语音具有区别于他人的特征,这是说话人识别的基本依据。
为能在实时性和识别率间取得一种平衡,上海大学通信学院电子系提出了一种改进的高斯混合模型(GMM), 在训练时间上,改进的GMM训练速度的大幅提高,而且识别率仍优于传统的GMM。在与文本无关的方式下,说话人辨认的正确率达到90%以上,说话人确认的等错误率小于5%。
技术的应用领域前景分析:
在通信领域、办公室自动化、保安、军事、网络以及金融应用中的私钥等。
效益分析:
主要技术性能指标:
(1)每人训练语句时间﹤2分钟;训练时间﹤1分钟;
(2)在100人左右的系统中,与文本有关的测试正确率100%;
(3)在100人左右的系统中,与文本无关的测试正确率〉95%;
(4)测试语句时间﹤5秒; 测试时间﹤2 秒。
厂房条件建议:
无
备注:
无
技术投资分析:
说话人识别就是用语音信号(待识语音)和预先提取的注册用户特征信息来辨别或确定说话者的身份。本质上讲,说话人识别即对语音信号做模式识别,它由训练(提取说话人特征)和识别(根据待识语音对说话人身份做出判断)两个过程组成。
语音信号中既有说话内容方面的信息,又有关于说话者个人身份的信息——独特的声道特性和发音特点等使其语音具有区别于他人的特征,这是说话人识别的基本依据。
为能在实时性和识别率间取得一种平衡,上海大学通信学院电子系提出了一种改进的高斯混合模型(GMM), 在训练时间上,改进的GMM训练速度的大幅提高,而且识别率仍优于传统的GMM。在与文本无关的方式下,说话人辨认的正确率达到90%以上,说话人确认的等错误率小于5%。
技术的应用领域前景分析:
在通信领域、办公室自动化、保安、军事、网络以及金融应用中的私钥等。
效益分析:
主要技术性能指标:
(1)每人训练语句时间﹤2分钟;训练时间﹤1分钟;
(2)在100人左右的系统中,与文本有关的测试正确率100%;
(3)在100人左右的系统中,与文本无关的测试正确率〉95%;
(4)测试语句时间﹤5秒; 测试时间﹤2 秒。
厂房条件建议:
无
备注:
无