新聞動態
您現在的位置:首頁 / 新聞動態 / 行業資訊
東芝開發出語音區分技術,可快速區分10余人的聲
點擊次數:2486  更新時間:2014-09-03  【打印此頁】  【關閉
    東芝開發出了可用于會議記錄等的語音區分軟件技術。該軟件技術應用于開會等場合時,可以準確區分出10余人的聲音。軟件可在筆記本電腦及平板終端等移動產品上運行,只要有普通的立體聲麥克風就可以使用。該技術將在2014年9月3~5日于日本札幌市舉行的日本音響學會2014年秋季研究發布會上發布。
 


       此次開發的新技術結合“輸入聲音的特點”和“說話人的方位信息”來區分聲音。利用聲音特點區分聲音時,如果說話的人數增多,聲音的特點會隨之增多,難以區別。東芝為解決該問題設計的方法是結合說話人的方位信息。就是根據多個麥克風所錄音的相位差來推斷說話人所在的方位。根據這一信息來提高分辨的準確度。

       對此,存在的問題是需要特殊指向性的麥克風;推斷方位的處理量大、計算成本高等。另外,由于難以區分位于同一方位的不同說話人,有時也會影響分辨性能。

       為此,東芝此次開發出了使用普通立體聲麥克風的快速且準確的方位推斷算法和不影響分辨性能的組合算法。比如,使用配備Core i7(最大工作頻率為2.7GHz)CPU和4GB主存的個人電腦,普通會議(參與者為10人左右)在錄音結束后5秒左右就能完成分辨處理。分辨成功率(能否準確區分說話人聲音)方面,原方法為50%左右,而新技術達到了70%以上。

       新技術計劃在2014年度內完成。將嵌入到會議記錄輔助軟件等產品中。新技術不含語音轉換(如將內容做成文字數據)功能,所以有可能與該公司的語音識別技術配套提供。
(元器件交易網)
上一篇:谷歌語音搜索更新:支持同時使用五種語言
下一篇:2017年大事件
Copyright © 2018 江蘇南大電子信息技術股份有限公司 版權所有 備案號:蘇ICP備13016868號
全民欢乐捕鱼好玩吗 时时彩官方网 江西时时为何停了 齐鲁风采中奖号码 极速时时控制开奖 im体育是哪个平台 时时做号app 35选72019040期开奖号 时时乐开奖结果走势图 天津时时网页计划 麻将顺口溜 今晚必中 3d彩乐乐网小马哥 为什么一梭哈就输 湖北11选5走势图基本 快三中奖概率计算公式 浙江考试院