當前位置:首頁 > 關于訊飛 > 新聞中心 > 訊飛動態 > 正文
關于訊飛

喜報丨再次奪冠!科大訊飛包攬第五屆國際多通道語音分離和識別大賽(CHiME-5)全部冠軍

發布時間:2018-09-07 來源: 點擊次數: 打印 作者:

字號:

       北京時間2018年9月7日,國際多通道語音分離和識別大賽(CHiME)組委會在微軟海得拉巴研發中心揭曉了新一屆CHiME-5的比賽結果,科大訊飛團隊再次包攬大賽全部四個項目的冠軍并大幅刷新了各項目的好成績


       CHiME(Computational Hearing in Multisource Environments)屬于國際語音識別評測中的高難度比賽,始辦于2011年,由法國計算機科學與自動化研究所、英國謝菲爾德大學、美國三菱電子研究實驗室等知名研究機構所發起。比賽的目的是希望學術界和工業屆針對高噪聲和混響等現象影響下的實際場景提出全新的語音識別解決方案,以進一步提升語音識別的實用性和普適性,目前CHiME比賽已經舉辦五屆,成為業界影響力大、參賽隊伍多、水平高的多通道噪聲魯棒性語音識別比賽。


       歷屆CHiME比賽的參賽隊伍包括英國劍橋大學、美國卡內基梅隆大學、約翰霍普金斯大學、日本NTT、日立中央研究院、德國RWTH亞琛大學等國際一流高校和研究機構,以及清華大學、中科院聲學所、中科院自動化所、西北工業大學等國內頂尖院校和研究所。



       本屆大賽組委會通過采用4聲道麥克風陣列對20個真實家庭的晚餐進行錄音來形成比賽數據,用以考察和測試在家庭聚會等不同場景中自由交談風格下的遠場語音識別效果。





音頻樣本采集場景

音頻樣本采集場景



       賽事的難點主要來自以下方面

  • 多麥克風陣列的同步錄音

  • 對話風格非常自由、近乎隨意

  • 大量的語音交疊(Speech Overlap)

  • 遠場混響和噪聲干擾對錄音的影響


       在兩年之前的上一屆比賽(CHiME-4)中,科大訊飛就曾通過和國內外知名院校專家、團隊的深入合作和討論,斬獲全部三個項目的桂冠并大幅刷新了各項目歷史好記錄。


       而在本屆比賽中,科大訊飛與中國科學技術大學杜俊教授、西北工業大學陳景東教授、佐治亞理工大學李錦輝教授等國內外知名專家團隊再度攜手。終在單麥克風陣列任務分布式麥克風陣列任務(Rank A)兩種麥克風陣列對應的兩個端到端的語音識別任務(Rank B),共計四項任務中連續兩屆包攬所有項目冠軍,再次大幅刷新各項目的好成績。



各參賽機構詞錯誤率對比(單麥克風陣列 Rank A)



各參賽機構詞錯誤率對比(分布式陣列 Rank A)


各參賽機構詞錯誤率對比(單麥克風陣列 Rank B)


各參賽機構詞錯誤率對比(分布式陣列 Rank B)



       根據比賽前官方數據,基于主流前端系統和深度學習模型下本次比賽的樣本語音識別詞錯誤率(Word Error Rate,WER)高達81.14%,堪稱“史上難語音識別任務"


       而科大訊飛團隊所提交的系統,較官方基線系統將WER降低了絕對35個點,在分布式麥克風陣列任務中,系統的效果甚至超過近講麥克風,這不僅再次證明了科大訊飛在語音識別和多麥克風陣列語音信號處理領域內扎實的基本功和雄厚的實力,也表明了科大訊飛在中文語音識別領域長期保持被追趕地位的同時,英語語音識別領域也達到了同等高度和層次



       此前,在科技部召開的《新一代人工智能發展規劃》暨重大科技項目啟動會會上,國家宣布了首批四家國家新一代人工智能開放創新平臺名單,明確依托科大訊飛建設智能語音國家新一代人工智能開放創新平臺



啟動會現場

       在本次大賽中,科大訊飛所提交的系統在分布式麥克風陣列任務上所取得的優于近講麥克風效果的成績,得到了大賽組辦方的高度贊揚。科大訊飛在智能語音技術方面的雄厚實力得到再次肯定與鞏固,未來,科大訊飛將繼續堅持核心源頭技術研發創新,用AI賦能各行各業。



關 閉
今天新疆时时彩开奖码