日前,OpenASR國際低資源多語種語音識別挑戰(zhàn)賽落下帷幕,科大訊飛-中科大語音及語言信息處理國家工程實驗室聯(lián)合團(tuán)隊參加了所有15個語種受限賽道和7個語種非受限賽道,全部取得第一。
繼前不久榮獲多語言理解評測XTREME冠軍之后,科大訊飛在多語種領(lǐng)域再次取得突破,在探索人機(jī)交互更自然、人人溝通無障礙的征程中又邁出了堅實的一步。
近年來,隨著深度學(xué)習(xí)技術(shù)的進(jìn)步,漢語、英語等大語種語音識別技術(shù)日趨成熟,并獲得廣泛的應(yīng)用。相比之下,小語種語音識別因其語音數(shù)據(jù)資源難以獲取、難以標(biāo)注、難以評估、語言專家稀缺等原因,已經(jīng)成為世界性的研究難題,距離實用門檻仍有較大差距。
OpenASR挑戰(zhàn)賽更加關(guān)注小語種語音技術(shù),探索如何使用少量的數(shù)據(jù)達(dá)到較好的效果,同時考察低資源語音識別基礎(chǔ)算法在多個語種上的推廣性。本次比賽共包含15個語種,涵蓋受限賽道、受限附加賽道和非受限賽道。科大訊飛-中科大聯(lián)合團(tuán)隊在比賽中提出了基于語音和文本統(tǒng)一空間表達(dá)的半監(jiān)督語音識別框架(Unified Spatial Representation Semi-supervised ASR,USRS-ASR),獲此佳績也驗證了該算法良好的推廣性。
對于低資源語種而言,除了語音數(shù)據(jù)量較小外,其發(fā)音詞典大小、語料豐富性、標(biāo)注準(zhǔn)確度都遠(yuǎn)不及常規(guī)水平。科大訊飛-中科大聯(lián)合團(tuán)隊創(chuàng)新運(yùn)用Flow-TTS語音合成進(jìn)行訓(xùn)練數(shù)據(jù)擴(kuò)增,并使用語音屬性解耦技術(shù)保證合成語音的多樣性。結(jié)果顯示,使用上述無監(jiān)督數(shù)據(jù)擴(kuò)增方案,能夠穩(wěn)定、顯著地提升低資源語音識別任務(wù)的效果。
為了在端到端統(tǒng)一框架下,充分使用少量語音數(shù)據(jù)和海量文本數(shù)據(jù),科大訊飛-中科大聯(lián)合團(tuán)隊提出了基于語音和文本統(tǒng)一空間表達(dá)的半監(jiān)督語音識別框架USRS-ASR。對于海量文本數(shù)據(jù)的使用,創(chuàng)新設(shè)計了文本掩碼語言模型任務(wù)、合成數(shù)據(jù)語音識別兩個目標(biāo),兩個任務(wù)聯(lián)合訓(xùn)練以充分利用海量無監(jiān)督文本;同時設(shè)計了共享語言解碼模塊,實現(xiàn)了語音和文本隱層表達(dá)空間的統(tǒng)一,大大緩解了低資源語種的數(shù)據(jù)稀疏問題。
不久前,工信部正式批復(fù)同意成立國家智能語音創(chuàng)新中心、國家高端智能化家用電器創(chuàng)新中心,值得注意的是,在這兩家國家級創(chuàng)新中心依托公司的股東名單中,“科大訊飛”均在列。
據(jù)介紹,經(jīng)過多年的技術(shù)積累,除了中英以外,科大訊飛還具備了 69種語言的語音識別能力,并已在新加坡、俄羅斯、印度、日本等國家部署了海外站點,為各地開發(fā)者提供語音識別、語音合成、機(jī)器翻譯、圖文識別等語音語言服務(wù),所有服務(wù)均在科大訊飛開放平臺開放。
科大訊飛表示,下一步將繼續(xù)堅持源頭核心技術(shù)創(chuàng)新,聯(lián)合國內(nèi)眾多研究機(jī)構(gòu)與企業(yè),構(gòu)建多語言技術(shù)的系統(tǒng)性創(chuàng)新研發(fā)生態(tài),共同推動我國多語言技術(shù)進(jìn)步與應(yīng)用落地。
免責(zé)聲明:市場有風(fēng)險,選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。
- 中了,2600萬!鴻雁成功拿下成都軌交30號線一期配電箱項目
- 五一植發(fā)熱潮將至,中德植發(fā)專家提醒植發(fā)需謹(jǐn)慎
- 廣州眾城【上葉藍(lán)莓葉做新生代健康茶飲料】
- 方太攜手國家航天院所,以航天同源科技高能氣泡洗引領(lǐng)廚房創(chuàng)新
- 望古唐網(wǎng)絡(luò)科技BOOS聯(lián)盟進(jìn)軍短視頻帶貨平臺
- 思之敢響,聲之敢為|“敢響”2022成都時尚消費(fèi)影響力盛典現(xiàn)場直擊
- 發(fā)力蛋制品 勁仔食品小蛋圓圓鵪鶉蛋入圍iSEE全球創(chuàng)新品牌百強(qiáng)榜
- 新捷途X70S顏值與實力全面升級,將于4月29日發(fā)布預(yù)售
- 奶茶行業(yè)品牌多、競爭大 冰雪時光靠什么贏得掌聲?
- 千千惠生活全國上線“隨心退”功能,消費(fèi)者可無條件隨時退款
- 杭州臨平區(qū):創(chuàng)建市場疫情防控“三色”預(yù)警分類管理機(jī)制 動態(tài)防控監(jiān)測預(yù)警
- 海南開展防止一次性不可降解塑料制品入島聯(lián)合執(zhí)法行動 對當(dāng)事人立案調(diào)查
- 河北保定市場監(jiān)管局創(chuàng)新應(yīng)用信用分級分類監(jiān)管 提升監(jiān)管效能助力營商環(huán)境優(yōu)化
- 原料新鮮 用料扎實 冰雪時光穩(wěn)扎茶飲下沉市場
- 陜西省市場監(jiān)管局連續(xù)三年榮獲平安陜西建設(shè)先進(jìn)集體 充分發(fā)揮市場監(jiān)管職能優(yōu)勢
- 浙江杭州:西湖食品安全風(fēng)險綜合治理中心掛牌成立 健全機(jī)制規(guī)范運(yùn)行為
- 湖北恩施州鶴峰縣市場監(jiān)管局開展進(jìn)口水果排查專項行動 加強(qiáng)宣傳引導(dǎo)
- 寧夏青銅峽市場監(jiān)管局:擰緊節(jié)日食藥“安全閥” 確保節(jié)日期間市場安全穩(wěn)定
- 北京東城對轄區(qū)旅游客運(yùn)企業(yè)開展專項聯(lián)合檢 營造和諧市場環(huán)境
- 安徽開展專項執(zhí)法查處濫用行政權(quán)力行為 共同營造公平競爭良好社會環(huán)境

- 杭州臨平區(qū):創(chuàng)建市場疫情防控“三色”預(yù)警分類管理
- 海南開展防止一次性不可降解塑料制品入島聯(lián)合執(zhí)法行
- 河北保定市場監(jiān)管局創(chuàng)新應(yīng)用信用分級分類監(jiān)管 提
- 陜西省市場監(jiān)管局連續(xù)三年榮獲平安陜西建設(shè)先進(jìn)集體
- 浙江杭州:西湖食品安全風(fēng)險綜合治理中心掛牌成立
- 湖北恩施州鶴峰縣市場監(jiān)管局開展進(jìn)口水果排查專項行
- 寧夏青銅峽市場監(jiān)管局:擰緊節(jié)日食藥“安全閥” 確
- 北京東城對轄區(qū)旅游客運(yùn)企業(yè)開展專項聯(lián)合檢 營造和
- 安徽開展專項執(zhí)法查處濫用行政權(quán)力行為 共同營造公
- 安徽啟動2022年春茶地理標(biāo)志保護(hù)專項行動 促進(jìn)茶產(chǎn)
- 1 中了,2600萬!鴻雁成功拿下成都軌交30號線一期配電
- 2 五一植發(fā)熱潮將至,中德植發(fā)專家提醒植發(fā)需謹(jǐn)慎
- 3 廣州眾城【上葉藍(lán)莓葉做新生代健康茶飲料】
- 4 方太攜手國家航天院所,以航天同源科技高能氣泡洗引
- 5 望古唐網(wǎng)絡(luò)科技BOOS聯(lián)盟進(jìn)軍短視頻帶貨平臺
- 6 思之敢響,聲之敢為|“敢響”2022成都時尚消費(fèi)影響
- 7 發(fā)力蛋制品 勁仔食品小蛋圓圓鵪鶉蛋入圍iSEE全球創(chuàng)
- 8 新捷途X70S顏值與實力全面升級,將于4月29日發(fā)布預(yù)售
- 9 奶茶行業(yè)品牌多、競爭大 冰雪時光靠什么贏得掌聲?
- 10 千千惠生活全國上線“隨心退”功能,消費(fèi)者可無條件