首頁(yè)>財(cái)經(jīng) >
持續(xù)突破技術(shù)難點(diǎn),科大訊飛用技術(shù)說(shuō)話傳遞冬奧溫度 2022-02-23 16:39:05  來(lái)源:榕城網(wǎng)

賽事成績(jī)多語(yǔ)種呈現(xiàn),人們跨越語(yǔ)言溝通障礙順暢交流,視障人士可以“聽(tīng)見(jiàn)”文字,聽(tīng)障人士可以“看見(jiàn)”文字……在剛剛閉幕的北京2022年冬奧會(huì)上,作為官方自動(dòng)語(yǔ)音轉(zhuǎn)換與翻譯獨(dú)家供應(yīng)商的科大訊飛,提供了自動(dòng)翻譯和相關(guān)的語(yǔ)音轉(zhuǎn)換、語(yǔ)音識(shí)別及語(yǔ)音合成等硬核技術(shù),助力實(shí)現(xiàn)賽場(chǎng)內(nèi)外的溝通交流無(wú)障礙,一個(gè)溝通無(wú)障礙奧運(yùn)會(huì)如約呈現(xiàn)。

北京冬奧會(huì)與科大訊飛可謂是“一拍即合”,前者匯聚世界不同國(guó)家、不同語(yǔ)言的人群,后者具有面向冬奧場(chǎng)景的多語(yǔ)音、多語(yǔ)言處理關(guān)鍵技術(shù)。早在2019年,科大訊飛就組建了北京2022年冬奧會(huì)和冬殘奧會(huì)示范應(yīng)用專項(xiàng)團(tuán)隊(duì),借助先進(jìn)的機(jī)器翻譯和多語(yǔ)言語(yǔ)音轉(zhuǎn)換技術(shù),圍繞“人和人之間溝通無(wú)障礙、人和組織之間溝通無(wú)障礙、人和賽事之間溝通無(wú)障礙”三大方向,加速應(yīng)用場(chǎng)景落地。

基于智能語(yǔ)音新一代人工智能開(kāi)放創(chuàng)新平臺(tái),科大訊飛研發(fā)定制了具有冬奧特征的多語(yǔ)種語(yǔ)音及語(yǔ)言服務(wù)平臺(tái),可提供面向冬奧場(chǎng)景定制優(yōu)化的語(yǔ)音識(shí)別、語(yǔ)音合成、機(jī)器翻譯、自動(dòng)問(wèn)答等多種核心能力。達(dá)成60個(gè)語(yǔ)種語(yǔ)音合成,69個(gè)語(yǔ)種語(yǔ)音識(shí)別,168個(gè)語(yǔ)種機(jī)器翻譯和3個(gè)語(yǔ)種的交互理解,覆蓋面超過(guò)全球超200個(gè)國(guó)家和地區(qū),同時(shí)還能識(shí)別內(nèi)容進(jìn)行文本書(shū)面化處理。而機(jī)器領(lǐng)域的突破,可支持168種語(yǔ)言的機(jī)器翻譯;自動(dòng)問(wèn)答的多

語(yǔ)種信息獲取及交互技術(shù),可支持中、英、日等3種語(yǔ)言的交互理解。

語(yǔ)言是一門藝術(shù)、一種智慧,也是促進(jìn)世界相知相融的重要工具。北京2022年冬奧會(huì)和冬殘奧會(huì)上,科大訊飛擔(dān)綱官方自動(dòng)語(yǔ)音轉(zhuǎn)換與翻譯獨(dú)家供應(yīng)商,是科技發(fā)展的大勢(shì)所趨,也是自身核心技術(shù)發(fā)展的水到渠成。然而,由于自動(dòng)語(yǔ)音轉(zhuǎn)換與翻譯涉及技術(shù)眾多,難度和挑戰(zhàn)非常大,科大訊飛在為賽事提供技術(shù)支持的過(guò)程中,也遇到了不少難點(diǎn)。

在多語(yǔ)種語(yǔ)音語(yǔ)言技術(shù)研發(fā)領(lǐng)域,由于涉及60多個(gè)語(yǔ)種的語(yǔ)音識(shí)別合成翻譯等技術(shù)研發(fā),除了中英文之外,針對(duì)其他語(yǔ)種(比如瑞典語(yǔ)、波蘭語(yǔ)等)語(yǔ)料比較少的問(wèn)題,通過(guò)源頭核心技術(shù)創(chuàng)新,在端到端建模和無(wú)監(jiān)督、弱監(jiān)督訓(xùn)練方面取得重大突破,例如在多語(yǔ)種語(yǔ)音識(shí)別方面,100小時(shí)有監(jiān)督數(shù)據(jù)加上大量無(wú)標(biāo)簽語(yǔ)音和文本數(shù)據(jù)可以達(dá)到1萬(wàn)小時(shí)有監(jiān)督訓(xùn)練的效果。這項(xiàng)技術(shù)也在OpenASR國(guó)際低資源多語(yǔ)種語(yǔ)音識(shí)別挑戰(zhàn)賽的15個(gè)語(yǔ)種受限賽道和7個(gè)語(yǔ)種非受限賽道系統(tǒng),全部取得第一名的成績(jī)。

在語(yǔ)音同傳技術(shù)實(shí)時(shí)性和效果的平衡上,我們知道,同傳要解決兩個(gè)問(wèn)題,第一是要將語(yǔ)音識(shí)別轉(zhuǎn)寫(xiě)出來(lái),第二是將轉(zhuǎn)寫(xiě)的內(nèi)容翻譯出來(lái),以前這兩個(gè)任務(wù)是單獨(dú)建模先后完成的,現(xiàn)在我們提出“流式的CAAT語(yǔ)音翻譯框架”模型,在一個(gè)模型內(nèi)解決這兩個(gè)問(wèn)題,從而實(shí)現(xiàn)同傳效果的“又快又好”。這些技術(shù)創(chuàng)新,對(duì)于保障冬奧場(chǎng)景下的語(yǔ)音同傳應(yīng)用效果起到非常關(guān)鍵的作用。

在多語(yǔ)種自動(dòng)問(wèn)答中,融合了數(shù)字人生成、語(yǔ)音識(shí)別、語(yǔ)音合成、自然語(yǔ)言理解等多項(xiàng)技術(shù),并結(jié)合FAQ問(wèn)答、文檔集合問(wèn)答、知識(shí)庫(kù)問(wèn)答和基于文本蘊(yùn)含識(shí)別的多源答案驗(yàn)證等技術(shù)進(jìn)行知識(shí)庫(kù)構(gòu)建,最終實(shí)現(xiàn)人們可以和冬奧虛擬志愿者“愛(ài)加”用六種語(yǔ)言自由互動(dòng)交流。

講好中國(guó)故事、傳遞中國(guó)聲音,科大訊飛自創(chuàng)建以來(lái)始終致力于語(yǔ)音及語(yǔ)言、自然語(yǔ)言理解、機(jī)器學(xué)習(xí)推理及自主學(xué)習(xí)等核心技術(shù)研究,在行業(yè)發(fā)展史上樹(shù)立了從“能聽(tīng)會(huì)說(shuō)”到“能理解會(huì)思考”的關(guān)鍵里程碑。此次擔(dān)當(dāng)北京2022冬奧會(huì)和冬殘奧會(huì)官方自動(dòng)語(yǔ)音轉(zhuǎn)換與翻譯獨(dú)家供應(yīng)商,科大訊飛更是不斷攻堅(jiān)克難,突破了多語(yǔ)種語(yǔ)音語(yǔ)言技術(shù)的研發(fā)、語(yǔ)音同傳技術(shù)實(shí)時(shí)性和效果的平衡、多語(yǔ)種智能(自動(dòng))問(wèn)答三大技術(shù)難題,讓多語(yǔ)種交流、同傳又準(zhǔn)、又好、又快,真正實(shí)現(xiàn)了交流無(wú)國(guó)界、溝通無(wú)障礙。讓我們一起,為中國(guó)技術(shù)實(shí)力點(diǎn)贊!

免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片