“Hey Siri,講個笑話”,相信許多iPhone用戶都嘗試過這樣與蘋果的智能語音助手Siri對話,但在未來,大家與Siri聊天時可能就要換一個詞了。日前有消息顯示,蘋果方面計劃將智能語音助理Siri的喚醒詞從“Hey Siri”簡化為“Siri”,這一變化預(yù)計將在2023年某個時候或2024年推出,同時蘋果正在將Siri整合至第三方APP,來為用戶提供更多語境和幫助。
作為蘋果推出的智能語音助手,早在2011年就已亮相的Siri,無疑是這十余年來手機廠商在AI領(lǐng)域探索的代表之一。別看蘋果未來僅僅只是去掉了“Hey”這個單詞,但這一微小變化的背后卻代表著蘋果AI技術(shù)的長足進步,同時也意味著蘋果在智能語音助手領(lǐng)域已經(jīng)追上了競爭對手亞馬遜的腳步。畢竟在很長一段時間里,盡管作為智能語音助手領(lǐng)域的先行者,Siri卻一直被用戶吐槽“有點蠢”、“不智能”。
【資料圖】
從“Hey Siri”到“Siri”,反映的是蘋果在語音識別技術(shù)上有了重大的突破。就像每個人都有自己的名字一樣,智能語音助手其實也需要特定的詞匯來讓它知道用戶是在喊自己。從某種程度上來說,喚醒詞同時也是智能語音助手品牌形象的一大組成部分,通過每一次激活語音助手時說出的喚醒詞,消費者關(guān)于這個品牌的記憶就在這樣日復(fù)一日的復(fù)讀中不斷被強化。
那么為什么智能語音助手一定需求一個喚醒詞呢?這是因為智能語音助手如今還不可能24小時時刻保持在線狀態(tài),需要保證只有在用戶需要時才進入工作狀態(tài),其他時間則保持休眠。相比于按專屬按鍵喚醒、點擊圖標喚醒這類觸摸喚醒機制,使用特定的喚醒詞來激活智能語音助手,也更契合這一產(chǎn)品的特質(zhì)。
語音喚醒被稱之為keyword spotting(下文簡稱為KWS),即在連續(xù)語流中實時檢測出說話人的特定片段,而這個特定片段就是喚醒詞。通常來說,如果不是手動禁用語音助手,后者作為系統(tǒng)級服務(wù)會長時間駐留在后臺,然而智能語音助手作為一個需要大量AI算力支撐的功能,在工作狀態(tài)下需要不低的性能開銷,同時也會相應(yīng)的提升功耗。
面對這一問題,開發(fā)者想出的辦法是通過專用于語音喚醒的低功耗協(xié)處理器來實時監(jiān)聽麥克風(fēng),一旦監(jiān)聽到類似“Hey Siri”、“小愛同學(xué)”、“Hey Google”這類關(guān)鍵喚醒詞時,就會將語音助手從休眠狀態(tài)轉(zhuǎn)換到工作狀態(tài)。這個策略的好處除了降低對設(shè)備的續(xù)航壓力外,也會避免一直處于工作狀態(tài)的語音助手,處理并不是發(fā)送給自己的音頻信息。
其實語音喚醒的難點,主要就是低功耗與用戶臨時需求之間的矛盾,一個既能有效喚醒語音助手,又不至于讓系統(tǒng)誤判的喚醒詞也是整個KWS機制的核心。大家想必已經(jīng)發(fā)現(xiàn),目前國內(nèi)市場的智能語音助手喚醒詞往往是4個字,比如“天貓精靈”、“小愛同學(xué)”、“小度小度”。這是由于漢語發(fā)音與音節(jié)的關(guān)系,大家可以簡單的把字數(shù)理解為音節(jié)。
為什么喚醒詞普遍是4音節(jié),而不是中國人更習(xí)慣的3音節(jié)或2音節(jié)?這是因為音節(jié)越短,誤喚醒的問題就會越嚴重,可如果音節(jié)再長,就從短語變成了句子,會降低用戶的交流體驗。同理,“Hey”作為一個英文語氣詞,就像在中文語境中使用“你好”一樣,是為了增加喚醒詞的音節(jié),讓系統(tǒng)能更準確的判斷監(jiān)聽到的聲音到底是對誰說的。
反過來說,省略掉“Hey”就意味著蘋果的KWS技術(shù)有了巨大的進步,已經(jīng)能夠?qū)崿F(xiàn)只需要一個單詞即可判斷用戶意圖的水平。之所以能夠?qū)崿F(xiàn)這一效果,技術(shù)原理其實并不復(fù)雜,蘋果方面大概率是利用聲紋識別技術(shù)實現(xiàn)定向人聲分離,再通過卷積神經(jīng)網(wǎng)絡(luò)搭配聲紋識別編碼器,在復(fù)雜的聲學(xué)環(huán)境下準確捕捉到目標用戶的聲音。
到目前為止,谷歌相關(guān)設(shè)備依然需要通過“OK Google”與“Hey Google”來喚醒Google Assistant,其中一個很重要的原因,就是“Google”一詞本身由于谷歌已經(jīng)深入到了用戶的日常生活中,所以并不算冷門,只有這個詞作為喚醒Google Assistant的“鑰匙”,會不可避免的導(dǎo)致頻繁誤喚醒。作為對比,Siri這個被生造出來的詞匯適用范圍就很窄了,iPhone只需監(jiān)聽到契合“Siri”發(fā)音的聲紋,即可判斷用戶有使用智能語音助手的需求。
并且值得一提的是,據(jù)悉蘋果還計劃允許Siri與第三方應(yīng)用結(jié)合,而這對于Siri的易用性將有著極大的促進作用。要知道,此前曾有前Siri團隊的成員表示,領(lǐng)導(dǎo)力的缺乏和管理層的不斷變化拖累了Siri前進的腳步,其中最關(guān)鍵的原因,就是蘋果方面一直以來堅持的封閉模式并沒有對Siri破例,也未能讓第三方開發(fā)者有更多機會創(chuàng)造更多有用的Siri應(yīng)用。
在Siri還沒有被登錄iPhone或被收購前,其創(chuàng)始團隊的預(yù)想其實是希望能夠擁有一個第三方的開發(fā)生態(tài),而這一點也被后來的一眾智能語音助手陸續(xù)實現(xiàn)。比如說,最初Siri被希望實現(xiàn)的預(yù)約餐飲功能,是包含著日期、地點、菜品等多方位要素,而非簡單地搜索一個餐廳的訂餐電話。
未來Siri能夠接入第三方應(yīng)用,也就意味著蘋果的智能語音助手可以借助第三方的力量,來為自己賦予更多的功能、完成更多的任務(wù)。如果這一消息屬實,也就意味著在被忽視了多年后,Siri或許將要雄起了。
【本文圖片來自網(wǎng)絡(luò)】
關(guān)鍵詞: 工作狀態(tài) 能夠?qū)崿F(xiàn) 語音識別
- 從“Hey Siri”到“Siri”這一小步,是蘋果語音識別的一大步
- 世界速讀:注意!科力爾:蔣耀鋼計劃減持公司股份不超過15.4萬股
- 天天速讀:日盈電子:擬非公開增發(fā)募資不超過約3.98億元
- 快看:萊寶高科:目前柔性顯示產(chǎn)品主要與電子紙顯示屏配套使用,銷售收入占比不足1%
- 天天信息:匯金通:預(yù)中標國家電網(wǎng)約1.42億元采購項目
- *ST星星:因年報造假 收到行政處罰及市場禁入事先告知書
- 當前熱文:2022成馬全馬項目鳴槍起跑
- 古今對話,詩意盎然,成都這個公園有場浸入式戲劇上演
- 世界新資訊:四川昨日新增省內(nèi)感染者521例
- 全球關(guān)注:美國高科技企業(yè)內(nèi)外交困 扎堆裁員并非偶然
- 全球微資訊!美媒:美今年至少32名跨性別者遇害
- 環(huán)球要聞:美國北達科他州發(fā)生槍擊事件 致2人死亡
- “氫”電融合 氫儲能氫發(fā)電助力工業(yè)減碳
- 世界視點!國產(chǎn)口服新冠藥阿茲夫定片被叫停線上零售
- 世界速訊:國防部回應(yīng)中美防長是否舉行會談
- 今日報丨一女子在公廁被毆打致輕傷二級以上 嫌犯被逮捕
- 長慶油田、涪陵頁巖氣田全力增儲穩(wěn)產(chǎn)
- 世界報道:特定養(yǎng)老儲蓄試點正式啟動 5市發(fā)行首批特定產(chǎn)品
- 每日訊息!山東“90后”扎刻青年的“竹條人生” 榫卯之間顯匠心傳承
- “全國一張網(wǎng)”打通區(qū)域梗阻 日輸氣量超6億立方米
- 低碳菜單引領(lǐng)寧波餐飲消費新風(fēng)尚 試點將持續(xù)至今
- 深圳坪山打造餐飲服務(wù)食品安全示范高地 嚴守食品
- 黑龍江哈爾濱推出“沙盒”監(jiān)管新模式 激發(fā)市場活
- 第三季度全國消協(xié)受理投訴數(shù)量同比增10.02% 食品
- 北京懷柔對機動車檢測機構(gòu)開展監(jiān)督抽查 規(guī)范機動
- 天津北辰扎實做好價格監(jiān)管工作 維護安全有序市場
- 北京石景山開展冬季供暖前特種設(shè)備安全專項檢查
- 陜西延安:開展兒童化妝品專項檢查 規(guī)范化妝品市
- 北京海淀開展商品條碼專項監(jiān)督檢查 努力打造穩(wěn)定
- 金華推進網(wǎng)絡(luò)直播營銷治理顯成效 培育放心消費直
- 1 從“Hey Siri”到“Siri”這一小步,是蘋果語音識
- 2 世界速讀:注意!科力爾:蔣耀鋼計劃減持公司股份不
- 3 天天速讀:日盈電子:擬非公開增發(fā)募資不超過約3.98
- 4 快看:萊寶高科:目前柔性顯示產(chǎn)品主要與電子紙顯示
- 5 天天信息:匯金通:預(yù)中標國家電網(wǎng)約1.42億元采購項目
- 6 *ST星星:因年報造假 收到行政處罰及市場禁入事先
- 7 當前熱文:2022成馬全馬項目鳴槍起跑
- 8 古今對話,詩意盎然,成都這個公園有場浸入式戲劇上
- 9 世界新資訊:四川昨日新增省內(nèi)感染者521例
- 10 全球關(guān)注:美國高科技企業(yè)內(nèi)外交困 扎堆裁員并非偶