首頁>資訊 >
【全球獨家】最前線|人工智能可通過30秒語音評估抑郁癥——宇音數(shù)康、岳偉華課題組合作開發(fā)數(shù)字診斷項目 2022-12-20 07:41:13  來源:36氪

隨著疫情對公眾心理健康造成了一系列負面影響,抑郁癥正在成為一種社會性心理問題。


【資料圖】

數(shù)據(jù)顯示,全球有10億人正在受到精神心理問題的困擾,其中抑郁癥是非致命健康損失的最大誘因之一。作為一種會給患者及其家屬帶來巨大痛苦的常見精神障礙,抑郁癥患者常常表現(xiàn)出缺乏興趣、回避社交、精力流失使得完成工作學習任務困難等狀態(tài)。除了情緒變化,抑郁癥患者還會表現(xiàn)出一系列生物學癥狀,包括以早醒為特征的睡眠障礙、晝夜情緒變化、食欲改變等。

WHO(世界衛(wèi)生組織)報告稱,全球估計有超過3億人患有抑郁癥,平均發(fā)病率為4.4%,而抑郁癥的終生患病率在中國則高達6.8%。此外,到了2030年,抑郁癥將會成為全球第一大疾病負擔。

然而不幸的是,由于大眾對抑郁癥的認知缺乏和污名化,許多人存在病恥感,排斥尋求幫助。同時,由于醫(yī)療可及性等因素,大量患者正在遭受誤診、或無法獲得所需的幫助。其中,當抑郁癥患者較年長時,所帶來的個人負面影響和家庭負擔更為嚴重。老年抑郁癥患者的誤診率更高,獲得足夠支持的機會也更低。因此,如何幫助抑郁癥患者更加方便、精準地獲得心理健康評估、檢測及監(jiān)測,成為了近年來的研究熱點。

傳統(tǒng)的抑郁癥診斷是通過受過專業(yè)培訓的精神科醫(yī)生對患者進行訪談和觀察,根據(jù)診斷標準評估患者是否患有抑郁癥。而在國內(nèi),精神科醫(yī)生的短缺使得有效識別抑郁癥變得更加困難。2017年,中國約有2.7萬名精神科醫(yī)生,平均每10萬人口2名精神科醫(yī)生。世衛(wèi)組織數(shù)據(jù)顯示,俄羅斯和美國的這一比例分別為每10萬人口11名和12名精神科醫(yī)生,盡管到2020年,全國精神科執(zhí)業(yè)(助理)醫(yī)師數(shù)量增加到4萬名,但面對中國龐大的人口基數(shù),目前抑郁癥的診斷仍存在較大的挑戰(zhàn)。

這一診斷方式導致了:患者對癥狀嚴重程度的不自知、隱瞞病情等問題,經(jīng)常會混淆診斷。而研究表明,成功的抑郁癥篩查和監(jiān)測可以提供更早的診斷和更精細的治療,這可能有助于改善嚴重抑郁癥的預后。

近年來,基于移動端的AI技術(shù)和可穿戴設備,對生理和心理數(shù)據(jù)進行無創(chuàng)和連續(xù)監(jiān)測產(chǎn)生了巨大的作用。同時,語義識別、機器翻譯等技術(shù)也已經(jīng)逐漸成熟。聲學和語音命令處理方面的進步,使得機器學習成為了健康診斷的新興領域。

語音的產(chǎn)生是一個復雜的神經(jīng)肌肉協(xié)調(diào)過程。肺部氣流經(jīng)由聲門帶動聲帶震動,并通過聲道的共鳴、諧振從而發(fā)出聲音。語音中攜帶了聲學、語言、情感等復雜信息。幾十年來的過往研究表明,抑郁癥患者在語言方面會表現(xiàn)出重音減輕、單調(diào)、響度衰減等現(xiàn)象,這些是由抑郁癥造成的實質(zhì)性改變引起的。

目前,一系列聲學特征已被確定為抑郁癥的預測因素,例如語音中的聲源特征、頻譜及韻律特征等。機器學習能夠從語音中捕獲人耳很難甚至無法感知但客觀存在的聲學特征變化,這一語音技術(shù)也在檢測抑郁癥等精神障礙方面表現(xiàn)出了可觀的潛力。

回歸到國內(nèi)研究領域,2019年開始,北京大學第六醫(yī)院的岳偉華教授課題組與語音人工智能科技公司「宇音數(shù)康」進行合作,開啟了利用語音進行抑郁癥篩查評估的合作研究項目。在經(jīng)歷了研究設計、倫理審查、數(shù)據(jù)收集、技術(shù)研發(fā)等階段后,目前該項目已經(jīng)進入了相關(guān)臨床研究。

今年11月該項目組在《Frontiers in Psychiatry》發(fā)表了一篇臨床研究論文,其基于純語音信號處理的深度學習模型,可通過基于智能手機約30秒的語音進行抑郁癥評估,且達到了82.14%的靈敏度和80.65%的特異性。即使在研究中采用了更高的對標標準(采用與精神科醫(yī)師的DSM-5診斷結(jié)果對比,而歐美研究普遍采用與自測量表結(jié)果對比),該模型在臨床研究中的性能仍超過了目前歐美相關(guān)企業(yè)的數(shù)值表現(xiàn)。

技術(shù)合作方「宇音數(shù)康」是一家語音人工智能科技公司,致力于通過自研的語音生物標記識別技術(shù)與AI平臺,為精神心理健康領域提供智能、專業(yè)、可規(guī)?;暮Y查、監(jiān)測及干預解決方案。

“語音AI科技能夠幫助人類進行高精度的、非侵入性的心理疾病檢測?!?/p>

「宇音數(shù)康」聯(lián)合創(chuàng)始人兼首席醫(yī)療官何恭誠表示,得益于NMPA和FDA對人工智能醫(yī)療器械(SaMD)和數(shù)字療法(DTx)的支持,語音生物標記識別領域的技術(shù)正在顛覆此前“敏感”、“主觀”的精神心理產(chǎn)業(yè)。

該項目的語音模型在43000條臨床音頻會話組成的數(shù)據(jù)集上進行深度學習訓練而得,并在獨立驗證集上進行測試與臨床研究。所有患者會話均采集自精神科醫(yī)生按照DSM-5國際標準進行診斷的患者,通過不同智能手機在不同環(huán)境中收集并錄音。

“這有可能是目前世界上相關(guān)領域內(nèi)最高質(zhì)量的數(shù)據(jù)集?!?/p>

何恭誠告訴36氪,從技術(shù)迭代來看,該項目為利用深度學習技術(shù)快速識別和診斷抑郁癥提供了一種新方法,并證明了從原始語音信號中提取的聲音生物標志物對于抑郁癥的早期評估與篩查具有很高的潛力。

在不久的未來,對于受到抑郁癥等心理問題困擾的人而言,只需要完成30秒左右的語音任務,就可以在私密的環(huán)境中獲得客觀、專業(yè)、便捷的精神心理評估與篩查結(jié)果。

關(guān)鍵詞: 精神科醫(yī)生 人工智能 精神心理

相關(guān)閱讀:
熱點
圖片 圖片