咳兩聲就能鎖定新冠！MIT收集20萬咳嗽樣本，用AI辨別無症狀感染者，準確率100%...

時間 2021-06-09 標籤網絡人工智能深度學習機器學習大數據

來源：大數據文摘

本文約2700字，建議閱讀8分鐘

最近發表在《IEEE醫學與生物學工程學雜誌》上的一篇論文中，麻省理工學院的研究人員表示，他們已經開發出可以識別COVID-19感染者咳嗽聲的AI。

10月25日，喀什地區疏附縣24日發現1例新冠肺炎無症狀感染者後，新疆迅速對其密切接觸者、密切接觸者的接觸者進行核酸檢測，截至10月25日14時，檢測出137人呈陽性，經專家診斷，均爲無症狀感染者。

後疫情時代，無症狀感染者正成爲疫情復發最大的威脅。沒有任何胸悶發熱症狀，你和同伴可能很難區分是否感染了新冠。

但人工智能可以，只要你給TA聽聽你的咳嗽聲。

在最近發表在《IEEE醫學與生物學工程學雜誌》上的一篇論文中，麻省理工學院的研究人員表示，他們已經開發出可以識別COVID-19感染者咳嗽聲的AI。

論文地址：

https://www.embs.org/ojemb/articles/covid-19-artificial-intelligence-diagnosis-using-only-cough-recordings/

據論文顯示，研究小組開發了一種AI模型，該模型通過分析你的咳嗽錄音，可以將無症狀感染者與健康的人區分開來。所有人都可以通過網絡瀏覽器以及手機和筆記本電腦等設備自願提交的錄音。

研究人員稱，該模型由他們一直以來進行的「咳嗽檢測阿爾茲海默早期症狀」演變而來，疫情以來，研究者通過「網絡衆籌」的方式，已經在全球蒐集了20多萬的咳嗽樣本，建立了有史以來最大的「咳嗽數據庫」。

通過這些咳嗽樣本和錄入的相關感染、性別、情緒數據，對該模型進行了聲音訓練。

目前，該模型識別出確診爲Covid-19的人的咳嗽的準確率爲98.5％，其中，利用咳嗽聲識別無症狀感染者的準確度高達100％。

麻省理工的研究小組正在努力將該模型整合到一個用戶友好的應用程序中，如果獲得FDA的批准並被大規模採用，該程序將有可能成爲一種免費、便捷、無創的預篩查工具，以識別可能對Covid-19無症狀的人。

用戶可以每天登錄，錄下咳嗽聲到他們的手機中，並立即獲得有關他們是否可能被感染的信息。

麻省理工學院自動識別實驗室的研究科學家布萊恩·蘇比拉納（Brian Subirana）與麻省理工學院自動ID實驗室的Jordi Laguarta和Ferran Hueto聯合完成了這項研究。

從阿茲海默症檢測到新冠檢測

其實這項算法並非爲新冠定製。

早在疫情爆發之前，這個研究小組已經在咳嗽的手機錄音中訓練算法，以準確診斷肺炎和哮喘等疾病。麻省理工學院的團隊正在以類似的方式開發AI模型，以分析強迫咳嗽記錄，以查看它們是否可以檢測出阿爾茨海默氏症的體徵，這種疾病不僅與記憶力下降有關，而且還與神經肌肉退化（如聲帶減弱）有關。

他們首先訓練了一種通用的機器學習算法或稱爲ResNet50的神經網絡，以區分與不同聲帶強度相關的聲音。研究表明，聲音「 mmmm」的質量可以表明一個人的聲帶有多弱。Subirana在包含了1000多個小時語音的有聲讀物數據集上訓練了神經網絡，以從「 the」和「 then」等其他詞中挑選出「 them」一詞。

該小組訓練了第二個神經網絡來區分言語中明顯的情緒狀態，因爲已證明阿爾茨海默氏症患者以及神經系統較弱的人表現出某些情緒，例如沮喪或平淡無奇，比他們表達快樂還是冷靜的情緒更高。

研究人員通過在大型演員數據集上訓練情緒情感分類器（例如中性，平靜，快樂和悲傷）來開發情緒語音分類器模型。

然後，研究人員在咳嗽數據庫上訓練了第三個神經網絡，以辨別肺和呼吸功能的變化。

最後，該團隊將這三個模型結合在一起，併疊加了一種算法來檢測肌肉退化。該算法通過實質上模擬音頻蒙版或噪聲層，並區分強咳嗽（通過噪聲可以聽到的咳嗽）與較弱的咳嗽，來做到這一點。

通過新的AI框架，該團隊提供了包括阿爾茨海默氏症患者在內的音頻記錄，發現與現有模型相比，它可以更好地識別阿爾茨海默氏症的樣本。

結果表明，聲帶強度、情緒、肺和呼吸功能以及肌肉退化是診斷該疾病的有效生物標誌物。

當冠狀病毒大流行開始蔓延時，Subirana想知道他們針對阿爾茨海默氏症的AI框架是否也可以用於診斷Covid-19，因爲越來越多的證據表明感染的患者會經歷一些類似的神經系統症狀，例如暫時性神經肌肉損傷。

「說話和咳嗽的聲音都受到聲帶和周圍器官的影響。這意味着當講話時，部分講話就像是咳嗽，反之亦然。這也意味着我們很容易從流利的言語中衍生出一些東西，人工智能可以簡單地從咳嗽中發現一些信息，包括人的性別、母語甚至情緒狀態。實際上，您的咳嗽中蘊含着情感。」 Subirana說。

「所以我們認爲，爲什麼我們不嘗試探究這些阿茲海默症的生物標誌物（以及看它們是否與Covid相關）」。

20萬+咳嗽樣本，已知最大的咳嗽研究數據集

在4月，研究小組着手收集儘可能多的咳嗽記錄，包括來自Covid-19患者的咳嗽記錄。

他們建立了一個網站，人們可以通過手機或其他支持網絡的設備記錄一系列咳嗽。參與者還填寫了他們正在經歷的症狀的調查表，無論他們是否患有Covid-19，是否通過官方測試，通過醫生對其症狀的評估或是否經過自我診斷而得到了診斷。他們還可以記錄自己的性別，地理位置和母語。

迄今爲止，研究人員已經收集了70,000多條錄音，每條錄音包含多個咳嗽聲，總計約200,000咳嗽音頻樣本，Subirana說這是「已知最大的咳嗽研究數據集」。確認患有Covid-19的人（包括無症狀的人）提交了大約2500份錄音。

該團隊使用了2,500個與Covid相關的記錄，以及他們從集合中隨機選擇的另外2500個記錄來平衡數據集。他們使用了4,000個樣本來訓練AI模型。然後將其餘的1,000個記錄輸入模型中，以查看它能否準確區分出Covid患者和健康個體的咳嗽。

令人驚訝的是，正如研究人員在論文中所寫的那樣，他們的努力揭示了「阿爾茨海默氏症和新冠咳嗽算法之間驚人的相似之處」。

他們發現，在原本用於阿爾茨海默氏症的AI框架內無需進行大量調整，他們就能找到針對Covid-19的四種生物標誌物的模式-聲帶強度、情緒、肺和呼吸功能以及肌肉退化。該模型從Covid-19確診的人中識別出98.5％的咳嗽，並準確地檢測到了所有無症狀的咳嗽。

Subirana說：「我們認爲這表明，即使您沒有症狀，當您擁有Covid時，您產生聲音的方式也會改變。」

100%檢測到無症狀感染者

Subirana強調，這種AI模型的優勢不在於檢測有症狀的新冠患者，不管他們的症狀是由於Covid-19還是其他症狀（如流感或哮喘）引起的。該工具的優勢在於它能夠分辨無症狀新冠感染者的咳嗽和健康的咳嗽。

MIT的團隊正在與一家公司合作，根據他們的AI模型開發免費的預檢應用程序。他們還與世界各地的多家醫院合作，收集更大，更多樣化的咳嗽記錄集，這將有助於訓練和增強模型的準確性。

正如他們在論文中提出的那樣，「如果預篩查工具始終在後臺並且不斷改進，那麼氾濫症就可能成爲過去。」

最終，他們設想可以將他們開發的音頻AI模型集成到智能揚聲器和其他聽音設備中，以便人們可以方便地（也許每天）對他們的疾病風險進行初步評估。

相關鏈接：

https://news.mit.edu/2020/covid-19-cough-cellphone-detection-1029

https://techcrunch.com/2020/10/30/cough-scrutinizing-ai-shows-major-promise-as-an-early-warning-system-for-covid-19/

https://www.engadget.com/ai-covid-19-cough-detection-from-recordings-213858299.html

編輯：王菁

校對：林亦霖