北京清華長(zhǎng)庚醫(yī)院12月31日電(通訊員 王亞星)近日,清華大學(xué)副教務(wù)長(zhǎng),清華大學(xué)醫(yī)學(xué)院院長(zhǎng)、講席教授,北京清華長(zhǎng)庚醫(yī)院眼科中心、北京視覺科學(xué)與轉(zhuǎn)化醫(yī)學(xué)研究中心(BERI)知名專家黃天蔭教授,與眼科中心、BERI長(zhǎng)聘副教授王亞星,以及多單位專家團(tuán)隊(duì),基于亞洲人數(shù)據(jù)集,共同發(fā)表了一項(xiàng)關(guān)于基礎(chǔ)模型(Foundation Model)泛化能力的重要研究。
研究結(jié)果表明基礎(chǔ)模型與傳統(tǒng)模型在泛化能力上面臨相似的挑戰(zhàn),尤其是在數(shù)據(jù)多樣化上存在局限性。研究進(jìn)一步指出,在當(dāng)前醫(yī)療基礎(chǔ)模型的開發(fā)中,確保數(shù)據(jù)來源的多樣性以及和推動(dòng)全球范圍的研究協(xié)作是應(yīng)對(duì)這一挑戰(zhàn)的關(guān)鍵。
近年來,基礎(chǔ)模型為醫(yī)學(xué)人工智能的開發(fā)提供了新路徑。傳統(tǒng)醫(yī)學(xué)人工智能模型構(gòu)建通常面臨數(shù)據(jù)收集量大、標(biāo)注成本高的難題,而基礎(chǔ)模型在大量無標(biāo)注數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,可微調(diào)后適用于各類下游任務(wù),無需從頭訓(xùn)練。此前發(fā)表在《Nature》(《自然》)上的RETFound是此類模型代表,然而,這類基礎(chǔ)模型是否能夠真正適用于其他人口群體仍不明確。
該研究基于亞洲人群數(shù)據(jù),從青光眼診斷、冠心病診斷,及三年內(nèi)腦卒中風(fēng)險(xiǎn)預(yù)測(cè)三項(xiàng)任務(wù)出發(fā),研究了基礎(chǔ)模型在不同群體中的適用性。研究團(tuán)隊(duì)選取基于大規(guī)模視網(wǎng)膜圖像預(yù)訓(xùn)練的RETFound 基礎(chǔ)模型和傳統(tǒng)的Vision Transformer模型(在ImageNet上進(jìn)行預(yù)訓(xùn)練)進(jìn)行比較,以評(píng)估其在亞洲數(shù)據(jù)上的表現(xiàn)(如下圖所示)。
結(jié)果顯示,當(dāng)使用完整數(shù)據(jù)集微調(diào)時(shí),RETFound并未在性能上超越傳統(tǒng)Vision Transformer。無論是在青光眼診斷、冠心病診斷還是中風(fēng)風(fēng)險(xiǎn)預(yù)測(cè)中,兩者的表現(xiàn)差異均無統(tǒng)計(jì)學(xué)顯著性(P≥0.2)。在僅使用不超過完整數(shù)據(jù)集25%的數(shù)據(jù)進(jìn)行微調(diào)時(shí),RETFound具有微弱優(yōu)勢(shì),AUC最高提升0.03,但同樣無統(tǒng)計(jì)學(xué)顯著性。
該研究進(jìn)一步表明,盡管RETFound模型整體潛力較強(qiáng),若要在特定人群與場(chǎng)景下實(shí)現(xiàn)理想效果,仍需更豐富、多元的訓(xùn)練數(shù)據(jù)支持。醫(yī)學(xué)基礎(chǔ)模型若未能在更加多樣化的數(shù)據(jù)集上進(jìn)行訓(xùn)練并在各種臨床環(huán)境中進(jìn)行測(cè)試,其對(duì)不同人口群體和臨床情境的泛化性和適用性將受到顯著限制。
該研究強(qiáng)調(diào)了在全球范圍內(nèi)加強(qiáng)醫(yī)學(xué)基礎(chǔ)模型合作研究的重要性,通過引入更加多元的數(shù)據(jù)集來提升模型的普適性和公平性,有助于醫(yī)學(xué)基礎(chǔ)模型在各類醫(yī)療場(chǎng)景中發(fā)揮更大價(jià)值,為全球醫(yī)療服務(wù)的智能化和精準(zhǔn)化提供有力支持。
該研究以《How Generalizable Are Foundation Models When Applied to Different Demographic Groups and Settings?》(《基礎(chǔ)模型在應(yīng)用于不同的人群和環(huán)境時(shí)的泛化能力如何?》)為題,發(fā)表在《NEJM AI》(《新英格蘭醫(yī)學(xué)雜志—人工智能》)上。王亞星與北京航空航天大學(xué)教授王曉飛、新加坡國(guó)立大學(xué)教授覃宇宗為論文共同通訊作者,英國(guó)倫敦大學(xué)學(xué)院團(tuán)隊(duì)亦對(duì)本研究做出貢獻(xiàn)。
論文鏈接:
北京清華長(zhǎng)庚醫(yī)院APP
快速掛號(hào)