在當(dāng)今信息爆炸的時(shí)代,如何更輕松、準(zhǔn)確地獲取專業(yè)領(lǐng)域知識(shí)一直是一個(gè)挑戰(zhàn)。最新研究表明,通過(guò)將大型語(yǔ)言模型(LLMs)與領(lǐng)域工具相結(jié)合,可以有效解決這一難題。一項(xiàng)名為GeneGPT的創(chuàng)新方法正在引領(lǐng)著大型語(yǔ)言模型進(jìn)入醫(yī)學(xué)信息領(lǐng)域,讓我們一起來(lái)看看這一引人注目的突破。
GeneGPT是由Qiao Jin等人在美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)進(jìn)行的研究成果。他們通過(guò)教導(dǎo)大型語(yǔ)言模型利用NCBI的Web API來(lái)回答基因組學(xué)問(wèn)題,從而提出了這一新方法。通過(guò)在上下文學(xué)習(xí)和增強(qiáng)解碼算法的支持下,GeneGPT可以檢測(cè)和執(zhí)行API調(diào)用,從而實(shí)現(xiàn)更簡(jiǎn)單、更精確地訪問(wèn)專業(yè)知識(shí)。
實(shí)驗(yàn)結(jié)果顯示,GeneGPT在GeneTuring基準(zhǔn)測(cè)試中表現(xiàn)出色,平均得分達(dá)到0.83,遠(yuǎn)遠(yuǎn)超過(guò)其他檢索增強(qiáng)型LLMs,如Bing(0.44)、生物醫(yī)學(xué)LLMs,如BioMedLM(0.08)和BioGPT(0.04),以及GPT-3(0.16)和ChatGPT(0.12)。這一突破性成果為未來(lái)的改進(jìn)提供了寶貴的啟示。
值得一提的是,GeneGPT不僅可以泛化到更長(zhǎng)的API調(diào)用鏈,回答GeneHop中的多跳問(wèn)題,而且API演示對(duì)于上下文學(xué)習(xí)比文檔更有用。不同類型的錯(cuò)誤在不同任務(wù)中也得到了豐富,為未來(lái)的改進(jìn)提供了有益的見解。
這一研究成果已經(jīng)引起了廣泛關(guān)注,并且GeneGPT的代碼和數(shù)據(jù)已經(jīng)公開發(fā)布在GitHub上。這一創(chuàng)新方法的出現(xiàn)將為醫(yī)學(xué)信息訪問(wèn)帶來(lái)革命性變革,讓我們拭目以待!
這項(xiàng)研究成果于2024年發(fā)表在牛津大學(xué)出版社。GeneGPT的問(wèn)世標(biāo)志著醫(yī)學(xué)信息訪問(wèn)進(jìn)入了全新的時(shí)代,讓我們期待更多關(guān)于這一領(lǐng)域的創(chuàng)新突破!
聯(lián)系客服