展會(huì)信息港展會(huì)大全

谷歌推出 DataGemma:基于可信數(shù)據(jù)源提高 AI 準(zhǔn)確度,減少幻覺(jué)
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-09-13 13:27:58   瀏覽:1842次  

導(dǎo)讀:IT之家 9 月 13 日消息,科技媒體 maginative 昨日(9 月 12 日)發(fā)布博文,報(bào)道谷歌公司基于谷歌數(shù)據(jù)共享(Data Commons)中的真實(shí)世界統(tǒng)計(jì)數(shù)據(jù), 推出了開(kāi)放權(quán)重 Gemma 模型的新版本 DataGemma。 語(yǔ)言模型當(dāng)前面臨的一大難題就是幻覺(jué)(Hallucinations),...

IT之家 9 月 13 日消息,科技媒體 maginative 昨日(9 月 12 日)發(fā)布博文,報(bào)道谷歌公司基于谷歌數(shù)據(jù)共享(Data Commons)中的真實(shí)世界統(tǒng)計(jì)數(shù)據(jù),推出了開(kāi)放權(quán)重 Gemma 模型的新版本 DataGemma。

谷歌推出 DataGemma:基于可信數(shù)據(jù)源提高 AI 準(zhǔn)確度,減少幻覺(jué)

語(yǔ)言模型當(dāng)前面臨的一大難題就是幻覺(jué)(Hallucinations),尤其是大語(yǔ)言模型(LLMs)在處理數(shù)值或統(tǒng)計(jì)數(shù)據(jù)時(shí),這一問(wèn)題變得尤為棘手,因此精確性至關(guān)重要。

谷歌的 Data Commons 是一個(gè)存儲(chǔ)庫(kù),匯集了來(lái)自聯(lián)合國(guó)和疾病控制與預(yù)防中心等可信組織收集的超過(guò) 2400 億個(gè)數(shù)據(jù)點(diǎn)。

通過(guò)利用這一龐大的統(tǒng)計(jì)數(shù)據(jù)集,基于 Gemini 的 DataGemma 能夠顯著提升模型準(zhǔn)確性,確保其輸出基于真實(shí)可信的現(xiàn)實(shí)世界信息。

谷歌推出 DataGemma:基于可信數(shù)據(jù)源提高 AI 準(zhǔn)確度,減少幻覺(jué)

DataGemma 方法的核心在于兩種關(guān)鍵技術(shù):檢索交錯(cuò)生成(RIG)和檢索增強(qiáng)生成(RAG)。這兩種方法通過(guò)在生成過(guò)程中將模型基于現(xiàn)實(shí)世界數(shù)據(jù),從而減少幻覺(jué)現(xiàn)象。

IT之家簡(jiǎn)要介紹兩項(xiàng)技術(shù)如下:

RIG:

通過(guò)主動(dòng)查詢(xún)可信來(lái)源,再生成回答的方式運(yùn)作。在接收到提示詞之后,DataGemma 會(huì)識(shí)別查詢(xún)中的統(tǒng)計(jì)數(shù)據(jù)點(diǎn),并從數(shù)據(jù)共享平臺(tái)獲取準(zhǔn)確信息。

谷歌推出 DataGemma:基于可信數(shù)據(jù)源提高 AI 準(zhǔn)確度,減少幻覺(jué)

例如,若被問(wèn)及“全球可再生能源的使用量是否有所增加?”,該模型會(huì)在回答中穿插實(shí)時(shí)統(tǒng)計(jì)數(shù)據(jù),確保事實(shí)準(zhǔn)確性。

RAG:

在生成回答之前,會(huì)從數(shù)據(jù)共享平臺(tái)檢索相關(guān)信息,進(jìn)一步提升了回答的質(zhì)量。借助其長(zhǎng)上下文窗口(由 Gemini 1.5 Pro 實(shí)現(xiàn)),DataGemma 確保了回答的全面性,引入了表格和腳注以提供更深層次的上下文,從而減少了虛構(gòu)內(nèi)容的出現(xiàn)。

谷歌推出 DataGemma:基于可信數(shù)據(jù)源提高 AI 準(zhǔn)確度,減少幻覺(jué)

谷歌對(duì) RIG 和 RAG 的研究尚處于初期階段,但初步成果令人鼓舞。通過(guò)將現(xiàn)實(shí)世界數(shù)據(jù)嵌入回復(fù)中,DataGemma 模型在處理數(shù)值事實(shí)和統(tǒng)計(jì)查詢(xún)方面展現(xiàn)出顯著提升。研究團(tuán)隊(duì)已發(fā)表論文詳述其方法,強(qiáng)調(diào)這些技術(shù)如何幫助 LLMs 判斷何時(shí)依賴(lài)外部數(shù)據(jù)與內(nèi)部參數(shù)。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港