制服丝袜中文字幕亚洲欧美,青柠影院日韩一三区

Nature專業(yè)戶DeepMind又登封面，開源水印技術(shù)，Gemini已經(jīng)用上了

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-24 19:42:48 瀏覽：1297次

導(dǎo)讀：劃重點(diǎn) 01谷歌開發(fā)的SynthID文本水印技術(shù)登上Nature雜志封面，可保持文本質(zhì)量并實(shí)現(xiàn)高檢測精度。 02SynthID-Text通過 Tournament采樣算法引入，不影響LLM訓(xùn)練，僅修改采樣程序。 03該技術(shù)已應(yīng)用于Gemini和Gemini Advanced的水印添加，證明生成文本水印可以成...

劃重點(diǎn)

01谷歌開發(fā)的SynthID文本水印技術(shù)登上Nature雜志封面，可保持文本質(zhì)量并實(shí)現(xiàn)高檢測精度。

02SynthID-Text通過 Tournament采樣算法引入，不影響LLM訓(xùn)練，僅修改采樣程序。

03該技術(shù)已應(yīng)用于Gemini和Gemini Advanced的水印添加，證明生成文本水印可以成功實(shí)施并擴(kuò)展到現(xiàn)實(shí)世界的生產(chǎn)系統(tǒng)。

04然而，SynthID-Text目前僅可處理短至三句話的文本，以及對事實(shí)問題的回答，難以處理短文本、被重寫或翻譯的內(nèi)容。

05谷歌表示，SynthID并非識(shí)別人工智能生成內(nèi)容的靈丹妙藥，但將是開發(fā)更可靠人工智能識(shí)別工具的重要組成部分。

以上內(nèi)容由騰訊混元大模型生成，僅供參考

機(jī)器之心報(bào)道

機(jī)器之心編輯部

現(xiàn)如今，大型語言模型（LLM）生成的內(nèi)容已經(jīng)充斥了整個(gè)互聯(lián)網(wǎng)，并且這些模型還能模仿各種類似真人的語氣和行文風(fēng)格，讓人難以分辨眼前的文本究竟來自人類還是 AI。

這樣的問題或許可通過所謂的水�。╳atermarking）技術(shù)來解決。

谷歌開發(fā)的 SynthID 文本水印技術(shù)登上了最新一期 Nature 雜志封面，之前機(jī)器之心已經(jīng)報(bào)道過該公司開發(fā)的圖像水印技術(shù)，參閱《給 AI 生成圖像「加水庸，谷歌發(fā)布識(shí)別工具 SynthID》。

給圖像和文本添加水印具有各不一樣的難點(diǎn)。

在給圖像添加水印時(shí)，由于人眼的辨別相近色彩和能力遠(yuǎn)不及機(jī)器畢竟在機(jī)器「看」來，這些不同顏色本質(zhì)上只是不同的數(shù)值。以下動(dòng)圖展示了多張加了水印和未加水印的對比圖像。是不是完全看不來水印在哪里？

但對于以序列形式展示的文本，人類和機(jī)器一樣可以分明地看見其中全部信息。那么該如何給文本添加水印呢？

為了使人工智能生成的文本更易于識(shí)別，Google DeepMind 創(chuàng)建了 SynthID-Text，現(xiàn)已通過 Google Responsible Generative AI Toolkit 開源。

論文地址：https://www.nature.com/articles/s41586-024-08025-4

開源地址：https://github.com/synthid-text

SynthID-Text 是一種可立即投入生產(chǎn)的文本水印方案，可保持文本質(zhì)量并實(shí)現(xiàn)高檢測精度，同時(shí)將延遲開銷降至最低。并且，SynthID-Text 不影響 LLM 訓(xùn)練，僅修改采樣程序；水印檢測計(jì)算效率高，無需使用底層 LLM。

SynthID-Text 建立在以前生成水印組件的基礎(chǔ)上，并引入了一種新型采樣算法，即 Tournament 采樣。SynthID-Text 可以配置為非失真（保留文本質(zhì)量）或失真（以犧牲文本質(zhì)量為代價(jià)提高水印可檢測性）。在這兩種設(shè)置中，SynthID-Text 都提供了更高的檢測率。

簡單舉個(gè)例子，對于短語「我最喜歡的熱帶水果是__」，LLM 可能會(huì)使用 token「芒果」、「荔枝」、「木瓜」或「榴蓮」來完成句子，并且每個(gè) token 都會(huì)給出一個(gè)概率分?jǐn)?shù)。當(dāng)有一系列不同的 token 可供選擇時(shí)，SynthID 可以調(diào)整每個(gè)預(yù)測 token 的概率分?jǐn)?shù)，以免影響輸出的質(zhì)量、準(zhǔn)確性和創(chuàng)造力。

谷歌通過對來自 Gemini 實(shí)時(shí)互動(dòng)的近2000 萬條響應(yīng)進(jìn)行了大規(guī)模用戶反饋評估，結(jié)果表明：非失真 SynthID-Text 可以保持文本質(zhì)量。因此，SynthID-Text 已被用于為 Gemini 和 Gemini Advanced 添加水櫻這證明生成文本水印可以成功實(shí)施并擴(kuò)展到現(xiàn)實(shí)世界的生產(chǎn)系統(tǒng)，為數(shù)百萬用戶提供服務(wù)。

此外，谷歌還提供了一種將生成水印與投機(jī)采樣（speculative sampling）相結(jié)合的算法，允許將 SynthID-Text 集成到大規(guī)模生產(chǎn)系統(tǒng)中，而額外的計(jì)算開銷可以忽略不計(jì)。

不過，SynthID-Text 目前僅可以處理短至三句話的文本，以及經(jīng)過裁剪、解釋或修改的文本，但卻很難處理短文本、被重寫或翻譯的內(nèi)容，甚至是對事實(shí)問題的回答。

谷歌表示：「SynthID 并不是識(shí)別人工智能生成內(nèi)容的靈丹妙藥，但 SynthID 將是開發(fā)更可靠人工智能識(shí)別工具的重要組成部分�！�

參考鏈接：

https://www.theverge.com/2024/10/23/24277873/google-artificial-intelligence-synthid-watermarking-open-source

相關(guān)熱詞： Nature 專業(yè)戶 DeepMind 又登封面開源水

Nature專業(yè)戶DeepMind又登封面，開源水印技術(shù)，Gemini已經(jīng)用上了
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-24 19:42:48 瀏覽：1297次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

Nature專業(yè)戶DeepMind又登封面，開源水印技術(shù)，Gemini已經(jīng)用上了 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-24 19:42:48 瀏覽：1297次