【環(huán)球時(shí)報(bào)報(bào)道 記者 丁雅梔】隨著OpenAI和谷歌相繼推出新一代大模型,生成式人工智能(AI)的競(jìng)賽又達(dá)到新的高潮。當(dāng)?shù)貢r(shí)間14日上午,谷歌在I/O開(kāi)發(fā)者大會(huì)上推出最新多模態(tài)AI產(chǎn)品,包括由升級(jí)后Gemini模型驅(qū)動(dòng)的萬(wàn)能AI助手Project Astra和對(duì)標(biāo)Sora的文生視頻模型Veo。
在演示視頻中,Project Astra能夠通過(guò)攝像頭看到的內(nèi)容來(lái)分析、響應(yīng)語(yǔ)音指令,同時(shí)與人類(lèi)進(jìn)行實(shí)時(shí)語(yǔ)音對(duì)話(huà)。隨著視覺(jué)和推理能力的提高,Project Astra還可以成功地識(shí)別出代碼序列、為電路圖提出改進(jìn)建議等。
Veo則具備生成1080p高清視頻的能力,用戶(hù)可以通過(guò)文本、圖像、視頻等各種格式提供提示。點(diǎn)擊“擴(kuò)展”按鈕,Veo生成視頻的時(shí)長(zhǎng)持續(xù)增加,最終達(dá)到了1分10秒,超過(guò)了Sora的時(shí)長(zhǎng)。目前,Veo已經(jīng)開(kāi)始在谷歌官網(wǎng)開(kāi)放試用,此外,團(tuán)隊(duì)還開(kāi)發(fā)了實(shí)驗(yàn)性工具VideoFX搭載Veo模型,為用戶(hù)提供更多的創(chuàng)作工具和可能性。
谷歌首席執(zhí)行官桑達(dá)爾皮查伊表示,谷歌所有工作都在圍繞生成式AI模型Gemini展開(kāi)。根據(jù)此次發(fā)布會(huì)最后的官方統(tǒng)計(jì),完全聚焦于AI的這場(chǎng)主題演講總共提到了121次AI。
美國(guó)《商業(yè)內(nèi)幕》報(bào)道稱(chēng),大型科技公司之間的激烈競(jìng)爭(zhēng)更加凸顯。就在谷歌I/O大會(huì)前一天,OpenAI發(fā)布了最新一代AI模型GPT-4o。GPT-4o是OpenAI聊天機(jī)器人的最新版本,它能像人類(lèi)一樣對(duì)音頻提示做出幾乎即時(shí)的反應(yīng),實(shí)時(shí)翻譯語(yǔ)言,甚至能作為導(dǎo)師幫助學(xué)生。據(jù)彭博社報(bào)道,蘋(píng)果即將與OpenAI達(dá)成協(xié)議,在iOS 18中加入基于ChatGPT的人工智能功能。這項(xiàng)技術(shù)可能會(huì)被整合到定于今年9月發(fā)布的iPhone 16上。
谷歌也不甘示弱。在發(fā)布會(huì)上,谷歌表示,從今年晚些時(shí)候谷歌將發(fā)布的Pixel手機(jī)開(kāi)始,谷歌將把其最新的Gemini人工智能模型整合到安卓設(shè)備中。
“在文本大模型上,谷歌和OpenAI最領(lǐng)先的技術(shù)咬得很緊。從使用體驗(yàn)來(lái)看,目前谷歌的Gemini大模型比GPT-4o處理能力弱一些。”清華大學(xué)新聞學(xué)院新媒體研究中心主任、跨學(xué)科知名學(xué)者沈陽(yáng)教授15日對(duì)《環(huán)球時(shí)報(bào)》記者表示,經(jīng)過(guò)去年一年的醞釀,ChatGPT已經(jīng)獲得了億級(jí)的用戶(hù)量。今年,幾大科技巨頭主要是在擴(kuò)大產(chǎn)業(yè)規(guī)模上發(fā)力,希望把平臺(tái)用戶(hù)量推向10億以上。因此,GPT-4o主要設(shè)計(jì)目標(biāo)是解決遷移到蘋(píng)果Siri平臺(tái)的工程問(wèn)題,為Siri全面適配做重要的工程性?xún)?yōu)化,包括提升反應(yīng)速度、減少出錯(cuò)率等。而谷歌的優(yōu)勢(shì)在于用戶(hù)基數(shù)大,且能夠直接觸達(dá)用戶(hù)。目前來(lái)看,大模型之爭(zhēng)“鹿死誰(shuí)手”,還需要進(jìn)一步觀察。