直擊OpenAI連續(xù)12天狂歡第三日:Sora登場
12月10日消息,OpenAI在今日凌晨兩點的發(fā)布會上正式發(fā)布了人工智能視頻生成工具Sora,向全部ChatGPT Plus和Pro用戶免費開放。Sora成為獨立產品,OpenAI為其專門開設網站Sora.com。
初期將面向美國用戶以及國際上的“大多數國家/地區(qū)”。用戶無需為這項工具支付額外費用,它將包含在現有的付費ChatGPT賬戶中。
OpenAI官網信息顯示,Sora目前并未向全球用戶開放,目前已向全球155個國家和地區(qū)開放了服務。在首批可使用Sora的國家和地區(qū)當中,包括中國臺灣。中國大陸及中國香港,以及英國和歐盟國家,都不在名單當中。
目前,ChatGPT Plus收費為20美元/月,ChatGPT Pro收費為200美元/月。Plus用戶每月可生成高達50個480p分辨率的視頻,或者更少的720p分辨率視頻。Pro用戶每月可生成高達500個視頻,且分辨率更高,視頻時長更長。
OpenAI聯合創(chuàng)始人、首席執(zhí)行官山姆奧特曼(Sam Altman)在社交媒體X上發(fā)帖稱:“大家好,這是Sora,我們的視頻生成模型。今天,我們開始了紅隊測試,并向一群有限的創(chuàng)作者開放了訪問權限。這是一個了不起的時刻!眾W特曼在帖子中特別表揚了Sora項目負責人蒂姆布魯克斯(Tim Brooks)、比爾皮布爾斯(Bill Peebles)和阿迪塔拉梅什(Aditya Ramesh),稱他們非常棒,他們和整個團隊的工作令人驚嘆。
Sora生成視頻演示:絢麗圣誕樹
OpenAI官網信息顯示,Sora的新版本Sora Turbo包括了六大功能:
--Remix:使用Remix替換、移除或重新想象視頻中的元素。該功能允許用戶描述對視頻的更改,Sora完成其余工作。
--Re-cut:尋找并隔離最佳幀,向任一方向延伸以完成場景。
--Storyboard:在個人時間軸上組織和編輯獨特的視頻序列。該功能允許用戶使用時間軸在整個序列中引導具有多個操作的視頻。
--Loop:修剪并創(chuàng)建無縫重復的視頻。用戶可以指定視頻循環(huán)的起點和終點,Sora 填補空白,創(chuàng)造無縫重復場景。
--Blend:將兩個視頻合并成一個無縫的剪輯。用戶可以將兩個視頻混合在一起,創(chuàng)建一個全新的場景。
--Style presets:使用預設風格(Presets)創(chuàng)造并分享激發(fā)用戶想象力的風格。
自該公司在今年2月放出Sora展示片段引發(fā)關注后,一直未宣布對公眾正式開放的日期,在此之前僅向安全團隊、一些視覺藝術家、設計師和電影制作人開放了Sora的使用權限。
從當地時間12月5日開始,OpenAI進入一個持續(xù)發(fā)布新功能的周期,在12天內將通過12場直播活動發(fā)布新產品和功能。在此之前,OpenAI已經發(fā)布了ChatGPT Pro計劃和強化微調技術。
Sora的工作原理與OpenAI的圖像生成工具DALL-E相似,用戶只需輸入想要的場景描述,Sora便能生成高清視頻片段。此外,Sora還能夠根據靜態(tài)圖像生成視頻靈感,擴展現有視頻或填補缺失的幀。
以下是OpenAI在官網發(fā)布的題為《Sora來了--我們的視頻生成模型從研究預覽階段走出》的博客文章:
我們的視頻生成模型開始在sora.com網站上推出。今年年初,我們介紹了Sora,該模型能夠根據文本創(chuàng)造逼真的視頻,并分享了我們在世界模擬方面的初步研究進展。Sora作為人工智能理解和模擬現實世界的基礎--這是開發(fā)能夠與物理世界互動的模型的重要一步。
我們開發(fā)了Sora的新版本--Sora Turbo,它的速度顯著快于我們在2月份預覽的模型。今天,我們將其作為獨立產品在Sora.com上發(fā)布,供ChatGPT Plus和Pro用戶使用。
專為Sora設計的全新界面
用戶可以生成高達1080p分辨率、長達20秒、寬屏、垂直或方形寬高比的視頻。用戶可以自帶素材進行擴展、混音和融合,或者完全從文本生成新內容。
我們還開發(fā)了新的界面,使用戶能夠更容易地通過文本、圖像和視頻提示Sora。我們的故事板工具讓用戶能夠精確指定每一幀的輸入。此外,我們還有特色和最新動態(tài),這些動態(tài)不斷地用社區(qū)的創(chuàng)作進行更新。
Sora 的可用性和訂閱
Sora作為Plus賬戶的一部分,不收取額外費用。用戶可以每月生成高達50個480p分辨率的視頻,或者更少的720p分辨率視頻。對于那些想要更多使用Sora的用戶,Pro計劃包括10倍的使用量、更高的分辨率和更長的時長。我們正在為不同類型的用戶制定不同的收費標準,計劃在明年初提供。
我們的部署方法
我們部署的Sora版本有許多限制。它經常生成不現實的物理效果,并且在長時間內對復雜動作的處理上存在困難。盡管Sora Turbo比2月發(fā)布的預覽模型快得多,但我們仍在努力使這項技術讓每個人都負擔得起。
我們?yōu)槭裁船F在推出視頻生成技術,是為了給社會時間來探索其可能性,并共同開發(fā)規(guī)范和保障措施,確保隨著領域的發(fā)展,它被負責任地使用。
所有Sora生成的視頻都帶有C2PA元數據,這將識別視頻來自Sora,提供透明度,并可用于驗證來源。雖然不完美,我們增加了默認的水印等安全措施,并構建了內部搜索工具,使用技術屬性幫助驗證內容是否來自Sora。
今天,我們正在阻止特別有害的濫用形式,例如兒童性虐待材料和性深度偽造。在啟動時,對人的上傳將受到限制,但隨著我們完善深度偽造緩解措施,我們打算向更多用戶推出這一功能。
我們希望Sora的這個早期版本能夠使世界各地的人們探索新形式的創(chuàng)造力,講述他們的故事,并推動視頻敘事的可能性。我們對世界將用Sora創(chuàng)造什么感到興奮。
OpenAI同時在官網還發(fā)布了《Sora使用指南》,全文如下:
以下是一些關于如何遵守Sora的界限,并確保所有使用都符合道德標準、法律要求和OpenAI的使用政策的提示。
1.遵守OpenAI的使用政策
所有Sora用戶都已同意OpenAI的使用政策、服務條款和使用條款。這些政策普遍適用于OpenAI服務,旨在確保人工智能技術的安全可靠使用。用戶可以在https://openai.com/policies/usage-policies/查看OpenAI的最新使用政策。
Sora目前僅對至少18歲的成年人開放。
1.1 未經許可使用肖像
用戶不得創(chuàng)建描繪任何個人肖像的視頻,除非得到他們的明確同意。這包括公眾人物和私人個體,盡管允許描繪已故的歷史人物。即使得到他們的許可,也不允許上傳包含18歲以下兒童的內容。
1.2 避免非法內容或可能侵犯知識產權的內容
OpenAI的條款禁止任何可能違反法律的內容--包括以侵犯他人權利的方式使用他人的知識產權。
1.3 不適當和有害內容
禁止Sora用戶創(chuàng)建或分發(fā)促進傷害的內容。這包括用于欺凌、騷擾、誹謗、基于受保護屬性的歧視、兒童性化或促進暴力、仇恨或他人痛苦的內容。這包括但不限于:
--色情內容,包括非自愿色情圖像(NCII)和兒童性化內容
--過度的血腥或暴力,包括自殘的描繪
--由于其淫穢、暗示性或圖形性質,不適合一般觀眾的內容
1.4 誤導性內容
OpenAI的政策禁止使用Sora創(chuàng)建或分發(fā)用于欺詐、詐騙或誤導他人的任何內容,并且應在視頻生成過程中披露人工智能的使用。因此,用戶不應:
--傳播錯誤信息或虛假信息
--創(chuàng)建旨在欺詐或詐騙他人的誤導性內容
--采取措施掩蓋或隱藏視頻生成過程中人工智能技術的使用
2.舉報違規(guī)行為
如果用戶遇到自己認為違反OpenAI任何政策的內容,請立即報告。我們嚴肅對待所有違規(guī)行為,并將審查報告的內容,以確保其符合我們的條款和更廣泛的OpenAI使用政策。
此前陷入爭議
Sora此前主要面向一小群安全測試人員,他們負責測試該模型在錯誤信息和偏見等方面的漏洞。Reddit用戶在今年10月月曾詢問過OpenAI高管關于Sora的發(fā)布日期,懷疑該模型是否因計算/推理時間或安全問題而延遲。對此,OpenAI的產品負責人凱文威爾(Kevin Weil)回應稱:“需要完善模型,確保安全/仿冒等問題得到解決,并擴展計算能力!”
OpenAI在10月份完成了最新一輪融資,從多家投資公司和大型科技公司籌集的66億美元,估值達到1570億美元。此外,公司還獲得了40億美元的循環(huán)信貸額度,使其總現金流超過100億美元。這是OpenAI雄心勃勃的成長計劃的一部分,該公司正與亞馬遜支持的Anthropic、埃隆馬斯克(Elon Musk)的xAI、谷歌、Meta、微軟和亞馬遜競爭,力爭在未來十年內,從預計產值將突破1萬億美元的生成式人工智能市場中分得最大的一塊蛋糕。
在完成融資的同一個月,OpenAI在ChatGPT中推出了搜索功能,使其能夠更好地與谷歌、微軟的Bing和Perplexity等搜索引擎競爭,并可能吸引更多原本訪問這些網站進行網絡搜索的用戶。本月初,該公司又聘請了其首位首席營銷官,顯示出該公司計劃增加營銷投入以擴大用戶基礎。
隨著Sora的推出,OpenAI正尋求與Meta和谷歌等公司的人工智能視頻生成工具競爭。今年1月,谷歌發(fā)布了文生視頻大模型Lumiere。其他初創(chuàng)公司,如Stability AI的Stable Video Diffusion也提供了類似的人工智能工具。亞馬遜也推出了名為“Create with Alexa”的模型,該模型能夠根據用戶的提示生成短篇動畫兒童內容。
繼聊天機器人和圖像生成器之后,視頻可能是生成式人工智能的下一個前沿領域。盡管創(chuàng)意機會將激發(fā)一些人工智能愛好者的興趣,但新技術也帶來了嚴重的錯誤信息問題,尤其是在全球范圍內發(fā)生重大政治選舉之際。根據機器學習公司Clarity的數據,人工智能生成的深度偽造視頻數量同比增長了900%。
OpenAI已將多模態(tài)--結合文本、圖像和視頻生成--作為其提供更廣泛人工智能模型套件的突出目標。Sora的發(fā)布消息緊隨抗議者泄露看似Sora副本的決定之后,他們對ChatGPT制造商對待藝術家的方式表示擔憂。
OpenAI的Sora早期訪問計劃包括約300名藝術家,他們在11月下旬發(fā)表了一封公開信,批評OpenAI在開放性或藝術支持方面做得不夠,僅限于市場營銷。抗議者在公開信中表示:“親愛的人工智能統(tǒng)治者,我們獲得Sora的使用權,承諾成為早期測試者、紅隊成員和創(chuàng)意合作伙伴。然而,我們認為,我們被引誘進行‘藝術洗白’,以告訴世界Sora對藝術家來說是一個有用的工具!
信中還提到,數百名藝術家通過錯誤測試和對Sora的反饋為OpenAI提供了無償勞動,而“數百人免費貢獻,少數人將通過競賽被選中,讓他們用Sora創(chuàng)造的影片放映提供的補償微乎其微,與OpenAI獲得的大量公關和營銷價值相比微不足道!彼麄儽硎荆骸拔覀儾⒉环磳I技術作為藝術工具使用(如果我們反對,我們可能就不會被邀請參加這個項目)。我們不同意的是藝術家項目的推出方式,以及該工具在可能公開發(fā)布之前的呈現方式。我們向世界公開這一信息,希望OpenAI能變得更加開放,對藝術家更加友好,并在支持藝術方面不只是公關噱頭。”(科技新聞特約編譯無忌)