IT之家 6 月 13 日消息,Stability AI 發(fā)布了 Stable Diffusion 3 Medium(下文簡稱 SD3 Medium),官方聲稱是“迄今為止最先進的開源模型”,其性能甚至超過了 Midjourney 6。
Stability AI 公司表示 SD3 Medium 可以根據(jù)用戶輸入的文本描述,重點克服了文生圖模型中手部和臉部的挑戰(zhàn),生成足以亂真的的圖像。
SD3 Medium 還利用其底層的 Diffusion Transformer 架構(gòu),高精度地整合了文字元素。
SD3 Medium 的另一個特點是易于使用。相比較一些資源密集型 AI 模型,SD3 Medium 可以在消費級顯卡上運行,可以加速普及適配。
Stability AI 在非商業(yè)許可下提供 SD3 Medium,供免費使用。對于商業(yè)應用,可為藝術家、設計師和開發(fā)人員提供創(chuàng)作者許可證;對于大型商業(yè)用戶,可以直接聯(lián)系 Stability AI 了解授權(quán)詳情。
Stability AI 還表示計劃在未來將其產(chǎn)品擴展到視頻和音頻生成領域。提示詞如下:
A photograph of an 18-year-old Japanese woman hitchhiking,holding a cardboard sign that reads ' 京まで ' (To Tokyo Station).She is standing by the roadside with a hopeful expression,wearing casual clothing and a backpack. The background shows a bustling urban street with cars passing by and city buildings. The scene is lively and vibrant,capturing the energy of Tokyo. Cinematic composition,trending on artstation.
IT之家附上生成的相關圖片如下:
以上圖源:Yas@BizDev