欧美日韩亚洲国产主播第一区 ,亚洲中文字幕一二区精品自拍

微軟探索音生圖 AI 模型，實(shí)時(shí)視覺化會(huì)議演講者語音講述的場(chǎng)景

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-15 18:49:40 瀏覽：4303次

導(dǎo)讀：IT之家 10 月 15 日消息，科技媒體 MSPoweruser 昨日（10 月 14 日）發(fā)布博文，報(bào)道稱微軟公司獲得了一項(xiàng)新的專利，描述了基于用戶實(shí)時(shí)輸入的語音來生成圖片。根據(jù)美國商標(biāo)和專利局最新公示的清單，該專利共計(jì) 20 頁，微軟于 2023 年 4 月 5 日提交申請(qǐng)，于...

IT之家 10 月 15 日消息，科技媒體 MSPoweruser 昨日（10 月 14 日）發(fā)布博文，報(bào)道稱微軟公司獲得了一項(xiàng)新的專利，描述了基于用戶實(shí)時(shí)輸入的語音來生成圖片。

根據(jù)美國商標(biāo)和專利局最新公示的清單，該專利共計(jì) 20 頁，微軟于 2023 年 4 月 5 日提交申請(qǐng)，于 10 月 10 日獲批。

根據(jù)專利描述，該系統(tǒng)可以在會(huì)議或講座中實(shí)時(shí)捕捉音頻，隨后通過語言模型進(jìn)行總結(jié)，并生成相應(yīng)的 AI 圖像。

微軟探索音生圖 AI 模型，實(shí)時(shí)視覺化會(huì)議演講者語音講述的場(chǎng)景

IT之家援引該媒體報(bào)道，該工作會(huì)分為 3 個(gè)步驟：

捕捉音頻：用戶通過麥克風(fēng)發(fā)言，系統(tǒng)實(shí)時(shí)記錄并轉(zhuǎn)化為文本。

處理文本：分段記錄文本，每段內(nèi)容通過語言模型進(jìn)行總結(jié)。

生成圖像：根據(jù)總結(jié)生成的提示，系統(tǒng)創(chuàng)建 AI 生成的圖像，并在屏幕上實(shí)時(shí)顯示。

預(yù)計(jì)該功能將主要應(yīng)用于 Microsoft Teams。隨著演講者話題的變化，實(shí)時(shí)生成的圖像也會(huì)隨之更新，從而增強(qiáng)視覺溝通的效果。微軟表示，這種圖像的使用有助于澄清概念，特別適合通過視覺輔助學(xué)習(xí)的用戶。

微軟探索音生圖 AI 模型，實(shí)時(shí)視覺化會(huì)議演講者語音講述的場(chǎng)景
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-15 18:49:40 瀏覽：4303次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

微軟探索音生圖 AI 模型，實(shí)時(shí)視覺化會(huì)議演講者語音講述的場(chǎng)景 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-15 18:49:40 瀏覽：4303次