展會(huì)信息港展會(huì)大全

超越先前最佳,阿里通義千問開源 Qwen2-Audio 7B 語音交互大模型
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-08-13 14:16:48   瀏覽:3847次  

導(dǎo)讀:IT之家 8 月 13 日消息,阿里通義千問開源Qwen2-Audio 系列的兩個(gè)模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。 作為一個(gè)大規(guī)模音頻語言模型,Qwen2-Audio 能夠接受各種音頻信號輸入,并根據(jù)語音指令執(zhí)行音頻分析或直接響應(yīng)文本,有兩種不同的音頻交互...

IT之家 8 月 13 日消息,阿里通義千問開源Qwen2-Audio 系列的兩個(gè)模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。

作為一個(gè)大規(guī)模音頻語言模型,Qwen2-Audio 能夠接受各種音頻信號輸入,并根據(jù)語音指令執(zhí)行音頻分析或直接響應(yīng)文本,有兩種不同的音頻交互模式:

語音聊天:用戶可以自由地與 Qwen2-Audio 進(jìn)行語音互動(dòng),而無需文本輸入

音頻分析:用戶可以在互動(dòng)過程中提供音頻和文本指令對音頻進(jìn)行分析

官方在一系列基準(zhǔn)數(shù)據(jù)集上進(jìn)行了測試,Qwen2-Audio 超越了先前的最佳模型。

▲Qwen2-Audio 整體表現(xiàn)

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港