科大訊飛旗下訊飛星火大模型V3.5(以下簡(jiǎn)稱 訊飛星火V3.5 )春季上新,不僅發(fā)布業(yè)界首個(gè)長(zhǎng)文本、長(zhǎng)圖文、長(zhǎng)語音大模型,還進(jìn)一步升級(jí)星火語音大模型,首發(fā)多情感超擬人合成,具備情緒表達(dá)能力,并推出一句話聲音復(fù)刻功能,讓科技更有溫度。
早在今年 1 月,科大訊飛首發(fā)了超擬人合成語音功能,讓 AI 不再是冷冰冰的播音腔,同時(shí)具備超強(qiáng)的情緒感知能力,能像 知冷知熱 的朋友一樣帶入情感互動(dòng),更具人情味。這一技術(shù)的提升背后不僅得益于訊飛星火V3.5在語義理解、指令跟隨和多輪對(duì)話的演示中展現(xiàn)的優(yōu)異能力,還有在情緒感知和擬人合成方面的出色表現(xiàn)。
訊飛星火 V3.5 此次的更新版本中,這一功能再度加強(qiáng),首發(fā)多情感超擬人合成功能,進(jìn)一步提升了合成聲音中情緒表達(dá)感知能力,情緒可感知度達(dá)到 85%以上,可以實(shí)現(xiàn)包括高興、抱歉、安慰、撒嬌、困惑等多種情感語氣表達(dá)。正如劉慶峰說, 技術(shù)在不斷的進(jìn)步,我們希望在安全可控的前提下,能夠帶來這個(gè)社會(huì)更有溫度的人工智能的體驗(yàn),能夠真的幫助到那些特別需要幫助的人。今天這個(gè)世界更需要有溫度的科技。
不僅能用,還要好用、易用,這或許才是部分大模型應(yīng)用在同質(zhì)化競(jìng)爭(zhēng)中脫穎而出的關(guān)鍵因素?萍疾皇抢浔拇嬖,AI 時(shí)代的科技更要能力與溫度兼顧,方能收獲大眾的歡迎。
長(zhǎng)文本已經(jīng)成為國產(chǎn)大模型比拼的新方向。在經(jīng)過長(zhǎng)達(dá)一年的對(duì)標(biāo) ChatGPT-4、比拼參數(shù)大小的同質(zhì)化競(jìng)爭(zhēng)之后,中國人工智能公司們終于找出了一個(gè)更容易被普通用戶理解、也更能直觀地超越美國同行們的差異化標(biāo)的。掀起這一波競(jìng)爭(zhēng)浪潮的是國內(nèi)大模型創(chuàng)業(yè)公司月之暗面。這家公司在去年將旗下的大模型 Kimi 的上下文參數(shù)規(guī)模提升至 20 萬字,上個(gè)月又提升至 200萬字,迅速引爆市場(chǎng)。3月,阿里旗下的通義千問已經(jīng)將這一數(shù)字更新到 1000萬字,宣稱是 全球文檔處理容量第一的 AI 應(yīng)用 。華泰證券在一份研報(bào)中指出,具有長(zhǎng)上下文的大模型通用性更強(qiáng),用戶將特定領(lǐng)域的知識(shí)通過上下文的方式輸入到模型中,模型即可通過上下文學(xué)習(xí)掌握相應(yīng)內(nèi)容,一定程度上代替模型的微調(diào)。但經(jīng)過幾個(gè)月的比拼跟進(jìn)之后,長(zhǎng)文本之于大模型似乎又成了一項(xiàng)廠家炫技的同質(zhì)化環(huán)節(jié),以至于有媒體已經(jīng)飛快地喊出了 長(zhǎng)文本降溫 的口號(hào),長(zhǎng)文本如何才能真正落地陷入瓶頸。
大模型長(zhǎng)文本功能的落地需要重點(diǎn)解決兩個(gè)問題。一是海量文本的高效處理。面對(duì)上百萬甚至上千萬文字,模型后臺(tái)消耗的運(yùn)算資源也成倍增加,業(yè)界的一些大模型往往智能處理前 20% 或前 50% 的內(nèi)容,之后的處理效率就大大減慢。二是如何保證大模型在科研、醫(yī)療、法律等行業(yè)專業(yè)場(chǎng)景的準(zhǔn)確率,這樣才能解決大模型在剛需場(chǎng)景的應(yīng)用問題?拼笥嶏w董事長(zhǎng)劉慶峰介紹,為了解決大模型應(yīng)用效率和準(zhǔn)確率問題,訊飛星火 V3.5 提升了對(duì)長(zhǎng)文本的理解、學(xué)習(xí)、回答能力,并進(jìn)行了重要的模型剪枝和蒸餾,從而推出業(yè)界最優(yōu)的 130億參數(shù)的大模型。在效果損失僅 3% 以內(nèi)的情況下,使得星火在文檔上傳解析處理、知識(shí)問答的首響時(shí)間以及文字生成效率方面都獲得了極大的效率提升。在對(duì)比測(cè)試中,使用訊飛星火對(duì)比國內(nèi)可測(cè)最好的大模型,在保障長(zhǎng)文本效果的情況下,無論是10K、64K、128K token,還是更長(zhǎng)的文本上,星火大模型的性能都是業(yè)界最優(yōu)。
解決了效率和準(zhǔn)確率的問題,長(zhǎng)文本才不至于只停留在參數(shù)比拼的噱頭上,真正落地于應(yīng)用場(chǎng)景。