展會信息港展會大全

昇騰與昇思原生,助力智譜打造自主創(chuàng)新大模型體系!
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-08-20 17:02:21   瀏覽:5989次  

導(dǎo)讀:摘要:加速原生創(chuàng)新,智譜攜手昇騰、昇思打造自主創(chuàng)新原生模型 重磅亮相 【北京】2024年8月19日,北京人工智能生態(tài)大會在中關(guān)村國家自主創(chuàng)新示范區(qū)會議中心頤和廳成功召開。會上,華為昇騰計算業(yè)務(wù)副總裁劉鑫發(fā)表演講介紹昇騰原生進(jìn)展,智譜CEO張鵬作專題分...

摘要:加速原生創(chuàng)新,智譜攜手昇騰、昇思打造自主創(chuàng)新原生模型

重磅亮相

【北京】2024年8月19日,北京人工智能生態(tài)大會在中關(guān)村國家自主創(chuàng)新示范區(qū)會議中心頤和廳成功召開。會上,華為昇騰計算業(yè)務(wù)副總裁劉鑫發(fā)表演講介紹昇騰原生進(jìn)展,智譜CEO張鵬作專題分享,張鵬簡要介紹了昇騰對自主創(chuàng)新的智譜大模型的助力,以及正在打造的基于昇騰的第四代代碼模型CodeGeeX4和多模態(tài)模型CogVLM2-video。

其中,代碼生成大模型CodeGeeX4的新版本基于昇騰AI與昇思AI框架訓(xùn)練,依托昇騰與昇思的多維混合分布式并行技術(shù)等軟硬件能力等,將大幅提升模型開發(fā)、訓(xùn)練的效率及模型精度。

昇騰與昇思原生,助力智譜打造自主創(chuàng)新大模型體系!

華為昇騰計算業(yè)務(wù)副總裁 劉鑫

昇騰與昇思原生,助力智譜打造自主創(chuàng)新大模型體系!

智譜CEO 張鵬

模型能力

1.代碼生成大模型CodeGeeX4

第四代代碼模型 CodeGeeX4堪稱代碼生成大模型的“六邊形戰(zhàn)士”,已經(jīng)發(fā)布的CodeGeeX4-ALL-9B 僅用百億級參數(shù)實現(xiàn)模型精度超越業(yè)界主流產(chǎn)品。在NaturalCodebench等測試基準(zhǔn)上,相對于更大的模型實現(xiàn)了性能反超。

CodeGeeX4單一模型實現(xiàn)編程開發(fā)全流程覆蓋,包括需求設(shè)計、前端開發(fā)、后端開發(fā)、數(shù)據(jù)處理等場景,支持代碼補(bǔ)全和生成、代碼問答、代碼解釋器、工具調(diào)用、聯(lián)網(wǎng)搜索、項目級代碼問答等全面能力。模型長序列達(dá)128K,支持中文、英文、俄語、法語、西班牙語等20+自然語言和300+編程語言。同時,在模型推理可實現(xiàn)單卡部署,最低24GB顯存即可進(jìn)行量化推理,用戶可在本地私有化部署,保護(hù)企業(yè)代碼安全。

昇騰與昇思原生,助力智譜打造自主創(chuàng)新大模型體系!

昇騰與昇思原生,助力智譜打造自主創(chuàng)新大模型體系!

2.多模態(tài)大模型CogVLM2-video(視頻生成文本)

多模態(tài)大模型CogVLM2-video實現(xiàn)視頻生成文本能力,支持2K序列長度、224×224分辨率的視頻理解以及中英文回答等功能。測試實踐顯示,CogVLM2-video在多個視頻問答任務(wù)上達(dá)到了 state-of-the-art (SOTA模型)的性能,并能夠?qū)崿F(xiàn)一分鐘內(nèi)的視頻理解,在幾個主流性能測試數(shù)據(jù)集(MVBench, VideoChatGPT-Bench and Zero-shot VideoQA datasets)中,CogVLM2-video也表現(xiàn)不俗,展現(xiàn)出全面競爭力,同時在多類主要指標(biāo)上完成對其他模型的領(lǐng)先。

昇騰與昇思原生,助力智譜打造自主創(chuàng)新大模型體系!

昇騰與昇思原生,助力智譜打造自主創(chuàng)新大模型體系!

昇騰與昇思原生,助力智譜打造自主創(chuàng)新大模型體系!

基于昇騰與昇思的新版本CodeGeeX4

CodeGeeX4在訓(xùn)練過程中,調(diào)用昇騰原生的融合算子,利用昇思MindSpore AI框架的提供的多維混合分布式并行能力,通過對流水交織并行、tensor模型并行的優(yōu)化,解決內(nèi)存瓶頸、降低計算空泡、提升通信效率,實現(xiàn)“計算、網(wǎng)絡(luò)、存儲”協(xié)同優(yōu)化,對比同等規(guī)模參數(shù)的模型,訓(xùn)練效率20%提升,加速模型的迭代創(chuàng)新。

另外,該模型也采用MindSpore 2.3版本原創(chuàng)的多級編譯技術(shù),開啟O1編譯選項增加自動算子融合優(yōu)化,以接近動態(tài)圖的啟動時間獲取了圖模式下接近理論值的內(nèi)存復(fù)用率,進(jìn)而降低重計算比例,相對動態(tài)圖獲得15%的性能收益。

未來,智譜將與昇騰AI持續(xù)攜手,打造更多領(lǐng)先的自主創(chuàng)新大模型,加速人工智能產(chǎn)業(yè)發(fā)展,助力中國千行百業(yè)的智能化轉(zhuǎn)型,共同邁向智能新世界。

昇騰與昇思原生,助力智譜打造自主創(chuàng)新大模型體系!

昇騰使能AI產(chǎn)業(yè)生態(tài)打造原生成果

自從昇騰全面啟動原生開發(fā),越來越多的生態(tài)伙伴選擇昇騰,大模型生態(tài)從“應(yīng)用遷移”走向“原生開發(fā)”,充分依托昇騰AI基礎(chǔ)軟硬件平臺和完備的原生開發(fā)工具,提升開發(fā)效率、強(qiáng)化模型性能、加速應(yīng)用落地,面向不同行業(yè)客戶提供個性化的解決方案,與昇騰共同推進(jìn)中國人工智能產(chǎn)業(yè)的蓬勃發(fā)展。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港