展會信息港展會大全

WAIC 2024盛大召開,天翼云以全棧智算能力賦能AI時代
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-07-06   瀏覽:514次  

導(dǎo)讀:7月5日,2024世界人工智能大會期間,中國電信星辰人工智能生態(tài)論壇在上海世博中心啟幕。論壇以“星辰注智,煥新領(lǐng)航”為主題,圍繞人工智能技術(shù)發(fā)展趨勢,分享中國電信與產(chǎn)業(yè)各界在人工智能領(lǐng)域的創(chuàng)新與實踐。天翼云科技有限公司董事長、總經(jīng)理胡志 ......

7月5日,2024世界人工智能大會期間,中國電信星辰人工智能生態(tài)論壇在上海世博中心啟幕。論壇以“星辰注智,煥新領(lǐng)航”為主題,圍繞人工智能技術(shù)發(fā)展趨勢,分享中國電信與產(chǎn)業(yè)各界在人工智能領(lǐng)域的創(chuàng)新與實踐。天翼云科技有限公司董事長、總經(jīng)理胡志強出席,并發(fā)表演講《云智一體 國云煥新》。他表示,人工智能已成為新一輪科技革命和產(chǎn)業(yè)變革的核心驅(qū)動力量。天翼云堅持科技創(chuàng)新驅(qū)動高質(zhì)量發(fā)展,以豐富的智算資源供給、強大的智算服務(wù)能力和開放的模型應(yīng)用生態(tài),為數(shù)字經(jīng)濟發(fā)展注入新動能。

WAIC 2024盛大召開,天翼云以全棧智算能力賦能AI時代

在智算資源供給方面,天翼云自建了豐富、多樣化的智能算力資源。圍繞AI產(chǎn)業(yè)集聚地區(qū),天翼云規(guī)劃建設(shè)北京、上海、廣東、浙江、安徽人工智能公共算力中心,提供訓(xùn)推一體化能力,并先后建成上海、北京萬卡池,這也是全國最早建成并真正投產(chǎn)運行的兩個國產(chǎn)化、全液冷、單集群萬卡公共智算中心;在清潔能源集聚地,建設(shè)內(nèi)蒙、貴州、寧夏智算中心,提供綠色算力;此外,天翼云還在31省預(yù)部署AI云電腦和推理池,在280多個地市的一城一池節(jié)點和1000多個邊緣節(jié)點按需下沉AI云電腦算力和推理算力;提供國內(nèi)外主流的GPU、NPU算力方案,面向不同場景為用戶提供公有云、私有云、邊緣云多種形態(tài)服務(wù)。

另一方面,天翼云匯聚社會多方算力,通過高效調(diào)度實現(xiàn)算力供需匹配。天翼云重點研發(fā)算力分發(fā)網(wǎng)絡(luò)平臺“息壤”,從算力統(tǒng)一接入、算數(shù)網(wǎng)一體化調(diào)度、算力簡便易用三方面進行技術(shù)創(chuàng)新,實現(xiàn)裸算力云化接入、算力更泛在、算力選擇和應(yīng)用部署更簡單,促進算力互聯(lián)互通、高效利用、供需匹配。

基于此,息壤可賦能三大算力服務(wù)場景。一是天翼云自營的公共算力服務(wù)平臺,目前已接入多家算力伙伴,擴大了天翼云算力規(guī)模和品類,滿足公有云客戶的多元算力需求;二是行業(yè)算力互聯(lián)網(wǎng),如國資央企智算云管理調(diào)度平臺,接入多家央企算力,提高國資監(jiān)管水平,提升算力利用率;三是城市算力互聯(lián)網(wǎng),通過整合區(qū)域內(nèi)多方算力,結(jié)合產(chǎn)業(yè)政策,實現(xiàn)一體化統(tǒng)籌調(diào)度算力,目前已在多個區(qū)域成功實踐。

當(dāng)前,基礎(chǔ)大模型訓(xùn)練呈現(xiàn)參數(shù)越來越大的趨勢,在超大規(guī)模參數(shù)的基礎(chǔ)大模型開發(fā)訓(xùn)練場景中,對AI基礎(chǔ)設(shè)施的算力、性能、穩(wěn)定性都提出了更高要求。天翼云基于單集群萬卡智算中心,搭載一體化計算加速平臺云驍和一站式智算服務(wù)平臺慧聚,從基礎(chǔ)設(shè)施到平臺,構(gòu)建了基礎(chǔ)大模型訓(xùn)練解決方案。

WAIC 2024盛大召開,天翼云以全棧智算能力賦能AI時代

在大算力需求方面,天翼云建設(shè)了可橫向擴展的PB級HPFS,滿足存儲要求;組建了低延時的超大規(guī)模RDMA網(wǎng)絡(luò),滿足基礎(chǔ)算力需求;同時,通過計算、內(nèi)存、通信多維優(yōu)化,提升綜合算效。在性能方面,天翼云升級AI框架,編譯效率翻番,通過拓?fù)涓兄{(diào)度,集合通信效率提升顯著,多種加速優(yōu)化后將國產(chǎn)算力的綜合算效比提升到了行業(yè)可比水平。在穩(wěn)定性方面,故障訓(xùn)前發(fā)現(xiàn),結(jié)合斷點續(xù)訓(xùn)能力,實現(xiàn)訓(xùn)練任務(wù)長期穩(wěn)定、高可用運行。

構(gòu)建國產(chǎn)萬卡集群不是一萬張卡的簡單堆疊,而是一項高度復(fù)雜的系統(tǒng)工程,需要解決超大規(guī)模的組網(wǎng)互聯(lián)、高效率的集群計算、長期穩(wěn)定性和高可用性等眾多技術(shù)難題。天翼云基于國產(chǎn)萬卡智算集群和自研智算平臺,已具備支撐萬億參數(shù)基礎(chǔ)大模型訓(xùn)練的能力。

在行業(yè)大模型訓(xùn)推過程中,普遍存在著訓(xùn)練部署工程化復(fù)雜、訓(xùn)推效率有待提高、訓(xùn)練中斷頻繁等挑戰(zhàn)。面向行業(yè)大模型訓(xùn)推場景,天翼云提供一站式智算服務(wù)。其中,“慧聚”平臺預(yù)置行業(yè)數(shù)據(jù)集、納管國內(nèi)外主流AI加速硬件、并預(yù)置基于國產(chǎn)算力的基礎(chǔ)大模型等全棧工具鏈能力,大模型精調(diào)場景通過選數(shù)據(jù)、選硬件、選模型3步,即可實現(xiàn)大模型訓(xùn)推;通過自研AI框架、3D并行加速、自研訓(xùn)練加速庫、容器調(diào)度優(yōu)化等核心技術(shù),大幅提升訓(xùn)練效率;通過模型量化壓縮、自研推理加速算子庫、自AI推理加速框架等核心技術(shù),推理效率也明顯提升;通過全鏈路故障分鐘級檢測、定位、告警,全鏈路日志監(jiān)控與可視化、斷點續(xù)訓(xùn)快速恢復(fù)等核心技術(shù),實現(xiàn)訓(xùn)推過程全鏈路監(jiān)控。

WAIC 2024盛大召開,天翼云以全棧智算能力賦能AI時代

基于技術(shù)創(chuàng)新與項目經(jīng)驗沉淀,天翼云打造了全面的平臺化能力和解決方案,保障客戶高效、便捷、穩(wěn)定、安全使用智算服務(wù)。

在模型應(yīng)用生態(tài)建設(shè)方面,天翼云在業(yè)界率先發(fā)布AI云電腦。AI云電腦具有算力更強大、更彈性、更安全、更優(yōu)惠的優(yōu)勢,降低大眾使用AI的門檻,加速推進AI普惠化。目前天翼AI云電腦已接入多個主流通用大模型,以及教育、醫(yī)療、法律、心理等多個行業(yè)大模型,打造AI應(yīng)用中心,創(chuàng)新推出AI會議、AI低代碼、AI文檔、AI教育等場景化標(biāo)桿應(yīng)用,提升客戶辦公、生產(chǎn)效率。

此外,天翼云打造紅云大模型開發(fā)者社區(qū),聚合本土中文優(yōu)質(zhì)AI資源,加速AI應(yīng)用創(chuàng)新和商業(yè)閉環(huán)。通過簡單易用的工具鏈,端到端使能AI應(yīng)用開發(fā)全流程,助力孵化國產(chǎn)原生模型。

大會期間,天翼云攜智算創(chuàng)新成果亮相世博展覽館,展出了國內(nèi)領(lǐng)先的單體萬卡液冷智算池、“息壤”“云驍”“慧聚”三大智算平臺、AI云電腦以及基于天翼云智算云底座的星辰大模型等硬核技術(shù)成果,全方位展現(xiàn)在人工智能領(lǐng)域的深厚實力。

人工智能正成為發(fā)展新質(zhì)生產(chǎn)力的重要引擎,作為云服務(wù)國家隊,天翼云具有豐富的智算資源儲備、強大的智算平臺能力以及開放的模型應(yīng)用生態(tài)。未來,天翼云將持續(xù)深耕技術(shù)創(chuàng)新,攜手產(chǎn)業(yè)各界共創(chuàng)智算未來,共贏AI時代。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港