展會(huì)信息港展會(huì)大全

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-10-25 08:52:03   瀏覽:1761次  

導(dǎo)讀:劃重點(diǎn) 01OceanBase推出首個(gè)面向?qū)崟r(shí)分析處理場(chǎng)景的GA版本4.3.3,提升多模態(tài)數(shù)據(jù)處理能力和向量檢索與索引功能。 02該版本在基礎(chǔ)分布式能力上,帶來(lái)更強(qiáng)性能、向量多模融合、融入AI技術(shù)棧。 03除此之外,OceanBase一體化數(shù)據(jù)庫(kù)包括一體化產(chǎn)品、一體化引擎、...

劃重點(diǎn)

01OceanBase推出首個(gè)面向?qū)崟r(shí)分析處理場(chǎng)景的GA版本4.3.3,提升多模態(tài)數(shù)據(jù)處理能力和向量檢索與索引功能。

02該版本在基礎(chǔ)分布式能力上,帶來(lái)更強(qiáng)性能、向量多模融合、融入AI技術(shù)棧。

03除此之外,OceanBase一體化數(shù)據(jù)庫(kù)包括一體化產(chǎn)品、一體化引擎、一體化架構(gòu),滿(mǎn)足AI應(yīng)用發(fā)展的需求。

04通過(guò)深度集成向量引擎,一體化數(shù)據(jù)庫(kù)支持快速向量化計(jì)算和相似度查詢(xún),提升AI應(yīng)用的性能。

05目前,OceanBase將成為螞蟻集團(tuán)的AI數(shù)據(jù)底座,為一系列AI時(shí)代新應(yīng)用提供支持。

以上內(nèi)容由騰訊混元大模型生成,僅供參考

明敏 發(fā)自 凹非寺

量子位 | 公眾號(hào) QbitAI

幾個(gè)工程師、一個(gè)星期,就能做一個(gè)AI Agent應(yīng)用了。

效果be like

能理解用戶(hù)復(fù)雜長(zhǎng)命令,推薦符合要求的奶茶店。

推薦兩公里內(nèi)、評(píng)分4.5以上、人均消費(fèi)25元以?xún)?nèi)干凈衛(wèi)生的奶茶店。

要知道,這背后需要它能分析處理不同模態(tài)的數(shù)據(jù),比如文本、地理信息、圖像等。

放在以前,構(gòu)建這樣的AI應(yīng)用需要多個(gè)不同的數(shù)據(jù)庫(kù),還需要配備經(jīng)驗(yàn)豐富且規(guī)模較大團(tuán)隊(duì)來(lái)管理復(fù)雜技術(shù)棧。

如今,能如此輕松搞定,多虧了背后的一體化數(shù)據(jù)庫(kù)OceanBase。

最新發(fā)布會(huì)上,OceanBase推出首個(gè)面向?qū)崟r(shí)分析處理場(chǎng)景的GA版本:4.3.3版本。

不僅推出全新向量檢索功能,實(shí)現(xiàn)SQL+AI一體化,還進(jìn)一步增強(qiáng)多模態(tài)數(shù)據(jù)處理能力。

感覺(jué)方方面面都是為AI時(shí)代做好了準(zhǔn)備埃

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

為啥能這么說(shuō)?

從最新發(fā)布的新能力看起。

首個(gè)面向?qū)崟r(shí)分析的GA版本此次OceanBase 4.3.3核心升級(jí)的能力主要有3方面:

AP場(chǎng)景性能提升

多模態(tài)數(shù)據(jù)支持

向量檢索與索引

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

首先,OceanBase 4.3.3版本升級(jí)了對(duì)復(fù)雜數(shù)據(jù)類(lèi)型處理能力。

新增Array類(lèi)型,這意味著數(shù)據(jù)庫(kù)可以直接存儲(chǔ)、查詢(xún)和操作數(shù)組數(shù)據(jù)。并對(duì)Roaringbitmap類(lèi)型數(shù)據(jù)的計(jì)算性能進(jìn)行了優(yōu)化,意味著數(shù)據(jù)庫(kù)能夠更高效地處理和操作大型集合數(shù)據(jù)。

其次,OceanBase 4.3.3在向量融合查詢(xún)的關(guān)鍵能力上帶來(lái)提升,推出全新向量檢索能力,支持向量數(shù)據(jù)類(lèi)型和向量索引,并基于向量索引提供強(qiáng)大搜索能力。

用戶(hù)可通過(guò)SQL及Python SDK等方式靈活調(diào)用OceanBase的向量檢索能力。

如今,在通用數(shù)據(jù)庫(kù)中集成向量插件已經(jīng)成為一種趨勢(shì),這種方式能夠直接復(fù)用通用數(shù)據(jù)已有功能和生態(tài)。

OceanBase與螞蟻集團(tuán)聯(lián)合開(kāi)發(fā)了向量索引庫(kù),這個(gè)索引庫(kù)已經(jīng)在螞蟻集團(tuán)大量業(yè)務(wù)場(chǎng)景中得到驗(yàn)證(如生物識(shí)別、企業(yè)內(nèi)部知識(shí)庫(kù)等),性能成熟。

現(xiàn)場(chǎng)跑分結(jié)果顯示,該向量庫(kù)在960維的GIST數(shù)據(jù)集上表現(xiàn)出色,在ANN Benmarks測(cè)試中性能遠(yuǎn)超其他算法,排名第一。

特別是在 90% 以上的召回率區(qū)間,查詢(xún)性能(QPS)相比此前最優(yōu)算法 glass 提升 100%,相比基線(xiàn)算法hnswlib提升300%。

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

該向量引擎深度融合了OceanBase的存儲(chǔ)引擎和SQL引擎,實(shí)現(xiàn)SQL+AI一體化。能夠在一條SQL語(yǔ)句中實(shí)現(xiàn)標(biāo)量、向量、空間地理等混合查詢(xún)。

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

比如“望小京”demo中,用戶(hù)給的提示詞為“推薦兩公里內(nèi)、評(píng)分4.5以上、人均消費(fèi)25元以?xún)?nèi)干凈衛(wèi)生的奶茶店”。這背后涉及到處理文本、圖像和地理位置等不同類(lèi)型的數(shù)據(jù),需要更強(qiáng)大的數(shù)據(jù)分析和查詢(xún)能力。

最后,OceanBase 4.3.3還針對(duì)AP(分析處理)場(chǎng)景進(jìn)行大幅性能優(yōu)化,尤其是在海量數(shù)據(jù)分析時(shí),能夠提供更短的響應(yīng)時(shí)間和更高的吞吐能力。

TPC-H 1T場(chǎng)景提升64%

TPC-DS 1T場(chǎng)景提升36%

ClickBench hot- run提升49%

cold-run性能提升149%

同時(shí)大幅完善了實(shí)時(shí)AP功能,包括支持列存副本、物化視圖、外表集成、快速導(dǎo)入導(dǎo)出等。

實(shí)現(xiàn)滿(mǎn)足TP和AP負(fù)載的物理資源強(qiáng)隔離,可確保系統(tǒng)在處理事務(wù)型負(fù)載時(shí),不受分析型負(fù)載的影響,特別是在實(shí)時(shí)數(shù)據(jù)分析和決策場(chǎng)景中,能夠保持系統(tǒng)的高性能與穩(wěn)定性。

在易用性方面也做了升級(jí),通過(guò)提供AP參數(shù)版本,用戶(hù)可以針對(duì)不同場(chǎng)景選擇特定模板,不需要再單獨(dú)配置參數(shù)。并增強(qiáng)了AP場(chǎng)景中對(duì)SQL診斷能力的支持。

總結(jié)來(lái)看,OceanBase 4.3.3在基礎(chǔ)分布式能力上,帶來(lái)更強(qiáng)性能、向量多模融合、融入AI技術(shù)棧。

也就是將AI與數(shù)據(jù)庫(kù)進(jìn)一步融合。

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

這并不難理解,AI應(yīng)用/AI Agent大勢(shì)所在,各類(lèi)應(yīng)用智能化升級(jí)改造,底層數(shù)據(jù)庫(kù)必須緊隨趨勢(shì)升級(jí)。

不過(guò)在這之中,OceanBase還反復(fù)提到了一個(gè)關(guān)鍵詞一體化

它不僅是OceanBase的自身特性,如今也逐漸成為行業(yè)擁抱AI時(shí)代的一個(gè)優(yōu)解。

Why?

更快推動(dòng)AI應(yīng)用大規(guī)模落地對(duì)于數(shù)據(jù)庫(kù)的發(fā)展,行業(yè)內(nèi)逐漸達(dá)成一些共識(shí)。

AI能力大幅提升,導(dǎo)致全球80%以上的非結(jié)構(gòu)化數(shù)據(jù)被激活,背后的挖掘分析需求井噴,在這一新變化下,數(shù)據(jù)處理面臨更大規(guī)模、更多模態(tài)、實(shí)時(shí)性更強(qiáng)以及數(shù)據(jù)碎片和數(shù)據(jù)孤島問(wèn)題。

這些變化給數(shù)據(jù)庫(kù)提出了諸多新的發(fā)展需求。

最首要的便是,分布式數(shù)據(jù)庫(kù)成為一種大趨勢(shì)。

華東師范大學(xué)數(shù)據(jù)學(xué)院院長(zhǎng)、CCF數(shù)據(jù)庫(kù)專(zhuān)委會(huì)常委錢(qián)衛(wèi)寧提出,互聯(lián)網(wǎng)時(shí)代數(shù)據(jù)走向了開(kāi)放環(huán)境,在數(shù)據(jù)是分布式的時(shí)代里,數(shù)據(jù)庫(kù)也需要是分布式的。

分布式數(shù)據(jù)庫(kù)可以讓多臺(tái)服務(wù)器協(xié)同作業(yè),完成單臺(tái)服務(wù)器無(wú)法處理的任務(wù),尤其是高并發(fā)或者大數(shù)據(jù)量的任務(wù)。

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

除此之外,隨著AI、云計(jì)算等技術(shù)發(fā)展,數(shù)據(jù)庫(kù)還呈現(xiàn)出以下特點(diǎn)。

第一,云計(jì)算的普及推動(dòng)了云數(shù)據(jù)庫(kù)的快速發(fā)展。云數(shù)據(jù)庫(kù)提供按需擴(kuò)展、高可用性和成本效益。

第二,大數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)需求增加,多模態(tài)是一種趨勢(shì),NoSQL數(shù)據(jù)庫(kù)(如MongoDB、Cassandra、Redis、Couchbase)越來(lái)越受到歡迎。NoSQL數(shù)據(jù)庫(kù)提供了更好的擴(kuò)展性和靈活性,適用于存儲(chǔ)和處理各種數(shù)據(jù)類(lèi)型,如文檔、鍵值對(duì)、圖數(shù)據(jù)等。

第三,HTAP數(shù)據(jù)庫(kù)成為熱點(diǎn),甚至是主流數(shù)據(jù)庫(kù)的一項(xiàng)基礎(chǔ)能力。這類(lèi)數(shù)據(jù)庫(kù)能夠同時(shí)處理事務(wù)性和分析性工作負(fù)載,滿(mǎn)足了企業(yè)實(shí)時(shí)數(shù)據(jù)處理和分析的需求。

第四,開(kāi)源也是一大趨勢(shì)。開(kāi)源數(shù)據(jù)庫(kù)(如PostgreSQL、MySQL、MariaDB)憑借其社區(qū)驅(qū)動(dòng)的發(fā)展模式、強(qiáng)大的功能和靈活的部署方式,成為企業(yè)和開(kāi)發(fā)者的熱門(mén)選擇。

不過(guò)來(lái)到實(shí)際落地層面,盡管數(shù)據(jù)、數(shù)據(jù)庫(kù)在變得更加多元復(fù)雜,但是企業(yè)用戶(hù)總還是希望能只用一套系統(tǒng)來(lái)解決不同工作負(fù)載

比如能同時(shí)在事務(wù)處理(如支付、訂單等高頻交易場(chǎng)景)和復(fù)雜的實(shí)時(shí)分析查詢(xún),這背后需要TP+AP結(jié)合。

以及AI與多模查詢(xún)能力的融合,如Rockset和Oracle這樣的數(shù)據(jù)庫(kù)系統(tǒng)通過(guò)hybrid search融合查詢(xún)技術(shù),將SQL查詢(xún)與向量化查詢(xún)相結(jié)合,使得數(shù)據(jù)處理能夠同時(shí)包含文本、結(jié)構(gòu)化數(shù)據(jù)和向量數(shù)據(jù)等不同類(lèi)型。

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

方方面面影響下,一體化設(shè)計(jì)逐漸成為被市場(chǎng)青睞的路線(xiàn)。

以MongoDB和Oracle為代表的數(shù)據(jù)庫(kù)廠(chǎng)商正在各自推動(dòng)一體化數(shù)據(jù)庫(kù)的發(fā)展。國(guó)家工業(yè)信息安全發(fā)展研究中心等共同編制的《分布式數(shù)據(jù)庫(kù)發(fā)展趨勢(shì)研究報(bào)告》中也表示,分布式數(shù)據(jù)架構(gòu)的設(shè)計(jì)正在走向一體化。

在這之中,OceanBase的一體化理念非常鮮明。它包括:

一體化產(chǎn)品:多工作負(fù)載(TP+AP)、多模(SQL+NoSQL)、向量(SQL+AI)。

一體化引擎:一體化存儲(chǔ),一體化事務(wù),一體化SQL。

一體化架構(gòu):包括單機(jī)分布式一體化與多云原生。

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

OceanBase介紹,這種一體化的思路是隨著客戶(hù)需求不斷發(fā)展而來(lái)。

首先在底層架構(gòu)設(shè)計(jì)上,單機(jī)分布式一體化與多云原生并存,可以滿(mǎn)足大中小企業(yè)的不同需求。OceanBase已經(jīng)和目前主流云廠(chǎng)商均達(dá)成合作,實(shí)現(xiàn)公有云“多云共生”,同時(shí)也提供專(zhuān)有云、混合云等不同部署環(huán)境,保證一致體驗(yàn)。

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

其次隨著數(shù)據(jù)庫(kù)場(chǎng)景不斷變化,從傳統(tǒng)場(chǎng)景到泛互聯(lián)網(wǎng)場(chǎng)景,OceanBase從TP到TP+AP,逐漸走向多工作負(fù)載一體化。

比如在第一階段OLTP+,會(huì)浮現(xiàn)出山東移動(dòng)這類(lèi)客戶(hù)的需求,他們主要關(guān)注復(fù)雜查詢(xún)場(chǎng)景,需要增強(qiáng)業(yè)務(wù)處理效率。

第二階段浮現(xiàn)出了海底撈這類(lèi)用戶(hù)的需求。海底撈本來(lái)使用兩個(gè)系統(tǒng)分別處理OLTP和OLAP,這導(dǎo)致OLTP和OLAP之間存在數(shù)據(jù)延遲,沒(méi)法保證數(shù)據(jù)一致性,還需要兩份數(shù)據(jù)兩份成本。OceanBase能將其整合,不僅使整體成本降低,還能提升原本的AP性能。

第三階段還會(huì)浮現(xiàn)出實(shí)時(shí)營(yíng)銷(xiāo)等場(chǎng)景,對(duì)實(shí)時(shí)AP提出更多要求。

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

以及在實(shí)際推廣中,OceanBase發(fā)現(xiàn)越來(lái)越多客戶(hù)將OceanBase既應(yīng)用在KV存儲(chǔ)場(chǎng)景,也應(yīng)用在NoSQL場(chǎng)景,或者替換HBase、Redis等。因?yàn)镺ceanBase能夠解決各個(gè)場(chǎng)景中很多棘手問(wèn)題,比如對(duì)于NoSQL而言,最大的挑戰(zhàn)在于數(shù)據(jù)規(guī)模,分布式架構(gòu)可以很好解決數(shù)據(jù)擴(kuò)展的問(wèn)題。

因此,順應(yīng)用戶(hù)需求,OceanBase在不斷增加對(duì)多種數(shù)據(jù)類(lèi)型的支持,實(shí)現(xiàn)多模一體化。

最后,來(lái)到AI時(shí)代。“AI for DB,DB for AI”成為共識(shí)。

AI應(yīng)用大規(guī)模落地的前提是大模型技術(shù)能夠在各行各業(yè)低成本易用。

數(shù)據(jù)庫(kù)的發(fā)展經(jīng)驗(yàn)可以為AI應(yīng)用推廣提供參考。比如在數(shù)據(jù)庫(kù)中引入向量插件,實(shí)現(xiàn)SQL+AI,能夠大幅簡(jiǎn)化原有AI技術(shù)棧,讓打造AI Agent的門(mén)檻驟降。

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

最后總結(jié)來(lái)看,以O(shè)ceanBase為代表的一體化數(shù)據(jù)庫(kù)不僅能為企業(yè)提供更更好的數(shù)據(jù)底座,而且方方面面都滿(mǎn)足AI應(yīng)用發(fā)展的需求。它總體呈現(xiàn)出這些特點(diǎn):

第一,高效的數(shù)據(jù)處理和分析

支持HTAP,能夠在同一個(gè)系統(tǒng)中同時(shí)處理事務(wù)性(OLTP)和分析性(OLAP)負(fù)載。企業(yè)可以實(shí)時(shí)地對(duì)交易數(shù)據(jù)進(jìn)行分析,而不需要等待數(shù)據(jù)的同步和轉(zhuǎn)移,從而加快決策速度和響應(yīng)時(shí)間。

實(shí)時(shí)分析,可以在數(shù)據(jù)生成的同時(shí)進(jìn)行分析,確保數(shù)據(jù)的時(shí)效性,這對(duì)于實(shí)時(shí)推薦、風(fēng)控、監(jiān)控等AI應(yīng)用至關(guān)重要。

第二,簡(jiǎn)化的數(shù)據(jù)管理。

一體化數(shù)據(jù)庫(kù)能夠確保數(shù)據(jù)的一致性和完整性,因?yàn)槭聞?wù)處理和分析處理在同一個(gè)系統(tǒng)內(nèi)完成,避免了數(shù)據(jù)同步和轉(zhuǎn)換過(guò)程中可能出現(xiàn)的延遲和錯(cuò)誤。

通過(guò)將多種數(shù)據(jù)類(lèi)型(如關(guān)系型數(shù)據(jù)、文檔數(shù)據(jù)、向量數(shù)據(jù)等)集成在一個(gè)系統(tǒng)中,一體化數(shù)據(jù)庫(kù)簡(jiǎn)化了數(shù)據(jù)存儲(chǔ)和管理。企業(yè)不需要維護(hù)多個(gè)數(shù)據(jù)庫(kù)系統(tǒng),減少了數(shù)據(jù)孤島問(wèn)題和運(yùn)維復(fù)雜性。

第三,靈活性和擴(kuò)展性。

一體化數(shù)據(jù)庫(kù)支持多模態(tài)數(shù)據(jù)處理,能夠處理和分析結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。這種靈活性使企業(yè)可以在一個(gè)平臺(tái)上處理不同類(lèi)型的數(shù)據(jù),滿(mǎn)足各種業(yè)務(wù)需求。

一體化數(shù)據(jù)庫(kù)可以在公有云、私有云和本地?cái)?shù)據(jù)中心的混合環(huán)境中部署,支持異構(gòu)環(huán)境下的數(shù)據(jù)管理和應(yīng)用。這使企業(yè)能夠根據(jù)業(yè)務(wù)需求靈活選擇和調(diào)整部署方案。

第四,簡(jiǎn)化AI應(yīng)用構(gòu)建。

AI應(yīng)用通常需要進(jìn)行高效的向量檢索和相似性搜索。一體化數(shù)據(jù)庫(kù)通過(guò)深度集成向量引擎,支持快速向量化計(jì)算和相似度查詢(xún),提升AI應(yīng)用的性能。

一體化數(shù)據(jù)庫(kù)能夠?qū)?shù)據(jù)存儲(chǔ)和AI模型緊密結(jié)合,支持復(fù)雜的AI工作負(fù)載。這種集成減少了數(shù)據(jù)傳輸?shù)难舆t,提高了模型訓(xùn)練和推理的效率。

第五,降低成本和復(fù)雜性。

一體化數(shù)據(jù)庫(kù)減少了企業(yè)需要維護(hù)的數(shù)據(jù)庫(kù)系統(tǒng)數(shù)量,簡(jiǎn)化了技術(shù)棧,降低了系統(tǒng)集成和運(yùn)維的復(fù)雜性。

通過(guò)優(yōu)化資源利用和減少多系統(tǒng)間的數(shù)據(jù)同步和轉(zhuǎn)換,一體化數(shù)據(jù)庫(kù)降低了總體擁有成本,提高了投資回報(bào)率。

7天開(kāi)發(fā)一個(gè)AI Agent應(yīng)用!秘密武器:一體化數(shù)據(jù)庫(kù)

AI時(shí)代,Data is Power

李飛飛當(dāng)初篤定做ImageNet,背后的核心邏輯就在于,她相信AI改變世界,數(shù)據(jù)是最簡(jiǎn)單最直接的方式。

如今,AI應(yīng)用落地趨勢(shì)已經(jīng)開(kāi)啟。數(shù)據(jù)作為生產(chǎn)要素,在AI時(shí)代已是水電般的存在。

而一體化數(shù)據(jù)庫(kù)正在為數(shù)據(jù)更充分靈活高效應(yīng)用提供新思路。

據(jù)了解,一體化數(shù)據(jù)庫(kù)OceanBase將成為螞蟻集團(tuán)的AI數(shù)據(jù)底座,為一系列AI時(shí)代新應(yīng)用“支小寶”、“螞小財(cái)”以及支付寶百寶箱智能體開(kāi)發(fā)平臺(tái)的數(shù)據(jù)管理提供支持。

一體化正在成為數(shù)據(jù)庫(kù)發(fā)展歷程中,一個(gè)旗幟鮮明的方向。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港