IT之家 7 月 10 日消息,Databricks 日前發(fā)布大數(shù)據(jù)分析平臺 Spark 所用的 AI 模型 SDK,開發(fā)者寫代碼時,可用英文下指令,編譯器就會將英文指令轉(zhuǎn)換為 PySpark 或 SQL 語言代碼,以提升開發(fā)者效率。
▲ 圖源 Databricks 網(wǎng)站
據(jù)悉,Spark 是一款開源大數(shù)據(jù)分析工具,每年超過 10 億次下載、在全球 208 個國家和地區(qū)使用。
▲ 圖源 Databricks 網(wǎng)站
Databricks 表示,微軟的 AI 代碼助手 GitHubCopilot 固然強大,但使用門檻也相當高,Databricks 的 SDK 相對更具普適性,更易于上手。
Databricks 聲稱,他們發(fā)現(xiàn)大型語言模型非常了解 Spark,Spark 社區(qū)在過去 10 年貢獻大量的開放、高質(zhì)量文本以供 AI 學習發(fā)展。Databricks 團隊也正是憑借 Spark 社區(qū)提供的一系列學習數(shù)據(jù)進行訓練,用 LLM 開發(fā)一套英文版 SDK。開發(fā)者利用這套 SDK,即可直接用英文下指令,并得到相對應(yīng)結(jié)果,提升開發(fā)效率。
▲ 圖源 Databricks 網(wǎng)站
IT之家發(fā)現(xiàn),Databricks 同時聲稱,當下這款英文版 SDK 還在早期開發(fā)階段,他們歡迎更多使用者加入使用,來提升這款 SDK。