国产成人超清在线视频,国产高清永久免费,国产最新超碰97上传无码,超碰国产人人草人人爽

【2023云棲】劉一鳴:Data+AI時代大數(shù)據(jù)平臺建設(shè)的思考與發(fā)布

數(shù)據(jù)
  • 網(wǎng)絡(luò)
  • 2023-11-16 09:36

本文根據(jù)2023云棲大會演講實錄整理而成,演講信息如下:

演講人:劉一鳴 | 阿里云自研大數(shù)據(jù)產(chǎn)品負責人

演講主題:Data+AI時代大數(shù)據(jù)平臺應(yīng)該如何建設(shè)

今天分享的主題是Data+AI時代大數(shù)據(jù)平臺應(yīng)該如何建設(shè),這個話題既是對我們過去一年工作的反思和總結(jié),同時也是希望通過這個反思和總結(jié),不管大家是否使用阿里云的平臺和技術(shù),在未來大數(shù)據(jù)平臺的選型、運維、創(chuàng)新上都可以有一些啟發(fā),同時也會思考未來大數(shù)據(jù)人的角色、工作方式是否有一些新的變化。

阿里云大數(shù)據(jù)的核心是兩款分布式計算引擎,在ODPS(Open Data Processing Platform)品牌之下,今天的分享也會更多圍繞ODPS的兩個核心引擎來講(面向批量數(shù)據(jù)加工和海量存儲的MaxCompute、面向?qū)崟r數(shù)倉以及交互式分析場景的Hologres)。下面進入正題,希望跟大家分享我們過去做平臺時候的反思,什么能力是關(guān)鍵能力,以及今年我們做了哪些能力的提升。

降本能力:靈活的付費模式驅(qū)動大數(shù)據(jù)成本的顯著下降

降本能力是每個大數(shù)據(jù)平臺的核心能力,特別是作為公共云上的服務(wù)方,我們不希望大家使用云上的大數(shù)據(jù)平臺是一個成本的黑洞,越用越貴,每年老板說錢花哪里去還說不清楚,我們希望不僅給用戶提供一個成本費用說得清楚用得明白的平臺,也希望給用戶提供一個通過正確使用產(chǎn)品可以不斷降低單位擁有成本的平臺。降本從不意味著要使用更便宜的規(guī)格,更少的資源,這會潛在犧牲平臺的服務(wù)質(zhì)量,不是正確的降本姿勢,低價往往質(zhì)量缺少保障,最后會收獲更低質(zhì)量的服務(wù),更低質(zhì)量的研發(fā)投入,最后導(dǎo)致平臺無法維系。

合理的降本方式首先是選擇合適的采購策略、付費策略,選擇一個合適的技術(shù)。以MaxCompute為例,平臺提供多種付費方式,從比較經(jīng)典的預(yù)付費或者叫包年包月,到用得最多的后付費或者叫按量付費的模型。預(yù)付費對預(yù)算控制更精確,費用提前說清楚,但資源使用受限制,無法滿足臨時性需求,也會產(chǎn)生閑置資源的空閑浪費。按量付費模型根據(jù)實際業(yè)務(wù)規(guī)模產(chǎn)生費用,無需提前做容量規(guī)劃,但實際費用容易超出預(yù)算控制?,F(xiàn)在我們希望把兩種模式做一些結(jié)合。

我們看到大部分數(shù)據(jù)加工作業(yè)都具備一定的時間規(guī)律,夜間往往高峰期,早上上班看到計算結(jié)果,白天相對水位是低峰期,這里可以利用MaxCompute的分時彈性能力,日常低水位運行,高峰期彈性出來額外資源。分時彈性去年上線的,今年通過對庫存管理的優(yōu)化,實現(xiàn)庫存效率上的提升,920日開始MaxCompute彈性部分的CU單價直接降低50%。如果一天有8h作業(yè)跑不滿的情況,采用分時作業(yè)的方式一定是降本的,希望每個用戶可以根據(jù)大家實際使用場景去選擇分時策略。

原理類似ECS上的Spot Instance,MaxCompute今年推出了閑時作業(yè),也通常叫做SpotJob,定價直接是按量付費定價的三分之一,閑時作業(yè)是把大數(shù)據(jù)集群的閑置資源服務(wù)出來,不一定保障每天運行的時候都能得到一樣的資源,執(zhí)行一樣快,在集群繁忙時會有更多的作業(yè)等待時間,但對于延時不敏感的作業(yè),如歷史數(shù)據(jù)的導(dǎo)入、日常開發(fā)調(diào)試作業(yè)的場景,通過使用閑時作業(yè)可以有效降本66%。

分時彈性既能滿足彈性,也能滿足預(yù)算的管理,那么該怎么設(shè)置是最優(yōu)的?MaxCompute發(fā)布了成本優(yōu)化器,幫助用戶分析過去30天所有作業(yè)的資源分布特征,展示出高峰期和低谷期,給出彈性策略應(yīng)該怎么設(shè)計的建議。在彈性的基礎(chǔ)上,我們給作業(yè)增加了一個關(guān)鍵的約束條件叫基線,基線之前的作業(yè)需要足夠的資源保障,讓結(jié)果準時計算出來,基線之后的作業(yè)可以跑慢一些,更節(jié)省資源和費用,這樣就區(qū)分了作業(yè)的優(yōu)先級和重要性。絕大部分用戶使用成本優(yōu)化器之后,通常有20%以上成本降低,建議大家可以盡快采用起來。

接下來我們談?wù)劥鎯θ绾谓当尽?shù)據(jù)在實際使用時會分特征,有些數(shù)據(jù)是高頻訪問,數(shù)據(jù)的重要性有可能更高,有些數(shù)據(jù)是低頻訪問數(shù)據(jù),一個月就讀取一兩次,有的數(shù)據(jù)是審計要求,不可以刪除,一年不一定訪問一次。數(shù)據(jù)有價值分配,那么我們的數(shù)據(jù)成本是否也應(yīng)該有分層設(shè)計呢?當然。MaxCompute為不同訪問特征,不同價值數(shù)據(jù)提供不同的存儲能力,分層存儲提供了分層的單價。通過分層存儲的方式可以看到一些低頻訪問的數(shù)據(jù),長期訪問的數(shù)據(jù)成本可以降到以前的三分之一。

計算和存儲可以通過平臺的使用策略來節(jié)省成本,其實還可以通過存儲技術(shù)的創(chuàng)新實現(xiàn)進一步的降本。JSON是互聯(lián)網(wǎng)上使用非常廣泛的數(shù)據(jù)結(jié)構(gòu),半結(jié)構(gòu)化,查詢靈活,存儲也方便,Schema可以隨時調(diào)整,但過去JSON如果用字符串去存儲的時候,哪怕僅僅訪問一個字節(jié),也需要把幾兆字節(jié)全部解析出來,對計算和IO都是極大的浪費。另一種方案是JSON數(shù)據(jù)落庫前,提前進行JSON結(jié)構(gòu)的打?qū)?,需要大量的加工作業(yè),也是對計算資源的浪費。

如何有效提升JSON數(shù)據(jù)類型的存儲和訪問效率成為大數(shù)據(jù)平臺的關(guān)鍵能力,今年包括MaxCompute和Hologres,都提供JSON原生化的管理能力,包括元數(shù)據(jù)支持和存儲列式壓縮,把半結(jié)構(gòu)化作為一級處理類型來支持,在用戶實踐中,絕大部分用戶的JSON存儲成本會降到以前的五分之一,而且查詢會變得更快。

輕運維能力:Serverless變革大數(shù)據(jù)運維模式

云上大數(shù)據(jù)平臺,應(yīng)該提供運維足夠簡單易用,把臟活累活幫助使用者運維掉,幫助大數(shù)據(jù)工程師實現(xiàn)角色升級,從過去相對被動每天考慮系統(tǒng)平臺的穩(wěn)定性、擴展性、資源如何分配、備份、容災(zāi)、升級、修bug這些臟活累活中解脫出來,轉(zhuǎn)變成數(shù)據(jù)的分析師,變成AI專家,變成領(lǐng)域?qū)<?,而不是做重?fù)的運維工作。

我們認為Serverless架構(gòu)是解決運維問題的關(guān)鍵,那么如何做Serverless架構(gòu)呢?從大數(shù)據(jù)架構(gòu)上講,通常我們分三種:1.Shared-Nothing架構(gòu),存算一體。通過節(jié)點之間的橫向擴展,實現(xiàn)計算力和存儲能力的提升。2.Shared-Everything,計算存儲全部解耦開來,所有的資源都可以共享。3. Shared-Data,Data部分是共享,計算部分隔離開來,提供更好的隔離能力。每個技術(shù)會選擇不同架構(gòu)。

MaxCompute選擇Shared-Everything,對平臺側(cè)的隔離技術(shù)實現(xiàn)要求很高,對運維側(cè)、調(diào)度側(cè)要求更高,所有計算資源、存儲資源是共享在統(tǒng)一的公共集群里。Hologres選擇Shared-Data架構(gòu),這個系統(tǒng)需要更多考慮在線服務(wù)場景下資源的隔離和穩(wěn)定性,所以不同系統(tǒng)選擇不同架構(gòu)。

這個架構(gòu)背后我們會把整個集群當做一個統(tǒng)一的計算資源來管理。對用戶來說最大價值是,不僅是使用成本的降低,不需要提前做容量規(guī)劃,更重要的是,不需要處理復(fù)雜的升級運維,讓用戶可以實現(xiàn)零停機的方式實現(xiàn)版本的迭代,這都是Serverless架構(gòu)創(chuàng)造的價值,平臺側(cè)希望把臟活累活,包括升級、備份、災(zāi)備、彈性這些事情通過架構(gòu)的方式把它解決,這也是Serverless背后核心的理念。

大家過去講Serverless更多講資源上省錢,只為使用的資源付費,而我相信Serverless更多是把運維方式轉(zhuǎn)變,讓工程師更聚焦到價值的創(chuàng)造上。

Hologres在Serverless架構(gòu)上一直演進,今年提出了彈性計算組的概念,這個計算組概念背后是共享數(shù)據(jù),共享接入層,但在計算節(jié)點上做了資源切分,當不同業(yè)務(wù)團隊使用同一份數(shù)據(jù)的時候,每個團隊可以為自己的使用場景去彈性分配資源,同時保障數(shù)據(jù)的一致性,支持實時寫入,實時查詢,這是在Hologres上做的創(chuàng)新。

開放能力:湖倉一體與開放性

在談到大數(shù)據(jù)平臺的開放性時,更多講Open Storage + Open Format,今天阿里的大數(shù)據(jù)平臺希望做到更多一層。云計算對技術(shù)的開放性要求會更高,一方面云廠商不希望自己變成綁架用戶的角色,MaxCompute也不希望大家使用之后就被綁架在平臺上,不可以切換。另一方面云平臺上不同技術(shù)之間交互的強度、密度是遠大于線下的,技術(shù)之間需要分鐘級部署,分鐘級打通,用戶對技術(shù)的交互性要求很高,我們希望把開放性做得很徹底,我們不希望把創(chuàng)新只放在自己手里,我們希望把創(chuàng)新交還給用戶。

首先,阿里云的大數(shù)據(jù)完全擁抱Open Storage + Open Format,提供了湖倉一體的解決方案,為用戶提供接近原生的元數(shù)據(jù)管理和數(shù)據(jù)讀寫體驗。對于什么是湖倉一體,行業(yè)內(nèi)有兩個思路,一個是在湖上長出一個倉,把湖變成倉。典型特點是把湖上的數(shù)據(jù)結(jié)構(gòu)提供更好的更新能力,接近數(shù)據(jù)庫的開發(fā)體驗。另一個方式從倉的管理能力拓展外表能力,實現(xiàn)湖上半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)以元數(shù)據(jù)方式管理起來,相當于倉去管理湖,這也是湖倉一體的形態(tài)。MaxCompute是第二種形態(tài),用倉去管湖,把存在OSS上的Hudi格式、Delta Lake等格式,包括今年阿里自己創(chuàng)新的Paimon格式,都可以在MaxCompute和Hologres中作為外表直接訪問。同時也做了一些創(chuàng)新,把OSS上的非結(jié)構(gòu)化文件定義為抽象的目錄表,這樣在數(shù)倉里可以用更加精細化的安全管控方式去做授權(quán),哪些用戶可以訪問哪些文件,怎么訪問,包括審計都可以記錄下來。

湖倉一體最關(guān)鍵是元數(shù)據(jù)的管理,數(shù)據(jù)不管存在倉上、湖上,需要有一個統(tǒng)一的視圖可以看到所有的元數(shù)據(jù),數(shù)據(jù)被誰定義,數(shù)據(jù)怎么解析,這是湖倉一體核心的概念,而并不是一定是一個系統(tǒng)還是兩個系統(tǒng)。

MaxCompute今年在開放性上有很大的變化。大家過去認為倉的理念是數(shù)據(jù)計算都在這兒,但我們今天希望MaxCompute存儲作為獨立的產(chǎn)品形態(tài)對外提供服務(wù),把Storage這一層提供產(chǎn)品化的能力,提供Storage API,支持高吞吐、高性能的原生IO接口。不管使用機器學習的PAI平臺還是使用Spark、Presto,都可以像MaxCompute原生的SQL引擎一樣去訪問倉里的數(shù)據(jù),我們希望把自研大數(shù)據(jù)平臺的數(shù)據(jù)開放出去,支持用戶使用第三方引擎持續(xù)創(chuàng)新。

智能優(yōu)化能力:AI加持的智能數(shù)倉

過去做優(yōu)化的時候很依賴于DBA同學對一個數(shù)倉技術(shù)原理的理解,在云的時代,用戶把數(shù)據(jù)托管到云平臺上,云平臺就有很大責任幫助用戶做好優(yōu)化這件事。我們希望從過去基于經(jīng)驗的運維向智能化運維前進。

比如MaxCompute通過物化視圖把公共的SQL計算子集推薦出來,實現(xiàn)資源的復(fù)用,這是一種空間換時間非常有效的方法。經(jīng)過一年多時間的迭代,在推薦效率上已經(jīng)做了很大的改進,絕大部分推薦出來的物化視圖質(zhì)量都是很高,可以做到成本的節(jié)省和效率上的提升。

大數(shù)據(jù)成為AI的基礎(chǔ)設(shè)施

今年AI很熱,很多了不起的創(chuàng)新,但其實AI的創(chuàng)新中,大數(shù)據(jù)也扮演了關(guān)鍵的基礎(chǔ)設(shè)施角色。同時我們也希望用了云上大數(shù)據(jù)平臺的用戶,不需要再做那些低效繁重的運維工作,而是更多做一些AI上的場景和應(yīng)用創(chuàng)新。我們也提出了大數(shù)據(jù)AI一體化,事實上大數(shù)據(jù)AI是各有分工,大數(shù)據(jù)為AI提供數(shù)據(jù)的支撐,這包括大數(shù)據(jù)平臺要做好規(guī)模數(shù)據(jù)的處理,提供分布式計算框架,提供科學計算的一站式開發(fā)環(huán)境,其次機器學習平臺也會為大數(shù)據(jù)平臺提供優(yōu)化的算法、優(yōu)化的模型。

在過去SQL的基礎(chǔ)上,我們認為Python也應(yīng)該成為MaxCompute平臺的一級開發(fā)語言。MaxCompute全新發(fā)布,One Env+One Data+One Code,這背后核心就是提供一個Python的運行環(huán)境,一個Notebook的交互式開發(fā)體驗,讓有SQL基礎(chǔ)的同學,有Python經(jīng)驗的同學,需要利用Python Library進行數(shù)據(jù)處理的場景,可以在統(tǒng)一的開發(fā)環(huán)境下,實現(xiàn)高效率的開發(fā)和調(diào)試,實現(xiàn)Python和coMaxCompute數(shù)據(jù)的原生打通。

全面升級DataFrame能力,發(fā)布分布式計算框架MaxFrame,100%兼容Pandas等數(shù)據(jù)處理接口,通過一行代碼即可將原生Pandas自動轉(zhuǎn)為MaxFrame分布式計算,打通數(shù)據(jù)管理、大規(guī)模數(shù)據(jù)分析、處理到ML開發(fā)全流程,打破大數(shù)據(jù)及AI開發(fā)使用邊界,大大提高開發(fā)效率。

最后講下向量數(shù)據(jù)庫,Hologres內(nèi)置達摩院向量引擎Proxima,支持高性能、實時化的向量檢索服務(wù)。使用SQL接口可以訪問向量數(shù)據(jù),在原有交互式分析場景下幫助大家更好使用AI場景。


來源:網(wǎng)絡(luò)

作者:

編輯:leilei

圖片來源:

本文鏈接: http://givenhand.cn/article/20231116/1603.html

  • 數(shù)據(jù)
免責聲明:本網(wǎng)站出于傳播商業(yè)信息之目的進行轉(zhuǎn)載發(fā)布,不代表 AIUST.Com 立場。本文所涉文、圖、音視頻等資料之一切權(quán)利和法律責任歸提供方所有和承擔。本網(wǎng)站對文中的圖文等所有信息的真實性不作任何保證或承諾,請讀者僅作參考,并自行核實相關(guān)內(nèi)容。本網(wǎng)站的任何內(nèi)容僅供參考,不能做為投資、采購或行為決策依據(jù),據(jù)此操作者風險自擔。

相關(guān)文章

資訊

原創(chuàng)

薦讀

  • 5G+AR加持 晨星機器人掀起“智能化+人機交互”制造新趨勢 5G+AR加持 晨星機器人掀起“智能化+人機交互”制造新趨勢

    2021世界制造業(yè)大會于11月22日在合肥落下帷幕。為期四天的大會中,作為向世界展示智能制造全面能力的窗口,聯(lián)想展示了一系列讓人驚喜的創(chuàng)新產(chǎn)品?,F(xiàn)場展示的ThinkPad X1 Fold整體重量僅有1公斤,折疊起來之后的厚度大約為24毫米。當保持半開狀態(tài)時,可以像拿本書一樣握住,并且能同時運行兩個應(yīng)用程序。使用固定在中間的鍵盤之后,瞬間變...

  • 智能手機競爭中失敗,日本在聯(lián)網(wǎng)汽車領(lǐng)域舉步維艱 智能手機競爭中失敗,日本在聯(lián)網(wǎng)汽車領(lǐng)域舉步維艱

    據(jù)外媒報道,在制造帶有數(shù)字聯(lián)網(wǎng)服務(wù)的汽車的競爭中,豐田汽車和日產(chǎn)汽車面臨著被本土市場拖累的風險。與美國和歐洲的汽車消費者不同的是,日本消費者不愿意為這些聯(lián)網(wǎng)功能和服務(wù)買單。結(jié)果就是:日本只有10%的汽車...

  • 2020年河南省將推廣應(yīng)用3萬臺工業(yè)機器人 2020年河南省將推廣應(yīng)用3萬臺工業(yè)機器人

    到2020年,推廣應(yīng)用3萬臺工業(yè)機器人,建設(shè)1000條智能生產(chǎn)線、300個智能車間、150個智能工廠……4月16日,在2018兩岸智能裝備制造鄭州論壇上,河南省工信委發(fā)布了《2017年河南省智能制造白皮書》,河南智能制造的2020...

熱門標簽