成人怡红院-成人怡红院视频在线观看-成人影视大全-成人影院203nnxyz-美女毛片在线看-美女免费黄

站長資訊網(wǎng)
最全最豐富的資訊網(wǎng)站

“玩轉”華為云DLI 揭秘其背后的核心計算引擎

  本文主要給大家介紹隱藏在華為云EI(企業(yè)智能)數(shù)據(jù)湖探索服務(以下簡稱DLI)背后的核心計算引擎——Spark。華為云EI數(shù)據(jù)湖探索服務團隊在Spark之上做了大量的性能優(yōu)化與服務化改造,但其本質還是脫離不了Spark的核心概念與思想,本文從以下幾點闡述,讓讀者快速對Spark有一個直觀的認識,玩轉DLI。

   Spark的誕生及優(yōu)勢

  2009年,Spark誕生于伯克利大學AMPLab,誕生之初是屬于伯克利大學的研究性項目。于2010年開源,2013年成為Apache開源項目,經過幾年的發(fā)展逐漸取代了Hadoop,成為了開源社區(qū)炙手可熱的大數(shù)據(jù)處理平臺。

  Spark官方的解釋:“Spark是用于大規(guī)模數(shù)據(jù)處理的統(tǒng)一分析引擎“,把關鍵詞拆開來看,“大規(guī)模數(shù)據(jù)”指的是Spark的使用場景是大數(shù)據(jù)場景;“統(tǒng)一”主要體現(xiàn)在將大數(shù)據(jù)的編程模型進行了歸一化,同時滿足多種類型的大數(shù)據(jù)處理場景(批處理、流處理、機器學習等),降低學習和維護不同大數(shù)據(jù)引擎的成本;“分析引擎”表明Spark聚焦在計算分析,對標的是Hadoop中的MapReduce,對其模型進行優(yōu)化與擴展。

  Spark為了解決MapReduce模型的優(yōu)化和擴展,我們先探討一下MapReduce存在的問題,然后分析Spark在MapReduce之上的改進。

  (1)MapReduce中間結果落盤,計算效率低下

  隨著業(yè)務數(shù)據(jù)不斷增多,業(yè)務邏輯不斷多樣化,很多ETL和數(shù)據(jù)預處理的工作需要多個MapReduce作業(yè)才能完成,但是MapReduce作業(yè)之間的數(shù)據(jù)交換需要通過寫入外部存儲才能完成,這樣會導致頻繁地磁盤讀寫,降低作業(yè)執(zhí)行效率。

  Spark設計之初,就想要解決頻繁落盤問題。Spark只在需要交換數(shù)據(jù)的Shuffle階段(Shuffle中文翻譯為“洗牌”,需要Shuffle的關鍵性原因是某種具有共同特征的數(shù)據(jù)需要最終匯聚到一個計算節(jié)點上進行計算)才會寫磁盤,其它階段,數(shù)據(jù)都是按流式的方式進行并行處理。

  (2)編程模型單一,場景表達能力有限

  MapReduce模型只有Map和Reduce兩個算子,計算場景的表達能力有限,這會導致用戶在編寫復雜的邏輯(例如join)時,需要自己寫關聯(lián)的邏輯,如果邏輯寫得不夠高效,還會影響性能。

  與MapReduce不同,Spark將所有的邏輯業(yè)務流程都抽象成是對數(shù)據(jù)集合的操作,并提供了豐富的操作算子,如:join、sortBy、groupByKey等,用戶只需要像編寫單機程序一樣去編寫分布式程序,而不用關心底層Spark是如何將對數(shù)據(jù)集合的操作轉換成分布式并行計算任務,極大的簡化了編程模型

   Spark的核心概念

  Spark中最核心的概念是RDD(Resilient Distributed Dataset) – 彈性分布式數(shù)據(jù)集,顧名思義,它是一個邏輯上統(tǒng)一、物理上分布的數(shù)據(jù)集合,Spark通過對RDD的一系列轉換操作來表達業(yè)務邏輯流程,就像數(shù)學中對一個向量的一系列函數(shù)轉換。Spark通過RDD的轉換依賴關系生成對任務的調度執(zhí)行的有向無環(huán)圖,并通過任務調度器將任務提交到計算節(jié)點上執(zhí)行,任務的劃分與調度是對業(yè)務邏輯透明的,極大的簡化了分布式編程模型,RDD也豐富了分布式并行計算的表達能力。

  RDD上的操作分為Transformation算子和Action算子。Transformation算子用于編寫數(shù)據(jù)的變換過程,是指邏輯上組成變換過程。Action算子放在程序的最后一步,用于對結果進行操作,例如:將結果匯總到Driver端(collect)、將結果輸出到HDFS(saveAsTextFile)等,這一步會真正地觸發(fā)執(zhí)行。

  常見的Transformation算子包括:map、filter、groupByKey、join等,這里面又可以分為Shuffle算子和非Shuffle算子,Shuffle算子是指處理過程需要對數(shù)據(jù)進行重新分布的算子,如:groupByKey、join、sortBy等。常見的Action算子如:count、collect、saveAsTextFile等

  如下是使用Spark編程模型編寫經典的WordCount程序:

“玩轉”華為云DLI  揭秘其背后的核心計算引擎

  Spark程序中涉及到幾個概念,Application、Job、Stage、Task。每一個用戶寫的程序對應于一個Application,每一個Action生成一個Job(默認包含一個Stage),每一個Shuffle算子生成一個新的Stage,每一個Stage中會有N個Task(N取決于數(shù)據(jù)量或用戶指定值)。

   Spark的架構設計

“玩轉”華為云DLI  揭秘其背后的核心計算引擎

  前面講述了Spark 核心邏輯概念,那么Spark的任務是如何運行在分布式計算環(huán)境的呢?接下來我們來看看開源框架Spark的架構設計。

  Spark是典型的主從(Master- Worker)架構,Master 節(jié)點上常駐 Master守護進程,負責管理全部的 Worker 節(jié)點。Worker 節(jié)點上常駐 Worker 守護進程,負責與 Master 節(jié)點通信并管理 Executor。

“玩轉”華為云DLI  揭秘其背后的核心計算引擎

  Spark程序在客戶端提交時,會在Application的進程中啟動一個Driver??匆幌鹿俜綄river的解釋“The process running the main() function of the application and creating the SparkContext”。

  我們可以把Master和Worker看成是生產部總部老大(負責全局統(tǒng)一調度資源、協(xié)調生產任務)和生產部分部部長(負責分配、上報分部的資源,接收總部的命令,協(xié)調員工執(zhí)行任務),把Driver和Executor看成是項目經理(負責分配任務和管理任務進度)和普通員工(負責執(zhí)行任務、向項目經理匯報任務執(zhí)行進度)。

  項目經理D to 總部老大M:Hi,老大,我剛接了一個大項目,需要你通知下面的分部部長W安排一些員工組成聯(lián)合工作小組。

  總部老大M to 分部部長W:最近項目經理D接了一個大項目,你們幾個部長都安排幾個員工,跟項目經理D一起組成一個聯(lián)合工作小組。

  分部部長W to 員工E:今天把大家叫到一起,是有個大項目需要各位配合項目經理D去一起完成,稍后會成立聯(lián)合工作小組,任務的分配和進度都直接匯報給項目經理D。

  項目經理D to 員工E:從今天開始,我們會一起在這個聯(lián)合工作小組工作一段時間,希望我們好好配合,把項目做好。好,現(xiàn)在開始分配任務…

  員工E to 項目經理D:你分配的xxx任務已完成,請分配其它任務。

  項目所有任務都完成后,項目經理D to 總部老大M:Hi,老大,項目所有的任務都已經完成了,聯(lián)合工作小組可以解散了,感謝老大的支持。

特別提醒:本網(wǎng)內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網(wǎng)有任何內容侵犯您的權益,請及時聯(lián)系我們,本站將會在24小時內處理完畢。

贊(0)
分享到: 更多 (0)
?
網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號
狠狠人妻熟妇av又粗又大| 九九视频麻婆豆腐在线观看| 国产微拍精品一区二区| 精东传媒VS天美传媒合作| 久久久久精品午夜福利| 免费久久人人爽人人爽AV| 欧美又粗又大XXXXBBBB疯| 少妇搡BBBB搡BBB搡| 无码专区狠狠躁天天躁| 亚洲欧美日韩精品久久| 1000部夫妻午夜免费| А√最新版在线天堂| 国产成人久久精品流白浆| 黑鬼吊太大少妇尖叫| 老头扒开粉嫩的小缝亲吻网站| 欧美日韩精品SUV| 四川50岁熟妇大白屁股真爽| 亚洲成AV人无码综合在线观看 | CHINESE叫床国语VIDE| 处破女处破全过程| 韩国三级HD中文字幕叫床| 麻豆丰满少妇CHINESE| 日本乱熟人妻精品中文字幕| 无人区一码二码乱码区别在哪| 亚洲免费成人av| 99精品国产综合久久久久五月天| 高潮大叫喷水发抖抽搐| 禁止18点击进入在线观看尤物| 妺妺和我裸睡玩我下春雨医生| 肉体粗喘娇吟国产AV精品| 亚洲AV女人18毛片水真多| 中文字幕日韩精品有码视频| 疯狂做受XXXX高潮不断| 精产国品一二三产区区| 欧美爽到高潮漏水大喷视频| 无码专区6080YY电影| 在线观看一区二区三区AV| 东京热一区二区三区| 精品无码AV一区二区三区少妇 | BGMBGMBGM毛多多| 国产乱子伦农村叉叉叉| 免费无码专区毛片高潮喷水| 少妇MM被擦出白浆液视频| 亚洲熟妇av一区二区三区浪潮 | 人伦亲情父母儿女的句子简短| 性无码一区二区三区在线观看| 最新国产AV无码专区亚洲AVY| 国产边做边吃奶AⅤ视频免费| 久久久久高潮毛片免费全部播放| 日本三级吃奶头添泬| 亚洲人成网站18禁止一区| 成人片黄网站A毛片免费| 精品熟女少妇AV免费久久| 日本适合十八岁以下的护肤| 亚洲国产欧美在线人成APP| 差差差很疼视频30分钟应用| 精品无码人妻夜人多侵犯18 | 成 人 色综合 综合网站| 精品亚洲国产成人| 色婷婷综合久久久久中文字幕| 野花韩国日本高清免费5| 绯色av一区二区三区蜜臀| 老汉扛起娇妻玉腿进入| 午夜无码大尺度福利视频| AV无码动漫一区二区三区精品| 国精品无码一区二区三区左线| 人妻AV无码专区| 亚洲中文精品久久久久久| 国产69精品久久久久久人妻精品| 蜜桃女同一区二区免费AV哟| 小SAO货边洗澡边CAO你| 白嫩极品女粉嫩喷水视频的| 久久久久久精品免费看SSS| 忘忧草在线影院WWW神马 | 欧美专区日韩视频人妻| 亚洲熟妇无码AV在线播放| 国产精品后入内射日本在线观看| 男朋友一晚弄了我5次正常吗 | 99国产精品久久久久久久成人| 黑人巨根在线观看| 色欲av夜夜嗨av性色av| 97超级碰碰碰久久久久| 久久国产精品无码HDAV| 无码精品A∨在线观看| 被老头侵犯的人妻| 免费 成 人 黄 色 网站69| 亚洲精品无码久久久影院相关影片 | 伦理电线在2019| 亚洲精品无码专区久久同性男 | 99久久国产宗和精品1上映 | 一区二区三区国产精华护肤品| 国产一区内射最近更新| 熟妇高潮喷沈阳45熟妇高潮喷| CHINESE中年熟妇FREE| 邻居把我弄的高潮三次面舞| 亚洲精品第一国产综合麻豆| 国产九九久久99精品影院| 色五月丁香五月综合五月亚洲| CHINESE熟妇与小伙子MA| 美女大BXXXXN内射| 亚洲午夜无码片在线观看影院百度| 国产毛片久久久久久国产毛片| 丝袜 中出 制服 人妻 美腿| 成年网站免费视频黄A站| 欧美人与动性XXXXBBBB| 中文在线ずっと好きだった| 久久精品国产亚洲夜色AV网站| 亚洲V欧美V日韩V国产V| 国产视频一区二区| 无套内内射视频网站| 国产互换人妻好紧HD无码| 色视频综合无码一区二区三区| 啊轻点灬大JI巴太粗熟妇| 欧美成人精品视频一区二区三区 | 老司机久久99久久精品播放免费| 亚洲欧美日韩综合久久久久| 禁欲少校大哥的囚禁| 亚洲国产AⅤ精品一区二区蜜桃| 国产婷婷内射精品1区| 午夜无码伦费影视在线观看果冻| 国产成人片无码视频在线观看| 上边一面亲下边一面膜的注意事项 | 一二三四在线视频观看社区 | 亚洲综合色婷婷七月丁香| 久久AⅤ无码AV高潮AV喷吹| 亚洲国产欧美一区二区三区 | 国产精品亚洲VA在线| 无码成A∧人片在线播放| 国产高潮呻吟无码精品AV| 挺进美妇肉蚌深处| 国产精品久久无码一区| 无码熟妇ΑⅤ人妻又粗又大| 国产精品无码一区二区牛牛| 午夜DJ影院免费直播观看完整版 | 成人免费无遮挡无码黄漫视频 | 免费国内接码在线接收| 666西方大但人文艺术| 欧美国产亚洲日韩在线二区| JEAⅠOUSVUE丰满少妇| 日本护士体内SHE精2╳╳╳| 丁香色婷婷国产精品视频| 特级西西人体444WWW高清大| 国产果冻豆传媒麻婆精东影视| 校园H学长含着粉嫩小奶| 黑人粗大猛烈进出高潮视频| 亚洲午夜无码久久| 免费人成视频X8X8入口APP| B里可以放多少个鸡蛋| 日产精品码2码三码四码区 | AV无码一区二区三区| 人人婷婷色综合五月第四人色阁 | 精产国品一二三区别9977| 亚洲制服丝袜中文字幕在线| 免费无码AV片在线观看播放| 别揉我奶头~嗯~啊~动漫网站| 色欲香天天天综合网站小说| 国产免费AV片在线观看| 亚洲人成网站观看在线播放| 免费无码又爽又刺激激情视频软件| FREE性中国熟女HD| 天堂√最新版中文在线地址| 国产在线观看无码免费视频 | 乱人伦人成品精国产在线| JAPANESEHD国产在线看| 熟妇人妻系列Av无码一区=区| 国产美女被遭强高潮网站免费 | 我的妺妺h伦浴室无码视频| 好爽又高潮了毛片| 中文在线一区二区| 日本在线视频WWW色| 国产熟女一区二区三区五月婷| 亚洲色成人www在线观看| 欧美丰满美乳XXⅩ高潮www| 饭桌上故意张开腿让公在线观看| 亚洲AV无码潮喷在线入口| 鲁死你AV资源站| 成人无码H免费动漫在线观看| 亚洲AV色无码乱码在线观看| 乱人伦人妻中文字幕在线入口| 产后漂亮奶水人妻| 亚洲AV成人无码久久精品澳门| 久久一区二区三区精华液| 成人嘿咻漫画免费入口| 亚洲GV天堂无码男同在线观看| 免费一对一真人视频| 国产AV永久精品无码| 亚洲夜夜性无码国产盗摄| 欧洲精品码一区二区三区免费看| 国产浮力第一页草草影院| 亚洲日韩在线中文字幕综合| 人妻一本久道久久综合久久鬼色| 国产男男GAY做受ⅩXX软件| 中国农村真卖BBWBBW| 天天躁日日躁狠狠躁婷婷高清| 久久久WWW成人免费毛片| 成在人线AV无码免观看麻豆| 亚洲欧美一区二区三区在线| 日本三线和韩国三线的市场定位| 寂寞夜晚看的MV字幕高清网站| ZLJZLJZLJ日本人水多多|