成人怡红院-成人怡红院视频在线观看-成人影视大全-成人影院203nnxyz-美女毛片在线看-美女免费黄

站長資訊網
最全最豐富的資訊網站

40億條/秒!Flink流批一體在阿里雙11首次落地的背后

40億條/秒!Flink流批一體在阿里雙11首次落地的背后

  阿里妹導讀:今年的雙11,實時計算處理的流量洪峰創紀錄地達到了每秒40億條的記錄,數據體量也達到了驚人的每秒7TB,基于Flink的流批一體數據應用開始在阿里巴巴最核心的數據業務場景嶄露頭角,并在穩定性、性能和效率方面都經受住了嚴苛的生產考驗。本文深度解析“流批一體”在阿里核心數據場景首次落地的實踐經驗,回顧“流批一體”大數據處理技術的發展歷程。

  隨著 11 月 11 日 12 點鐘聲的敲響,2020 年雙 11 的 GMV 數字定格在了 4982 億,在 Flink 實時計算技術的驅動下全程保持了絲般順滑滾動,基于 Flink 的阿里巴巴實時計算平臺也圓滿完成了今年雙 11 整體經濟體的實時數據任務保障,再次平穩度過全年大考。

  除了 GMV 媒體大屏之外,Flink 還支持了諸如搜索推薦實時機器學習,廣告實時反作弊,菜鳥訂單狀態實時跟蹤反饋,云服務器的實時攻擊探測以及大量基礎設施的監控報警等等重要業務。實時業務量和數據量每年都在大幅增長,今年的實時計算峰值達到了創紀錄的每秒 40 億條記錄,數據體量也達到了驚人的7 TB 每秒,相當于一秒鐘需要讀完 500 萬本《新華字典》。

  截止目前,我們的實時計算作業數達到了 35000 多個,集群總計算規模也達到了超過 150 萬核,在中國乃至世界范圍內都處于領先水平。至此,Flink 已經支持了阿里經濟體所有的實時計算需求,實現了全鏈路數據實時化,第一時間為消費者、商家以及運營人員帶來了數據的價值。

  但今年 Flink 技術演進帶來的價值不僅于此,基于 Flink 的流批一體數據應用也開始在阿里巴巴最核心的數據業務場景嶄露頭角,并在穩定性、性能和效率方面都經受住了嚴苛的生產考驗。

40億條/秒!Flink流批一體在阿里雙11首次落地的背后

  “流批一體”在阿里核心數據場景首次落地

  事實上,Flink 流批一體技術很早就在阿里巴巴內部開始應用了。Flink 在阿里的發展始于搜索推薦場景,因此搜索引擎的索引構建以及機器學習的特征工程都已經是基于 Flink的 批流一體架構。今年雙11,Flink 更進一步,利用流批一體計算能力,助力數據中臺實現更加精準的實時離線交叉數據分析和業務決策。

  阿里的數據報表分為實時和離線兩種,前者在諸如雙 11 大促場景下的作用尤為明顯,可以為商家、運營以及管理層提供各種維度的實時數據信息,并幫助其及時作出決策,提升平臺和業務效率。例如:在典型的營銷數據實時分析場景,運營和決策層需要對比大促當天某個時間段和歷史某個時間段的數據結果(比如大促當天 10 點的成交額和昨天 10 點成交額的對比),從而判斷當前營銷的效果,以及是否需要進行調控、如何調控等策略。

  在上面這種營銷數據分析場景下,實際上需要兩套數據分析結果,一套是基于批處理技術在每天晚上計算出的離線數據報表,一套是基于流處理技術算出當天的實時數據報表,然后針對實時和歷史數據進行對比分析,根據對比結果進行相關決策。離線和實時報表分別是基于批和流兩種不同計算引擎產出,即批和流分離的架構不僅會有兩套開發成本,更難以解決的是數據邏輯和口徑對齊問題,很難保證兩套技術開發出的數據統計結果是一致的。因此,理想的解決方案就是利用一套流批一體的計算引擎進行數據分析,這樣離線和實時報表將天然一致。鑒于 Flink 流批一體計算技術的不斷成熟,以及前期在搜索推薦場景的成功落地,今年雙 11 數據平臺開發團隊也展示出堅定的信心和信任,與 Flink 實時計算團隊并肩作戰,共同推動實時計算平臺技術升級,第一次讓基于 Flink 的流批一體數據處理技術在雙 11 最核心的數據場景順利落地。

40億條/秒!Flink流批一體在阿里雙11首次落地的背后

  今年由 Flink 團隊和數據平臺團隊共同推動的流批一體計算框架在雙 11 數據核心場景成功首秀,也得到了阿里數據中臺負責人朋新宇在業務層的認可:流批一體在技術上,實現了哪怕是多個計算處理模式,也只需要撰寫一套代碼就能兼容。在計算速度上比其他框架快1倍、查詢快4倍,給小二們搭建數據報表提升了4-10倍的速度。同時,由于”一體化”的特性,能實現實時與離線數據的完全一致。

40億條/秒!Flink流批一體在阿里雙11首次落地的背后

  除了在業務開發效率和計算性能上的進步,流批一體計算架構也讓集群資源利用率得到大幅提升。阿里的 Flink 實時集群經過最近幾年的高速擴展,已經達到了百萬核 CPU 的計算規模,上面運行著數萬個 Flink 實時計算任務。白天是實時數據業務的高峰期,晚上業務低峰期計算資源出現空閑,正好可以為離線批任務提供免費的計算資源。批和流一套引擎,運行在一套資源底座上,天然的削峰填谷,自然的混布,不僅節省了開發成本,同時也大幅節省了運維成本和資源成本。今年雙 11,基于 Flink 的流批一體數據業務,沒有額外申請任何資源,批模式全部復用 Flink 實時計算集群,集群利用率大幅提升,為業務方節省了大量的資源開銷,高效的資源模式也為后續更多業務創新提供了沃土。

  “流批一體”,Flink 十年磨一劍

  接下來讓我們從技術角度聊一下“流批一體”大數據處理技術的發展歷程。這要從開源大數據技術的鼻祖 Hadoop 開始談起,10 多年前 Hadoop 作為第一代開源大數據技術出現,MapReduce 作為第一代批處理技術解決了大規模數據處理問題,Hive 的出現更是讓用戶可以用 SQL 的方式進行大規模數據的計算。但隨著大數據業務場景的逐步發展,很多應用都對數據實時化產生了越來越強烈的需求,例如:社交媒體,電商交易,金融風控等行業。在這個需求背景下,Storm 作為第一代大數據流處理技術應運而生,Storm 在架構上和 Hadoop / Hive 完全不同,它是完全基于消息的流式計算模型,可以在毫秒級延遲情況下并發處理海量數據,因此 Storm 彌補了 Hadoop MapReduce 和 Hive 在時效性上的不足。就這樣大數據計算在批和流兩個方向都有了各自不同的主流引擎,并呈現出涇渭分明的格局,大數據處理技術經歷完了第一個時代。

  隨后大數據處理技術來到了第二個時代, Spark 和 Flink 兩款計算引擎在新時代陸續登場。Spark 相對于 Hadoop 和 Hive,具備更加完善的批處理表達能力和更加優秀的性能,這讓 Spark 社區迅速發展,并逐步超越了 老牌的 Hadoop 和 Hive,成為批處理技術領域的主流技術。但 Spark 并未止步于批處理技術,很快 Spark 也推出了流計算解決方案,即 Spark Streaming,并不斷進行改進完善。但大家都知道 Spark 的核心引擎是面向“批處理”概念的,不是一款純流式計算引擎,在時效性等問題上無法提供極致的流批一體體驗。但 Spark 基于一套核心引擎技術,同時實現流和批兩種計算語義的理念是非常先進的,與其具備相同流批一體理念的還有另一款新引擎 Flink。Flink 正式亮相比 Spark 稍微晚一些,但其前身是來自德國柏林工業大學 2009 年的研究項目 Stratosphere,至今也有 10 年之久。Flink 的理念和目標也是利用一套計算引擎同時支持流和批兩種計算模式,但它和 Spark 相比選擇了不同的實現路線。Flink 選擇了面向“流處理”的引擎架構,并認為“批”其實是一種“有限流”,基于流為核心的引擎實現流批一體更加自然,并且不會有架構瓶頸,我們可以認為 Flink 選擇了 ”batch on streaming“ 的架構,不同于 Spark 選擇的 “streaming on batch” 架構。

40億條/秒!Flink流批一體在阿里雙11首次落地的背后

  Flink 實現完善的流批一體架構也不是一蹴而就的,在早期的 Flink 版本中,Flink的流和批無論在 API 還是在Runtime 上都還沒有達到徹底的統一。但從 1.9 版本開始,Flink 開始加速在流批一體上進行完善和升級,Flink SQL 作為用戶使用的最主流 API,率先實現了流批一體語義,使得用戶只需學習使用一套 SQL 就可以進行流批一體的開發,大幅節省開發成本。

40億條/秒!Flink流批一體在阿里雙11首次落地的背后

  但是 SQL 并不能解決用戶的所有需求。一些定制化程度較高,比如需要精細化的操縱狀態存儲的作業還是需要繼續使用 DataStream API。在常見的業務場景中,用戶寫了一份流計算作業后,一般還會再準備一個離線作業進行歷史數據的批量回刷。但是 DataStream 雖然能很好的解決流計算場景的各種需求,但卻缺乏對批處理的高效支持。

  因此,Flink 社區在完成 SQL 流批一體升級之后,從 1.11 版本也開始投入大量精力對 DataStream 進行流批一體能力的完善,在 DataSteam API 上增加批處理的語義,同時結合流批一體 Connector 的設計,讓 DataStream API 能夠在流批融合場景下對接 Kafka 和 HDFS 等不同類型流批數據源。 接下來流批一體的迭代計算 API 也將被引入到 DataStream 中,進一步解鎖一系列機器學習的場景。

  在當前 Flink 主版本中,不管是 SQL 還是 DataStream API,在流批一體概念上都還是流計算和批計算功能的一個結合體。用戶編寫的代碼,需要選擇使用流的方式跑,還是批的方式跑。但有些業務場景已經提出更高的要求,即流批混合的需求,并且自動的在批和流之間自動切換,例如:數據集成以及數據入湖場景,用戶的需求是先把數據庫的全量數據同步到 HDFS 或者云存儲上,然后再自動實時同步 DB 中的增量數據上去,并在同步過程中進行 流批混合的 ETL 數據處理,Flink 也將在后續繼續支持更加智能的流批融合場景。

  Flink “流批一體”技術在阿里巴巴的發展歷程

  阿里巴巴是國內最早選擇 Flink 開源技術的公司,在 2015 年我所在的搜索推薦團隊希望面向未來5-10 年的發展,選擇一款新的大數據計算引擎,用來處理搜索推薦后臺海量商品和用戶數據,由于電商行業對時效性具備非常高的訴求,因此我們希望新的計算引擎既有大規模批處理能力,也具備毫秒級實時處理能力,即一款流批統一的引擎,當時 Spark 的生態已經走向成熟,并且通過 Spark Streaming 提供了流批一體的計算能力,而 Flink 當時剛剛在前一年成為Apache頂級項目,還是一個冉冉升起的新星項目,當時團隊內部針對 Spark 和 Flink 經過了一段時間的調研和討論,一致認為雖然 Flink當時生態并不成熟,但其基于流處理為核心的架構對于流批一體的支持更加合適,因此非常迅速的做出決定,在阿里內部基于開源 Flink 進行完善和優化,搭建搜索推薦的實時計算平臺。

  經過團隊一年的努力,基于 Flink 的搜索推薦實時計算平臺成功的支持了2016 年的搜索雙 11,保證了搜索推薦全鏈路實時化。通過在阿里最核心業務場景的落地證明,也讓全集團都認識了 Flink 實時計算引擎,并決定將全集團實時數據業務都將遷移到 Flink 實時計算平臺上。又經過一年的努力,Flink 在 2017 年雙 11 不負眾望,非常順利的支持了全集團雙 11 的實時數據業務,包括 GMV 大屏等最核心的數據業務場景。

  2018 年 Flink 開始走向云端,阿里云上推出了基于 Flink 的實時計算產品,旨在為廣大中小企業提供云計算服務。飲水思源,阿里巴巴不僅希望利用 Flink 技術解決自己業務的問題,同樣也希望能夠推動 Flink 開源社區更快的發展,為開源技術社區做出更多貢獻,因此阿里巴巴在 2019 年初收購了 Flink 創始公司和團隊 Ververica,開始投入更多資源在 Flink 生態和社區上。到了 2020 年,國內外主流科技公司幾乎都已經選擇了 Flink 作為其實時計算解決方案,我們看到 Flink 已經成為大數據業界實時計算的事實標準。

40億條/秒!Flink流批一體在阿里雙11首次落地的背后

  接下來,Flink 社區不會停止技術創新,在阿里巴巴業務場景中流批一體技術已經從理論走向落地。2020 年的雙 11,Flink 流批一體技術在天貓營銷決策核心系統中給出了精彩的表現,加上之前已經在搜索推薦中成功運行的流批一體索引構建以及機器學習流程,充分驗證了5 年前我們大膽選擇 Flink 技術體系的正確性,相信未來我們將會在更多公司看到 Flink 流批一體技術的落地。

  “流批一體”技術創新,推動 Flink 開源社區蓬勃發展

  Flink 堅持流批一體技術創新之路,也自然推動 Flink 開源社區的高速發展和生態的加速繁榮。我們欣喜的看到,隨著 Flink 在國內更多公司的加速落地,來自中文社區力量日益龐大,已經開始逐漸超越國外成為主流。

  首先最明顯的是用戶數量的增多,從今年 6 月份起,Flink 中文郵件列表的活躍度開始超越英文郵件列表。隨著大量的用戶涌入 Flink 社區,也帶來了更多的優秀代碼貢獻者,有效的促進了 Flink 引擎的開發迭代。

  自 1.8.0 版本以來,Flink 每個版本的 Contributor 數量都在提升,其中大多數都是來自國內的各大企業。毫無疑問,來自國內的開發者和用戶群體,已經逐漸成為推動 Flink 向前發展的中堅力量。

40億條/秒!Flink流批一體在阿里雙11首次落地的背后

  中文社區的不斷壯大,使得 Flink 整體的活躍度和 2019 年相比有增無減。在 Apache 軟件基金會 2020 財年的報告中,Flink 蟬聯了年度最活躍項目(通過 user+dev 郵件列表活躍度)。與此同時,在代碼 Commit 次數和 Github 主頁流量這兩項指標上,Flink 均排名第二。能在 Apache 軟件基金會接近 350個 頂級項目中取得如此成績,著實不易。

  Flink Forward Asia 2020,“流批一體”技術揭秘

  Flink Forward 是由 Apache 官方授權的 Flink 技術大會, 今年 Flink Forward Asia (簡稱:FFA) 大會全程采用在線直播的方式,免費為廣大開發者提供一場開源大數據技術盛宴,足不出戶可以在線觀看來自 阿里巴巴、螞蟻科技、騰訊、字節跳動、美團、小米、快手、B 站、網易、微博、Intel、DellEMC、Linkedin 等國內外一線互聯網公司針對 Flink 的技術實踐分享和技術創新。

  流批一體也將是本屆 FFA 大會的熱門話題,來自天貓數據技術負責人將會給大家分享 Flink 流批一體技術在阿里的實踐和落地,讓大家看到流批一體技術是如何在雙 11 最核心的場景中發揮業務價值;來自阿里巴巴、字節跳動的 Flink PMC 和 Committer 技術專家將圍繞 Flink 流批一體 SQL 和 Runtime 進行深度技術解讀,為大家帶來 Flink 社區的最新技術進展;來自騰訊的游戲技術專家將為大家帶來 Flink 在國民游戲王者榮耀中的應用實踐;來自美團的實時大數據負責人將為大家介紹 Flink 如何助力生活服務場景實時化;來自快手大數據負責人將為大家帶來 Flink 在快手的前世今生發展歷程;來自微博的機器學習技術專家將為大家帶來如何利用 Flink 進行信息推薦。此外,Flink 相關的議題還涵蓋了金融、銀行、物流、汽車制造、出行等各行各業,呈現出百花齊放的繁榮生態景象。歡迎對開源大數據技術有熱情的開發者能參加本屆 Flink Forward Asia 技術大會,了解更多 Flink 社區最新技術發展和創新。大會官網:http://flink-forward.org.cn

40億條/秒!Flink流批一體在阿里雙11首次落地的背后

特別提醒:本網內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

贊(0)
分享到: 更多 (0)
?
網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
欧亚尺码专线欧洲B1B1| 国产欧美国产综合每日更新| 成人网站在线进入爽爽爽| 国产XXXX69真实实拍| 宝宝好大我都握不住了视频| 粉嫩av一区二区网站入口| 国产精品妇女一二三区| 狠狠噜天天噜日日噜AV| 精品一区二区三区自拍图片区| 老熟女重囗味HDXX70星空| 欧美性色XXⅩXXA片HD| 日韩精品专区AV无码| 无码人妻一区二区三区免水牛视频 | 国产成人AV男人的天堂| 国精产品一二三四线免费| 久久亚洲精品国产精品| 欧美无人区码卡二卡3卡2022| 色综合久久88色综合天天| 国产AV寂寞骚妇| 国产午夜片无码区在线观看爱情网 | 免费一对一真人视频| 日产亚洲一卡2卡3卡4卡网站| 无遮挡呻吟娇喘视频免费播放| 亚洲另类激情综合偷自拍图| 2021自拍偷在线精品自拍偷| 成人综合激情另类小说| 韩国理论电费2023最| 蜜臀av午夜福利| 色综合久久综合欧美综合网| 亚洲国产精品国自产拍AV| 2021久久精品国产99国产精| 高清国语自产拍免费视频| 狠狠色噜噜狠狠狠888米奇| 蜜臀AV无码一区二区三区小说 | 亚洲另类精品无码专区| A级毛片无码久久精品免费| 国产激情久久久久影院蜜桃AV | 国产日韩综合一区二区性色AV| 久久香蕉综合色一综合色88| 日本最新免费二区三区| 亚洲国产精品成人AV在线| CSGO未满十八岁能玩多久| 国产帅男男GAY网站视频| 免费无码AV一区二区| 无码人妻AV免费一区二区三区 | 日韩人妻无码一区2区3区| 亚洲成AV人综合在线观看| AV无码精品一区二区三区| 国产视频一区二区| 欧美成妇人吹潮在线播放| 午夜精品久久久久9999| 137肉体摄影日本裸交| 国产日产精品_国产精品毛片| 女生输了给对方玩一个月| 香港三香港日本三级在线理论| 中文字幕在线不卡一区二区 | 亚洲爆乳无码专区| YSL千人千色T9T9T9T9| 激情内射亚洲一区二区三区| 日本亲近相奷中文字幕| 亚洲一线产区二线产区分布图片| 伽罗ちゃんが腿法| 乱码人妻Av一区二区三区| 无码一区二区三区中文字幕| AAA日本高清在线播放免费观看| 国外B站推广网站| 日本一线和三线的区别| 又大又粗又爽A级毛片免费看| 国产精品成人嫩草影院| 女局长白白嫩嫩大屁股| 亚洲国产成人久久一区WWW| 村长用力挺进她的花苞啥电视 | 精品无人区一区二区三区的特点| 色综合天天综合网国产| 1000部又爽又黄无遮挡的视频| 国产农村妇女毛片精品久久 | 把腿张开老子臊烂你| 久久WWW免费人成_看片中文| 挽起裙子迈开腿坐上MBA| A级毛片免费观看网站| 久久久久精品老熟女国产精品| 无卡无码无免费毛片| ZZIJZZIJ亚洲日本少妇| 久久亚洲AⅤ精品网站| 小雪尝禁果又粗又大的中国地图| 宝贝你下面喷潮了| 麻豆视传媒官方直接进入| 亚洲国产精品久久青草无码 | 成人精品视频99在线观看免费| 麻花传媒剧国产MV在线看| 亚洲爆乳无码一区二区三区| 国产成人亚洲影院在线| 人妻中文乱码在线网站| 自拍日韩亚洲一区在线| 精品久久久久久中文字幕大豆网| 玩弄JAPAN白嫩少妇HD小说| 亚洲AV无码日韩精品影片| 夫では満足できない人妻| 欧美性猛交XXXX免费看蜜桃| 岳今晚让我玩个够肥水一体探岳体 | 狠狠婷婷色五月中文字幕| 我把英语课代表按在桌子上抄 | AV永久天堂一区二区三区| 乱子伦熟睡亚洲1区| 亚洲一区在线日韩在线尤物| 狠狠综合久久综合88亚洲| 午夜理论片免费播放| 国产成人乱码一二三区18| 色妞WW精品视频7777| 宝宝腿趴开一点就不会疼的原因 | 久久亚洲日韩看片无码| 亚洲麻豆AV成本人无码网站| 狠狠久久精品中文字幕无码| 亚洲AV成人中文无码专区| 国产精品xxxxav| 天天做天天爱天天爽综合网 | 妺妺窝人体色77777791| 野花韩国视频观看免费高清的| 精品久久香蕉国产线看观看亚洲| 亚洲AV成人综合五月天在线观看| 国产精品人人爽人人做我的可爱| 天美传媒自制剧免费观看| 国产成人精品无码一区二区三区| 日韩欧美视频一区| 成年午夜免费AⅤ在线观看| 人妻无码一区二区在线影院| АⅤ资源新版在线天堂| 漂亮人妻中文字幕丝袜| YW尤物爆乳网站点击进入| 青梅被从小摸到大H补课1视频 | 无码人妻精品一区二区蜜桃百度| 国产成人亚洲精品无码MP4| 色综合久久中文综合网| 国产成人乱码一二三区18| 无码人妻精品一区二区蜜桃不卡| 国产乱人伦偷精品视频不卡| 小说 亚洲 无码 精品| 国内精品久久久久久久999| 亚洲AV无码一区二区三区鸳鸯影 | 欧美大波少妇在厨房被| FUCK东北老熟女人HD叫床| 人妻无码AⅤ中文系列久久免费 | 337P粉嫩胞人体高清视频免费| 欧美成人精品视频一区二区三区 | 无码中文国产不卡视频| 国色天香在线视频免费观看| 亚洲精品色无码AV试看| 久久婷婷日日澡天天添| 91人妻人人爽人人澡人人精品| 人妻少妇乱子伦无码专区| 嗯啊开小嫩苞好深啊H视频| 无码人妻一区二区三区麻豆| 国产真实自在自偷| 亚洲色大成网站WWW久久| 妺妺窝人体色WWW精品777| 白嫩的18SEX少妇HD| 水蜜桃国产成人精品网站| 国产在线看片无码不卡| 亚洲性色AV片在线观看网址| 美女高潮黄又色高清视频免费| A级毛片免费观看在线| 色欲av一区二区三区蜜臀| 国产午夜精品久久久久免费视| 亚洲一区二区三区无码国产| 女少18XⅩXX性XXXXHD| 大胸美女污污污WWW网站| 亚洲AV乱码一区二区三区按摩| 久久久久蜜桃精品成人片| 99久久久无码国产精品性| 四季AV无码专区AV| 精品国产成人A区在线观看| 无遮挡无码H纯肉动漫在线观看| 精品久久久久久成人AV| 18禁裸男晨勃露J毛免费观看| 人妻精品久久一区二区av| 国产精品久久久久9999高清| 亚洲日韩亚洲另类激情文学一| 你看桌子上都是你流的| 放荡娇妻张开腿任人玩H| 亚洲精品无码成人片| 欧美乱强伦XXXXXXXXXX| 国产精品99精品无码视亚| 亚洲性无码AV在线DVD| 人妻免费一区二区三区最新| 国产无遮挡又黄又爽动态图| 在线观看亚洲AV每日更新| 色多多WWW视频在线观看免费| 精品成人毛片一区二区| CHINA中国人CHINESE| 性丰满ⅩXXOOO性FREE| 妺妺窝人体色WWW看美女| 国产成人精品久久一区二区 | 欧美大香线蕉线伊人久久| 国产成人精品A∨一区二区| 亚洲中文字幕无码中文字在线| 日本高清二区视频久二区| 激情综合丁香五月| 宝贝张开腿嗯啊高潮了视频| 亚洲国产精品久久久久爰色欲| 人人妻人人躁人人爽精品 |