雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

昨天,我們舉辦了雲棲大會-阿里大數據分論壇。

意料之中,人氣爆表。

感謝老鐵們210分鐘不間斷,不離場。

從今天開始,我們會陸續將7個演講內容推送給大家,乾貨太太多,也請大家耐心等待。

阿里大數據分論壇-賦能商業,創造價值

通過串聯每個演講,我們將阿里十餘年在大數據領域 沉澱的技術能力和應用實踐對外分享,系統性介紹我們是如何構建一個從底層的數據採集、處理,到挖掘算法、應用、產品服務的全鏈路、標準化的大數據體系,使得超過EB級別的海量數據能夠高效融合,並以秒級的響應速度,服務並驅動阿里巴巴的業務和外部千萬用戶的發展。

1.阿里巴巴全域數據建設

梗概

阿里巴巴數據技術及產品部定位阿里數據中臺:以全域大數據建設爲中心,技術上覆蓋整個大數據從採集、加工、服務、消費的全鏈路的各個環節;對內對外提供服務。

豐富的大數據生態組件,構成了阿里的核心數據能力,我們通過大數據生態組件,可以迅速的提升數據應用的迭代能力,人人都有可能成爲大數據專家。

在全域數據建設過程中,還構建了阿里巴巴OneData體系作爲大數據標準化規範,從方法論到落地實踐;從對指標定義、數據研發、數據服務的口徑管理到數據規範定義、模型規範定義、研發流程的規範化;每個環節均有對應工具進行嚴格保障,並做到方便管理、問題追溯。(阿里巴巴高級技術專家 張磊)

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

2.阿里巴巴流計算實踐

梗概

阿里巴巴數據及技術產品部流計算服務於集團內外多個實時數據場景,涵蓋阿里巴巴集團大多數事業部,包括雙十一媒體大屏實時數據,面向商家的生意參謀實時數據,以及面向內部高管與小二的實時數據應用等等。

由於阿里巴巴雙11的獨特場景,2016雙11當天實時數據洪峯達到了近一億條記錄每秒;現在日常每天處理的記錄條數達到了萬億級別,每天處理的數據量也達到了PB級別;雙11媒體屏第一條記錄從交易表經過流計算計算處理到達HBase庫僅2.5秒。流計算達到了高精準、零誤差,exactly once地處理數據。

爲了應對雙十一巨大的數據洪峯,流計算團隊在引擎選擇,優化性能以及開發流計算平臺上積累了豐富的經驗。(阿里巴巴高級技術專家 陳同傑)

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

3.阿里巴巴人工智能驅動大數據

梗概

人工智能驅動大數據,要做的是把數據真正打通,深度挖掘數據的價值,爲業務創新應用提供數據決策基礎和依據。

依託於阿里巴巴全域數據體系,通過大規模圖算法,清理整合多源異構數據,實現千億級別實體的識別與鏈接。

基於融合的數據,結合機器學習和深度學習框架,阿里巴巴數據中臺研發並搭建自動化標籤生產系統,它可以實現:快速生產標籤,同時不斷優化標籤的產出,讓數據新能源賦能業務。

面向全域數據的知識圖譜,利用機器學習、NLP、深度學習等AI技術,助力打造智能化的數據中臺,實現數據接入、數據管理與數據應用的全面智能化。(阿里巴巴資深技術專家 楊紅霞)

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

4.阿里巴巴

數據服務和數據產品開發平臺

梗概

數據服務和數據產品開發平臺通過有機的組合發揮出阿里EB級數據的價值。

數據服務通過規範DSL標準和Query Engine、Push Engine、DAG編排、Algorithm Engine的組合對外提供了單一接口動態化查詢所有數據,和實時計算平臺打通數據秒級觸達應用,平均RT小於5毫秒的數據獲取能力,同時除了基礎數據指標輸出外,還實現了基礎服務能力之上提煉的動態邏輯、挖掘、算法能力的服務化輸出,完成了數據在業務間的全域流通。

數據產品開發平臺通過對阿里數年複雜業務場景下的實踐和抽象,通過變和不變的架構設計思路、跨端的大數據,提供一套可供非開發人員自助使用來實現阿里絕大多數數據產品需求的開放平臺,實現跨PC、手機、大屏的多端功能,提供數據分析能力、報表配置能力、產品配置能力、產品開發能力,解決非開發人員自助完成看數據、分析數據、使用數據的需求,完成數據對業務的直接賦能。(阿里巴巴資深技術專家 姚濱暉)

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

5.阿里巴巴數據資產管理體系

梗概

阿里巴巴數據中臺通過多年來在該領域不斷的深耕實踐,形成集資產分析、資產應用、資產優化及資產運營爲一體的全鏈路數據資產管理體系 :1)資產分析體系,實現數據資產可視化,所見即所有,全面把握及科學分析數據資產,並通過資產地圖,幫助用戶清晰查看及快速使用數據資產;2)資產治理體系,沉澱計算、存儲、質量、模型、安全、成本等六大治理領域,生成治理項,制定優化規則,實現從現狀分析、問題診斷、治理優化、效果反饋的資產治理閉環,並構建數據資產分評估模型衡量治理效果,通過打造治理工作臺實現資產治理的自動化、智能化,每年節省數億元的成本,資產治理效率提升50%。3)資產應用管理體系,通過研發全鏈路端端互通技術OneLog,構建採集端-生產端-服務端全鏈路閉環,實現從數據採集、數據加工生產、數據服務到用戶消費的全鏈路分析保障,包括數據質量、安全、時效性及穩定性保障;同時基於全鏈路血緣關係,評估計量數據成本,追蹤數據應用價值,實現產品及應用的ROI評估;(阿里巴巴高級技術專家 王偉)

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

6.阿里巴巴大數據智能技術

梗概

基於阿里巴巴多年實踐,將數據建模、數據處理、數據消費的多個數據處理環節打造爲一體化工作平臺。通過我們統一數據服務產品,以主題式的,業務邏輯方式查詢訪問數據,這些數據根據企業需求和階段不同,可以分爲垂直數據中心,全域數據中心,萃取數據中心。

在這三大數據體系之上,分別對應研發工作臺的不同功能組件提供支持。這些工具的背後,是阿里多年經驗和技術的積累,數據內核,將會幫助企業建立:業務邏輯模型、標準化數據定義、智能化物理模型管理、智能化計算框架生成最優代碼,並且兼容主流計算引擎。

利用我們的產品,我們可以快速幫助用戶建立了一套標準的數據生產流程,

賦能企業,實現數字化轉型。(阿里巴巴高級技術專家 王賽)

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

7.阿里巴巴大數據賦能實踐

【友盟+】

梗概

在當今人工智能的三要素,算法,計算和數據中,數據將是企業的競爭壁壘。數據的連接在應用中十分重要,可以幫助打破數據孤獨,爲最大化的提取數據價值打好堅實的基礎。

友盟+在多年的數據實踐中總結了大量的經驗,特別是在營銷和金融風控的場景中。在營銷中的人羣定向可以使用規則圈選或人羣放大,規則圈選雖然直觀,但對於人羣的區分往往過於簡單,而人羣放大可以利用算法做較精細的劃分。在實踐中也取得了比較好的效果。由於移動設備的普及,友盟+的數據在金融風控的場景中體現的獨特的作用,是風控數據的一個很好的補充。許多移動使用行爲的變量都體現了和風險較強的相關性,通過建模,友盟+爲大量的普惠金融企業提供了非常有價值的服務。(【友盟+】CDO 李丹楓)

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容

雲棲大會首日,超人氣分論壇——阿里大數據分論壇講了這些內容