百度世界2020大會技術乾貨硬核來襲,百度大腦6.0躍升AI新型基礎設施

9月15日,科技界年度盛會「百度世界2020」線上開幕。今年的百度世界大會由百度與「央視新聞」聯合呈現,上午剛剛結束的主論壇精彩紛呈,反響熱烈,花式登上熱搜:百度創始人、董事長兼CEO李彥宏與央視主持人康輝「虛擬人」亮相、顛覆搜索形態的「度曉曉」、去安全員的「全自動駕駛」……這些炫酷的背後離不開百度大腦的支撐。算法

百度大腦分論壇帶來這些「黑科技」的全面揭祕,展現了百度大腦的技術升級與演進。百度CTO王海峯發佈了百度大腦6.0,升級爲「AI新型基礎設施」。「知識加強的跨模態深度語義理解」讓百度大腦的理解能力更增強大,飛槳深度學習平臺與百度崑崙芯片的升級則爲開發者提供了更優的算法開發平臺和更強大的算力。國內首個面向疫情預測與追蹤的多方數據協做平臺、國內首個雲原生量子平臺重磅推出,提出AI安全三大維度……大量技術硬核來襲,百度大腦分論壇成爲中國百萬AI開發者的極客盛宴,詮釋着 「AI新型基礎設施」的巨大能量,這也成爲國內AI技術的「風向標」。編程

(百度CTO王海峯)安全

王海峯表示,「人工智能是第四代工業革命的核心科技,是國家推動‘新基建’重點建設的新型基礎設施,百度建設的AI基礎設施正是百度大腦,可以讓各行各業更高效、更全面、更深刻地應用人工智能技術,加快產業智能化進程。」架構

瞄定「AI新型基礎設施」,框架

百度大腦6.0締造AI基礎底座機器學習

栩栩如生、問答如流、認知接近人類甚至能夠機機對話、可在手機終端運行的「虛擬人」是大會最大的亮點之一,其背後的技術支撐,也是科技圈及開發者的聚焦點。百度大腦分論壇上,百度集團副總裁吳甜詳解百度大腦6.0,闡述了百度如何聚焦人工智能領域的前沿突破,來打造這一產品。工具

吳甜表示,百度大腦6.0的升級,瞄定的是國家戰略與政策角度中「推進互聯網、大數據、人工智能和實體經濟深度融合」的需求,往推進「新基建」、助力產業升級轉型的方向發力,承擔着「AI新型基礎設施」的重要角色。性能

(百度集團副總裁 吳甜)學習

對於百度大腦6.0的升級,吳甜從多個層次進行了歸納:在基礎層,飛槳深度學習平臺和百度崑崙AI芯片「軟硬一體」升級爲開發者打下了堅實的基礎;在技術層,百度大腦實現多項核心技術融合,造成知識加強的跨模態語義理解能力,例如基於圖像語言一體化理解技術,OCR的準確率提高了24%,基於語音語言一體化理解技術,語音識別的準確率和交互成功率也迎來大幅提高。具備認知能力的「虛擬人」更是這些史無前例技術的綜合展現。大數據

技術上的躍進,也在不斷加速產業智能化發展。「全國預警發佈」百家號可自動製做圖文內容,目前已發佈37.5萬篇,觸達用戶22.8億人次;水路運輸行業基於零門檻AI開發平臺EasyDL打造的首個且惟一基於 AI 識別船舶空滿狀態的智能水運調度平臺,空滿載識別準確率可達99.7%。

吳甜披露最新數據,百度大腦已經開放了273項AI能力,凝聚超過230萬開發者,建立超過31萬模型,並培養了超過100萬AI人才,有力推進了中國AI技術研發、實踐應用與生態建設。

芯片框架、核心算法全面演進

百度大腦「AI力」爆棚

百度大腦分論壇上,百度一衆AI大咖、科學家紛紛亮相,詳解百度大腦各個技術版塊。對於前沿趨勢與技術乾貨的呈現,囊括了AI芯片、框架、核心算法、AI安全,以及最前沿的數據聯邦和量子計算領域的進展。

(依次:百度語音首席架構師賈磊,百度視覺技術部總監丁二銳,百度知識圖譜部&大數據部高級總監朱勇,百度傑出架構師、文心(ERNIE)負責人孫宇,百度深度學習技術平臺部高級總監馬豔軍,百度智能芯片總經理歐陽劍)

基礎層,AI芯片是科技競爭的制高點,是歷史的趨勢。百度崑崙1已量產部署將近2萬片,在百度搜索引擎等部署,相比英偉達T4 GPU性能在不一樣模型下提高1.5-3倍。百度智能芯片總經理歐陽劍預發佈了國內首款雲端通用AI處理器「百度崑崙2」,採用更先進的7nm工藝,性能最高可超過前代三倍,預計明年初量產。

做爲「智能時代的操做系統」,深度學習框架下承芯片,上接應用。百度深度學習平臺飛槳公佈目前已適配15家硬件廠商、22種芯片型號,對國產硬件的支持力度業內第一。

百度深度學習技術平臺部高級總監馬豔軍帶來核心框架的技術進展。動態圖和API體系全面升級,飛槳實現了動態圖和靜態圖的統一,靈活性和效率兼顧,讓用戶更容易開發模型;全面升級的API體系,下降了編程複雜度,對於開發者更加友好。

英特爾的高級工程師Andres Rodrigus也在演講中提到深度學習框架與硬件配合打出的「組合拳」,能夠在AI任務上帶來更高的計算性能與精度。據介紹,第二代英特爾至強可擴展處理器能夠爲文心(ERNIE)在INT8上得到3倍的性能提高;第三代英特爾至強可擴展處理器在Bfloat16上更有利於訓練和推理等任務,可提供2倍多的計算性能和計算吞吐量。將來英特爾也將繼續與百度合做,在硬件層面爲飛槳提供更多的優化與特性。

此外,核心AI算法也迎來全面升級。百度語音技術迭代,語音識別層面,提出端到端的信號聲學一體化建模技術,可解決傳統數字信號處理和語音識別級聯繫統耦合嚴重、迭代困難問題;語音合成方面,實現了個性化TTS、多角色合成、單人千面等能力。百度語音首席架構師賈磊公佈,百度智能語音日均調用量超過155億。

百度視覺技術部總監丁二銳表示,視覺計算在端側的需求凸顯,模型小型化已成爲趨勢。百度大腦6.0讓視覺計算走向極致效率,基於PaddleSlim爲開發者開源Slim系列視覺模型,不只包括剛剛在CVPR低功耗計算視覺比賽得到冠軍的基礎模型,還包括計算量降低到1/7的人臉識別模型、僅有3.1M的文字識別模型。這次還開放了業界首發的兩款視頻生產SDK方案和一款端雲一體虛擬形象構建及應用解決方案,可在手機端賦予用戶2D虛擬真人、二次元等獨特的形象,構成了全面的人物生成生態。最後探討了以度目爲表明的視覺硬件在生產生活中的落地應用,正式開啓「軟硬一體」的視覺時代。

知識是人類在實踐中認識世界的成果,是人類智慧的結晶。百度知識圖譜部、大數據部高級總監朱勇帶來知識圖譜的最新進展。百度構建了世界最大規模的知識圖譜,擁有超過50億實體和5500億事實,並在通用圖譜的基礎上構建了事件圖譜、多模態圖譜、行業圖譜等,可讓人工智能在多領域都實現「心中有數」。目前,百度大腦的行業知識圖譜已經覆蓋了100多個行業場景,日均調用次數超過400億次。

語言是人類思惟的載體和溝通交流的工具。百度傑出架構師文心(ERNIE)負責人孫宇表示,百度語義理解技術與平臺文心ERNIE已經累計學習50億條知識。同時,提出了基於多流機制的預訓練語言生成技術ERNIE-GEN,可大幅提高天然語言生成任務效果;提出知識加強跨模態語義理解技術ERNIE-ViL,首次將場景圖知識融入到跨模態的預訓練模型中。

至此,在基礎層、感知層和認知層上,百度大腦6.0均實現了全新升級,不只讓人工智能更加接近人類,同時也爲廣大開發者提供了更加趁手的工具,助力多樣、複雜、深度的AI應用落地。

數據聯邦、量子計算兩大發布

首提AI安全三大維度

人工智能同時也在向數據聯邦、量子計算等領域融合。百度研究院大數據實驗室與商業智能實驗室主任竇德景發佈國內首個面向疫情預測與追蹤的多方數據協做平臺—百度數據聯邦平臺,具有安全數據存儲、雲上可信數據交換、大規模數據演算等特性,可以實現多個機構間的隱私數據融合、數據訪問與聯邦學習,目前已助力清華大學、西安交通大學,廈門大學等研究機構進行疫情研究。

(依次:百度副總裁馬傑,百度研究院大數據實驗室與商業智能實驗室主任竇德景,百度研究院量子計算研究所所長段潤堯)

量子計算被視爲面向將來的計算範式與生產力,繼5月20日百度推出量子機器學習工具量槳後,百度研究院量子計算研究所所長段潤堯再次帶來國內首個雲原生量子計算平臺量易伏QUANTUM LEAF,可提供QCompute等量子開發套件、縮短量子編程全生命週期、實現量子工具鏈閉環。量子脈衝計算服務量脈Quanlse、量子機器學習工具集量槳Paddle Quantum也獲得了全面升級,構建起百度量子平臺爲核心的量子生態,開啓屬於中國的量子時代。

百度大腦的AI能力正經過雲和開放平臺輸出給社會各界,支持各行各業智能化升級。此外,安全體系縱貫百度大腦各層,爲AI技術及應用保駕護航。百度副總裁馬傑首次提出AI安全研究的三大維度:Security、Safety和Privacy,即強對抗環境下的安全威脅、非對抗條件下天然環境所產生的真實威脅和數據安全與隱私保護。

在百度世界2020大會上,百度大腦分論壇爲開發者展現了最前沿的技術進展,以及從AI芯片、深度學習平臺到核心AI算法,再到數據聯邦及量子計算的重磅發佈與全新升級,這些技術乾貨,正在助推開發者實現本身的業務構想與AI應用,爲中國科研創新提供史無前例的加速度。正如王海峯所說:「百度堅持以科技創新爲驅動,以產業智能化升級爲方向,與社會各界一塊兒共同努力,加快新型基礎設施建設,爲社會經濟高質量發展貢獻力量。」

下載安裝命令

## CPU版本安裝命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle

## GPU版本安裝命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu