百度工程師親授CCF BDCI解題思路,15萬大獎等你來拿

在人工智能和大數據競賽領域,由中國計算機學會舉辦的CCF大數據與計算智能大賽(CCF BDCI)一直是衆多開發者追逐的頂級賽事。 

本屆大賽值得關注的是,百度和清華大學在算法賽道貢獻了「千言:多技能對話」賽題。不僅如此,大賽在原有賽道外,首度設立了全新的「自主平臺」賽道,百度首發 「遙感影像地塊分割」 賽題,飛槳作爲該賽題的指定深度學習平臺爲選手提供技術支持。兩道賽題總獎池達15萬。無論你是CV還是NLP方向的開發者,這裏都有你展示的舞臺!

 百度工程師爲你答疑解惑 

 AI Studio練習場助你衝榜 

 

本屆大賽的賽題由來自清華和百度自然語言處理部的資深工程師親手打造,賽題及數據均來自一線產業實踐場景。 

百度大腦AI Studio同步開放了【千言:多技能對話】和【遙感影像地塊分割】練習場。併爲各位參賽者帶來了如下幾大福利:

額外測試提交機會:練習場爲參賽選手提供A榜階段每天附加1次的提交機會,助力你更好地驗證模型效果,【千言:多技能對話】任務更是在排行榜中公佈具體評測指標得分,助力選手進一步提升成績。

免費GPU算力:百度大腦AI Studio練習場爲參賽選手額外發放100小時GPU Tesla V100算力卡,報名即可在數據下載頁獲得算力碼申請地址。 

官方基線系統:報名即可在數據下載頁獲得可一鍵Fork的基線系統。

練習賽附加獎項:除主賽場獎池外,在練習賽中排名前50的隊伍可獲得飛槳紀念品一份。 

百度工程師親授解題思路:來自百度的出題老師已對賽題進行了詳盡講解,直播錄像整理中,屆時會在賽題討論羣中發出。同時,出題老師也將會在羣內爲大家答疑解惑。快快掃碼進羣吧!

【千言:多技能對話】討論羣

【遙感影像地塊分割】討論羣

目前,【千言:多技能對話】和【遙感影像地塊分割】賽題已經正式對外發布,快來一探究竟吧!

 千言:多技能對話 

百度X清華強強聯合  多技能多領域綜合評判

近年來,人機對話技術受到了學術界和產業界的廣泛關注。學術上,智能人機對話是人工智能領域中最具挑戰的技術難題之一,涵蓋任務式對話與開放域對話,其發展影響及推動着語音識別與合成、自然語言理解、對話管理以及自然語言生成等研究的進展;產業上,衆多產業界巨頭相繼推出了人機對話技術相關產品,並將人機對話技術作爲其公司的重點研發方向。極大地推動了人機對話技術在學術界和產業界的發展。 

作爲智能人機對話的重要子課題,開放域對話技術旨在建立一個開放域的多輪對話系統,使得機器可以流暢自然地與人進行語言交互,既可以進行日常問候類的閒聊,又可以完成特定功能,以使得開放域對話技術具有實際應用價值,例如進行對話式推薦,或圍繞一個主題進行深入的知識對話等。 

目前,學術界已經公開了多個面向開放域對話建模的開源數據集。但大多數研究工作僅關注模型在單一或少量數據集上的效果。儘管一些模型在單一數據集上取得了很好的效果,但缺乏在多個不同技能、不同領域數據上的評價,與真正很好的解決開放域對話這一技術挑戰還有一定距離。因此,本次競賽數據基於千言數據集(https://www.luge.ai)及清華開放數據集(https://github.com/thu-coai/CDial-GPT)進行構建,這個數據集收集了一系列公開的開放域對話數據,並對數據進行了統一的整理以及提供了統一的評測方式,期望從多個技能、多個領域的角度對模型效果進行綜合評價。 

其中,「千言」是百度聯合中國計算機學會、中國中文信息學會共同發起的,由來自國內多家高校和企業的數據資源研發者共同建設的中文開源數據集及評測項目。本次競賽數據集旨在爲研究人員和開發者提供學術和技術交流的平臺,進一步提升開放域對話的研究水平,推動自然語言理解和人工智能領域技術的應用和發展。 

本次競賽的開放域對話數據集包含多個數據,涵蓋了多個功能場景:包括日常閒聊對話,知識對話、推薦對話等。我們旨在衡量開放域對話模型在各個不同技能上的效果和模型通用性。

 遙感影像地塊分割 

多源異構遙感數據 真實場景語義分割

在剛剛過去的夏天裏,我國南方諸多地區遭遇洪澇災害,對大家的經濟生活造成了重大損失。自然災難無情,但我們卻逐漸有了更多的技術能力,在洪澇災害預測、抗洪救災等方面發揮作用,遙感技術便是其中之一。 

通過對典型涉災區域的基礎地理數據集以及受災前後的遙感數據集進行分析,遙感技術能夠爲地方政府、減災機構和科研院所提供大量科學的數據支撐和信息保障,幫助把災害損失降至最低,也能加速災後重建。 

此外,對遙感影像進行像素級內容解析,業界人士可以對遙感影像中感興趣的類別進行提取和分類。遙感影像地塊分割不僅在防汛救災領域體現出極高的實用價值,在城鄉規劃、工業領域也受到了廣泛關注。 

本次大賽希望選手能夠利用人工智能技術,對多來源、多場景的異構遙感影像數據進行充分挖掘,打造高效、實用的算法,提高遙感影像的分析提取能力。具體來看,需要考察選手基於飛槳打造的遙感影像語義分割模型在建築、耕地、林地、水體、道路、草地6個類別上的效果。 

在複賽階段,測評指標會加入區域連續性等評判標準。由於遙感影像的特殊性,道路、河流分割一直是遙感領域的一大難題。道路、河流這類區域在遙感圖像上寬度一般不超過10個像素,使用視覺算法進行分割時,往往不能保證這類區域被完整、連續地分割出來。複賽階段就是針對這類實際難題展開角逐。 

本次比賽數據來自中科北緯(北京)科技有限公司提供的真實遙感數據,中科北緯是一家集應用軟件研發、技術服務於一體的科技創新型企業,也是測繪地理信息全產業鏈的解決方案提供商。參賽隊可以基於這些數據構建自己的語義分割模型,解決實際問題。 

海闊憑魚躍,天高任鳥飛。作爲國內AI及大數據方面的大型比賽擂臺,CCF BDCI的規模與影響力均屬行業頂級,同時賽題全面、評審專業、獎品豐厚。如果你也想要一展身手,與各路大神同臺競技,那麼千萬不要錯過哦!

????

現在,在「知乎」也能找到我們了

進入知乎首頁搜索「PaperWeekly」

點擊「關注」訂閱我們的專欄吧

關於PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公衆號後臺點擊「交流羣」,小助手將把你帶入 PaperWeekly 的交流羣裏。