海量非結構化數據「超可用」在哪兒?這是愛數給出的答案

數據大爆炸時代,海量非結構化數據管理需要一種全新的智慧。

11月2日,愛數舉辦了一場線上發佈會,發佈了全新的AnyBackup Family 7海量非結構化數據超可用解決方案。關注愛數的都知道,AnyBackup是愛數的一張王牌產品,它通過先進的CDM、CDP、雙活、備份集技術以及BCS服務,聯合各類數字化技術,在數據超級多、系統超級複雜、環境超級異構的挑戰下,更普適性地助力企業和組織從數據到平臺再到應用的可用性建設。

而這一次的發佈,愛數更加強調了「快」,快到超乎想象。這讓我們充滿了好奇,究竟能有多快?

除了這個疑問以外,還有一點值得強調,那就在今年的七月份,愛數剛剛發佈了全新的企業內容管理平臺AnyShare Family 7。在短短的幾個月連續對兩大產品線進行升級,足見愛數對數據管理市場的拓展能力和決心。

那麼,這一次,愛數AnyBackup Family 7的超可用能力在哪兒?快在哪兒?透過本文,我們來尋找答案。順便管中窺豹,來看看高密集推陳出新的背後,愛數數據管理的大智慧。

海量非結構化數據,管理很難

我們常常說非結構化數據管理難題,很多人可能體會不到。以個人爲例,現在,隨着移動端發展,我們每個人都有大量的音頻、視頻、照片存在手機裏,積累的多了,有的人怕手機丟失,這就產生了非結構化數據管理難題。不少人上傳到網盤、QQ空間以做備份。

當然,這只是一個簡單的比喻,因爲,企業級數據的管理可比個人難多了。個人數據丟了也沒什麼大事,企業數據丟了將將造成重大經濟損失。

而且,現在,非結構數據存在於各行各業,比如,銀行的票據影像、醫院的PACS影像、檔案館的檔案數字化文件、製造業的設計圖紙以及生產質量數據等等,都是典型的非結構化數據。

數據量有多大?據IDC 預測,到2025 年全球產生的數據量將會增長到175ZB,其中超過80%-90%的數據都會是處理難度較大的非結構化數據。這就意味着,對非結構化數據的處理,將是每一家企業都必須重點突破的課題。

接下來,我們再從幾個具體例子來看看非結構化數據的管理難題。

比如在金融行業,金融行業的數據主要是身份證掃描件、現場照片、紙質文件的掃描件等電子影像,雖然文件大小隻有幾十KB,但增量大,每天能增加1-2TB。而且金融行業需要在規定的時間內完成備份,有的企業採用NDMP的備份方案,備份速度只有幾十MB/s。在數據恢復方面,一般需要1-2天,如果需要緊急恢復,則需要大量人工。

某省級的檔案館的數據管理也存在問題。現在國家正在建設數字檔案館,檔案館主要是數字化文件,傳統備份方案備份速度僅有 2-3 MB/s,而且曾經因爲網絡抖動的問題,將近1年時間內都無法完成全備。數據恢復方面,1M、100KB、40KB 大小的海量小文件的備份性能會急劇下降,有時甚至會降至0。此外,還存在數據利用難、查詢難的問題。

製造企業也十分典型,製造業主要包括生產工藝、產品說明、圖紙、採購合同等數據,由於數據量太大,備份常常需要七十多個小時,有時迫於無奈,只能選擇備份部分核心數據。而且大批量恢復速度慢,且無法精準恢復單個文件。

以上幾個案例都在指向,海量非結構化數據下的數據管理亟需新的備份方式。

AnyBackup Family 7,「超」在哪?

承接上文,有人可能說了,關於數據管理、NDMP、對象存儲等不都是解決方案嗎?

這些傳統的非結構化數據管理解決方案弊端很多,比如,NDMP不支持海量場景,傳統的NAS存儲複製可能被單一品牌存儲綁,對象存儲是生產或者歸檔存儲,不能完成數據備份,因爲只能存儲最新的數據,不能保存歷史數據。

愛數AnyBackup Family 7都能避免這些問題,並能以「超快」「超可用」優勢有效解決備份慢、恢復慢、備份數據不可查詢三座壓在備份恢復頭上的大山。能有多快?我們一一解釋。

備份快,AnyBackup Family 7,採用CDM的方式,通過多線程、多客戶端技術,實現對海量併發數據的讀取,能提高文件讀取效率,打破單文件性能讀取的瓶頸。此外,通過永久增量,解決了NDMP不能備份的問題,實現一次性備份,幫助客戶節約大量的備份時間和帶寬資源。還有一個關鍵問題,傳統解決方案需要將非結構化數據進行合成後再存儲,AnyBackup Family 7可實現對原生數據的部分複製,0合成時間,大大提升了備份效率。

恢復快,AnyBackup Family 7提供了多個場景的數據恢復的方式,針對原機實現完整恢復、掛載恢復、細粒度恢復,恢復速度快,其中,細粒度恢復可以單獨恢復選定的數據。同時,AnyBackup Family 7也可針對高端行業的開發測試、容災站點提供掛載恢復和自動恢復功能,給開發測試和數據在異機查詢帶來極大便利。

多種恢復方式,AnyBackup Family 7提供的自動恢復、掛載恢復、細粒度精準恢復在內的多種恢復方式,給予客戶更大選擇空間,讓客戶可以根據需求選擇恢復方式,這種靈活性也是「快」的體現。

那具體有多快?通過數據來說明。這麼說吧,傳統方式1小時只能完成備份36萬個文件,AnyBackup Family 7在1小時可以內可以完成1千萬個文件的備份,是傳統災備方案效率的27.8倍。面對1PB且單個文件大小約1MB左右的數據,傳統方案備份恢復完成需要155天,愛數則可以實現數據分鐘級可用,達到了傳統方案的10000倍。

愛數,在數據服務賽道堅定前行

不得不說,愛數選擇了一個很好的賽道。並且能在這個賽道上,穩紮穩打,一步一個腳印地大踏步向前走。

當前,各個行業都在迎來數字化轉型浪潮。此過程中,數據成爲新的生產資料,挖掘數據的價值,提高企業管理和決策水平已成共識,整個行業進入數據智能時代。

賽道選擇對了,然後呢?當然是自身要有真實力,尤其是產品方面,要有豐富的產品體系去打「組合戰」,覆蓋更多的場景,並且能夠根據技術發展趨勢去升級創新。這兩點,愛數都做到了。

現在,愛數擁有豐富的產品系列,AnyBackup災備雲、AnyShare智能內容雲、AnyRobot日誌雲、AnyDATA洞察雲等等,每一個單獨拿出來都是能單打獨鬥的「利器」,組合在一起,又打造出非結構數據智能化管理的綜合性解決方案,覆蓋數據應用的方方面面,展示出愛數在數據管理領域的綜合實力。

當然,產品線豐富的同時,也會給創新升級帶來挑戰,因爲,一旦某個產品創新方面掉隊,就會出現短板。

當前,愛數不遺餘力地實現整個產品線的同步升級,在開篇提到的愛數AnyShare Family 7的全新發布,其功能更加豐富,更加有效地解決海量非結構化數據的內容管理問題。再加上這次的AnyBackup Family 7,兩大產品幾乎同步升級,聯合打造出全新的突破方案——海量小文件高性能備份恢復解決方案,進而保證愛數整體的數據服務能力。

憑藉深入的市場服務,愛數業務覆蓋面快速擴展,擁有政府、企業、醫療、教育、金融等諸多領域的20000+客戶。在數據服務上,愛數用明確的市場動作表明,我們是一家縱橫市場多年的企業,將不斷加深「大數據基礎設施提供商」的身份,穩固智能數據服務領導者地位。

總結全文,海量數據時代,數據備份、恢復、查詢,每一個單獨拿出來都是一個宏大的課題,而且這個課題的難度會隨着智能化趨勢而增加。在挑戰中看出機遇,堅守數據服務市場,這對愛數來說,是唯一的目標,而且,我們能很明顯的看到,愛數爲實現這一目標所做的每一步的正確性,包括這次AnyBackup Family 7全新發布,隨着時間的推移,我們會看到它的價值。我們堅信,數據大市場,未來雖然遙遠,但愛數的表現一定是超可期的。