數據湖

海量儲存

快速加工

靈活分析

指導決策

一個集中化分佈式存儲海量的多種來源,多種類型數據,並可以對數據進行快速加工,具有靈活多樣的分析工具的平台,其本質上是一套適應大數據時代更加先進的企業數據架構

平台簡介

“ 一個集中式分佈化存儲庫,允許以任意規模存儲所有結構化和非結構化數據 ”

一個集中式分佈化存儲庫,允許以任意規模存儲所有結構化和非結構化數據,可以按原樣存儲數據,並運行不同類型的分析,包含可視化到大數據處理、實時分析和機器學習,以指導企業做出更好的決策的系統

平台功能

Platform Function

提供高可靠性、高性能、可伸縮的分佈式存儲系統及可擴展的大規模數據處理能力

採用Hadoop框架體系在一定程度上降低單位存算成本的同時統一承載海量結構化、半結構化及非結構化數據

提供豐富的數據計算分析引擎

具備對結構化、半結構化和非結構化數據進行多層次融合分析的能力,包含批處理、流式計算、交互式分析到機器學習等各類計算引擎

具有完善的數據管理能力

可以管理各類數據相關的要素,包括數據源、數據格式、連接信息、數據schema、權限管理等。不僅能存儲原始數據,還能夠保存各類分析處理的中間結果,並完整的記錄數據的分析處理過程,能幫助用戶完整詳細追溯任意一條數據的產生過程

建設的關鍵能力包括

混合處理

支持所有類型數據入湖無需預先設計模型,同時支持事務型和分析型數據處理,數據入湖就能即席分析、持續迭代

聯邦分析

支持多類型數據格式融合分析,無需額外數據搬遷,可通過標準查詢語句實現跨源數據探索計算分析

彈性伸縮

計算和存儲層可獨立彈性擴展,具備大容量存儲池和“理論上”無限彈性計算資源能力,快速應對數據和業務變化

分級存儲

支持冷熱數據分級存儲數據自動管理,合理利用存儲,降低成本

數據探索

具備集成算法開發能力能快速構建算法模型及數據探索,甚至與標準數據庫查詢語句融合支持採用標準接口完成算法及AI業務開發

數據發布

能將數據分析處理的結果推送到合適的存儲引擎中,滿足不同的應用訪問需求

平台優勢

Platform Advantage

更直觀的數據價值

在數據應用實現商業變現之前,就數據本身而言,納入靈活但可控的數據共享工具及平台,加速湖內和湖外、組織內和組織外數據的碰撞,共融互通而形成更完整的數據全景從而為業務服務;


納入數據商業化/社會化運營工具,例如數據沙箱、智能脫敏、自主訂閱、用量統計等,撬動數據資產本身的價值


更靈活的數據分析

納入“數據不動計算動”聯邦學習能力,解決數據遷移、數據安全和數據權責的問題;納入“既能保證數據事務性又能保證數據分析性”混合事物/分析處理架構,解決從事務性數據庫導入到數據倉庫產生的時效性和一致性問題;納入針對“大寬表”的即席多維度分析能力,解決傳統上做多維度分析時需要將數據預先按主題拆分和轉換處理過程而導致的分析長鏈路以及低時效問題等

更精細的資產管理

可以從冷熱數據、業務標籤等不同角度對數據進行分級分層存儲,在預先定義好的數據管控規則和基於日誌的機器學習運維任務下,做到半自動甚至全自動的數據管理,合理利用系統資源,實現“數據自治”

更智能的數據接入

在大數據時代信息進一步爆炸,無論是數據量還是數據種類和復雜度都呈指數級發展,數據湖可以成為整個數據的融合匯聚中心


通過數據感知技術,根據接入的數據類型、更新頻率、數據量大小以及預設好的使用場景等信息,智能判別數據接入方式、自動化地進行底層協議及技術的匹配,降低接入數據湖的門檻和整體運維的成本


平台價值

Platform Value

深度挖掘數據價值,助力企業數字化轉型落地

實現數據的目錄、模型、標準、認責、安全、可視化、共享等管理,實現數據集中存儲、處理、分類與管理,實現報表生成自動化、數據分析敏捷化、數據挖掘可視化,實現數據質量評估、落地管理流程

滿足企業各級數據分析應用需求

利用數據湖智能分析、數據可視化等技術,實現數據共享、日常報表自動生成、快速和智能分析,滿足企業各級數據分析應用需求

立即體驗,開啟數位化轉型之旅!