大數據及機器學習的技術門檻較高,通常需要開發者充分了解系統的底層架構,具備集群部署、操作、應用程序開發等各種能力, 極大的限制了大數據及機器學習的普及與應用。為了解決上述問題,數智平臺支持快速安裝,詳細的安裝文檔助力大數據智能平臺的搭建;數智平臺采用拖拽式開發,大大降低了開發難度,縮短了數據智能應用的開發周期;并且整合了常用的大數據和人工智能工具,提供大數據智能一站式操作和開發平臺,提供了從數據探索、數據發現、數據建模、數據網關開發和管理、數智應用研發到應用部署全生命周期支撐
1.1.?????? 產品優勢
2.2.1 降低大數據及機器學習的技術門檻
大數據及機器學習的技術門檻較高,通常需要開發者充分了解系統的底層架構,具備集群部署、操作、應用程序開發等各種能力, 極大的限制了大數據及機器學習的普及與應用。為了解決上述問題,數智平臺支持快速安裝,詳細的安裝文檔助力大數據智能平臺的搭建;數智平臺采用拖拽式開發,大大降低了開發難度,縮短了數據智能應用的開發周期;并且整合了常用的大數據和人工智能工具,提供大數據智能一站式操作和開發平臺,提供了從數據探索、數據發現、數據建模、數據網關開發和管理、數智應用研發到應用部署全生命周期支撐;
?
2.2.2 一站式解決方案
數智平臺提供了數據采集、數據質量檢測、數據清洗、數據存儲、數據計算、數據分析、數據挖掘、數據可視化、數據治理、數據網關等大數據全流程的一站式的數據管理與服務能力。
2.2.3 靈活數據接入組件
數據采集組件是集實時數據同步、異構數據源間遷移、數據匯集于一體的一站式解決方案。提供簡潔、易用的圖像化界面,完成數據接入、同步、遷移、匯集等配置工作。目前支持的數據源有:MySQL、Oracle、SqlServer、PostgreSQL、DB2、GBase、ClickHouse、PolarDB、Teradata、Cassandra、HBase、MongoDB、Kudu、ElasticSearch、FTP、HDFS、Hive,以及流數據kafka.
2.2.4 極致的性能與可擴展性
數智平臺不僅可以對GB到PB級的數據量實現復雜的查詢和分析,而且在大數據實時數據處理方面,表現優異。數智平臺具有高可擴展性,用戶可以通過增加集群節點數量,線性提高系統的處理能力。
2.2.5 圖形化的大數據開發平臺
在數智平臺中,融合了十幾種大數據開發常用的工具和語言,支持的語言有:Scala、Python、Spark SQL、PySpark等,操作人員通過在線開發并通過簡單的拖拽即可實現復雜的數據處理和分析功能,可以大大降低技術門檻,節省開發時間。
2.2.6 統一的安全管理
大數據平臺基于 Kerberos 實現了平臺的安全控制、權限控制,同時 集成 Ranger實現統一權限管理系統。
2.2.7 豐富的可視化組件支持
數據可視化組件,提供豐富的可視化組件庫,能夠進行數據個性化定制。包括的圖表組件如下:
- 標準圖表組件:折線圖、柱狀圖、餅圖、單值百分比、雷達圖、散點圖、氣泡圖、區域排行、折線柱圖、水平柱狀圖、雙軸線狀圖、雙軸折線柱圖、圖片、視頻、輪播圖、標題、文本、詞云、時間器、表格、關系網絡圖等;
- 專業圖表組件:旭日圖、桑基圖、樹圖、漏斗圖等;
- 地圖組件:基礎平面地圖、世界地圖