海盒大数据分布式ETL系统SKL

#产品描述#
海盒大数据分布式ETL系统SKL提供数据融合服务,能够通过图形化WEB界面实现自动化(零代码)的数据汇聚处理,包括数据接入、数据集成、定时数据清洗入库和数据管理等功能,并且支持SparkSQL/HiveSQL代码自动生成功能、数据标准管理、数据生命周期管理、数据质量监控管理、元数据管理、血缘分析、数据模型管理、数据全文检索、SLA安全管理等功能;同时支持丰富的数据融合开发功能的扩展。
#产品描述#

#产品优势#
##数据汇聚##**图标名称**支持从数据文件、传统数据库、大数据平台贴源层等多种数据源向大数据平台数据仓库的数据接入与集成。#end#
##数据清洗##**图标名称**支持通过界面拖拽定义数据源表的关联关系,并对数据进行规则处理、计算、排序等操作后入库。#end#
##数据管控##**图标名称**支持对无效数据进行统计及定位,实现数据质量的监控管理。并支持通过索引的构建实现数据的全文搜索。#end#
##自动化分析查询##**图标名称**支持通过界面拖拽和处理函数的选择实现数据分析查询,并生成HiveSQL/SparkSQL命令脚本。#end#
#产品优势#

#主要功能/功能体系#

SKL为用户提供了统一的图形化WEB界面实现以上功能,通过直观、实时交互的可视化界面能够极大地降低用户进行数据融合开发的成本和复杂性,高效地管理数据在系统中的采集、传输和处理。

系统以分布式的ETL功能模块为核心,能够充分利用其正在运行的底层主机系统的资源,实现对于CPU和磁盘的资源最大化,高效地完成数据的处理与传输任务。同时,能够因其分布式的架构具备了可伸缩、可扩展的系统特性,能够快速适配数据源和数据量的变化。

#主要功能/功能体系#

#应用场景#

海盒数据交换平台解决了目前许多数据交换平台的采集工具大多是针对特定目标设计,需要大量的实施操作的问题,它具备普适性原则和操作高效原则。完美满足业务环境所需的实时性、易操作性,从而极大的减少了大数据融合开发项目所需的开发与管理成本,提升了大数据项目的工作效率。

同时SKL为大数据平台提供一个一体化的数据融合管理界面,能够对大数据平台的数据仓库的接入、治理、感知与发现等诸多问题进行解决。

#应用场景#

#文档与工具#
##首次使用##,##开发手册##,##快速开始##,##运维中心手册##,##常见问题##,##数据管理手册##
#文档与工具#

留下评论

您的电子邮箱地址不会被公开。

19 − 4 =