数据仓库与数据湖
TapData Cloud 为您提供了云端服务,适合需要快速部署、低前期投资场景,帮助您更好地专注于业务发展而非基础设施管理,注册账号即可领取免费的 Agent 实例,欢迎试用。TapData Enterprise 可部署在您的本地数据中心,适合对数据敏感性或网络隔离有严格要求的场景,可服务于构建实时数仓,实现实时数据交换,数据迁移等场景。Tapdata 支持连接数据仓库与数据湖,请选择要添加的数据源:
📄️ BigQuery
BigQuery 是 Google Cloud 的全代管式 PB 级经济实惠的分析数据仓库,可让您近乎实时地分析大量数据。完成 Agent 部署后,您可以跟随本文教程在 Tapdata 中添加 BigQuery 数据源,后续可将其作为目标库来构建数据管道。
📄️ ClickHouse
ClickHouse 是一个用于联机分析(OLAP)的高性能列式数据库管理系统。本文将介绍如何在 TapData 中添加 ClickHouse 数据源,后续可将其作为源或目标库来构建实时数据链路。
📄️ Databend
Databend 是一个开源的 Elastic 和 Workload-Aware 现代云数据仓库,Databend 使用最新的矢量化查询处理技术,帮助用户在对象存储上进行快速的数据分析。
📄️ Doris
Doris 适用于实时数据分析和报表,支持高并发查询和复杂分析,广泛应用于数据仓库、BI报表和数据可视化。Tapdata 支持将 Doras 作为源或目标库来构建数据管道,帮助您快速完成大数据分析场景下的数据流转。接下来,跟随本文介绍在 Tapdata 平台上连接 Doris 数据源。
📄️ GaussDB(DWS)
数据仓库服务 GaussDB(DWS)是完全托管的企业级云上数据仓库服务,具备免运维、在线扩展、高效的多源数据加载能力,兼容 PostgreSQL 生态。完成 Agent 部署后,您可以跟随本文教程在 Tapdata 中添加 GaussDB 数据源,后续可将其作为目标库来构建数据管道。
📄️ GreenPlum
Greenplum 数据库是一种大规模并行处理(MPP)数据库服务器,其架构特别针对管理大规模分析型数据仓库以及商业智能工作负载而设计。本文介绍如何在 Tapdata 平台上连接 GreenPlum。
📄️ Hudi
Apache Hudi 是一种数据湖的存储格式,在 Hadoop 文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。TapData 支持将 Hudi 作为目标库,构建数据传输管道。
📄️ SelectDB
SelectDB Cloud 是基于 Apache Doris 内核打造的全托管的云原生实时数据仓库服务。本文介绍如何在 Tapdata 中连接 SelectDB Cloud (简称 SelectDB)数据源。
📄️ Tablestore
阿里云表格存储(Tablestore)是面向海量结构化数据提供 Serverless 表存储服务,同时针对物联网场景深度优化提供一站式的IoTstore解决方案。
📄️ YashanDB
崖山数据库管理系统(YashanDB)是深圳计算科学研究院在经典数据库理论基础上,融入新的原创理论,自主设计、研发的新型数据库管理系统。Tapdata 支持将 YashanDB 作为目标库来构建数据管道,帮助您快速完成数据流转。