跳到主要内容
版本:3.x

一键自动流转数据

适用版本Cloud 功能TapData Cloud 为您提供了云端服务,适合需要快速部署、低前期投资场景,帮助您更好地专注于业务发展而非基础设施管理,注册账号即可领取免费的 Agent 实例,欢迎试用。企业版功能TapData Enterprise 可部署在您的本地数据中心,适合对数据敏感性或网络隔离有严格要求的场景,可服务于构建实时数仓,实现实时数据交换,数据迁移等场景。

在数据服务平台模式下,您只需要简单地拖动源表至所需层级,即可一键生成数据管道并自动启动任务,极大简化任务配置流程,本文介绍如何实现数据在不同层级间的流转,并最终为提供给终端业务。

操作步骤

  1. 登录 TapData 平台

  2. 在左侧导航栏,单击实时数据中心

  3. 在本页面,您可以直观地看到您已录入的数据源信息,TapData 基于数据治理和流转顺序,展示了四个层级。

    数据服务平台页面

    提示

    关于各层级的详细说明,见数据服务平台分层介绍

  4. 跟随下述流程,一键完成数据流转

    提示

    通过平台加工层,您可以对表进行表结构调整(如增加字段)、合并表、构建宽表等操作,如果缓存层的表已经满足您的业务需求,则无需使用平台加工层,您可以直接发布 API 或将缓存层的表拖动至数据目标和服务层

  1. 源数据层,单击图标,找到您需要同步的表,将其拖动至平台缓存层

  2. 在弹出的对话框中,填写表前缀、选择数据同步方式(全量或增量)并单击确定

    创建缓存层任务

  3. 选择保存并运行后,TapData 将自动创建一个数据复制任务,将您选择表实时同步至平台缓存层并自动校验,您可以单击平台缓存中表名右侧的图标,跳转至任务监控页面来查看任务运行详情。

常见问题

  • 问:通过拖拽任务生产的表名或库名,推荐的命名规范是什么?

    答:推荐以小写字母开头,仅包含小写字母、下划线和数字。

  • 问:推荐将什么类型的数据流入到平台缓存层?

    答:推荐将核心业务数据流入到平台缓存层,可最大程度数据读取对源库的影响,可进行自由的权限管控,而且后续可以为多个数据管道供数,无需再去源库取数。

  • 问:支持同步源库的 DDL 操作吗,例如新增字段?

    答:部分数据源支持,您可以在配置任务时开启 DDL 事件采集和 DDL 应用,支持同步的 DDL 和数据源的更多介绍,见 DDL 同步说明

  • 问:如果任务因 Schema 变化而以外终止,如何修复?

    答:TapData 致力于无缝处理大多数 DDL 变更,如遇不支持同步的 DDL,可能引发任务意外终止,此时,您可以在连接管理页面中,找到源库并重新加载 Schema,重置任务后再重启任务来修复,您也可以在目标库手动执行本次 DDL 变更来尝试修复。