Dameng(达梦)
TapData Cloud 为您提供了云端服务,适合需要快速部署、低前期投资场景,帮助您更好地专注于业务发展而非基础设施管理,注册账号即可领取免费的 Agent 实例,欢迎试用。TapData Enterprise 可部署在您的本地数据中心,适合对数据敏感性或网络隔离有严格要求的场景,可服务于构建实时数仓,实现实时数据交换,数据迁移等场景。TapData Community 是一个开源的数据集成平台,提供基础的数据同步和转换功能,可通过 Docker 一键部署,帮助您快速探索和实施数据集成项目。随着项目或企业发展,您可以平滑升级至 TapData Cloud 或 TapData Enterprise,以获得更多高级功能或服务支持。达梦数据库管理系统(DM)是新一代大型通用关系型数据库,全面支持 SQL 标准和主流编程语言接口/开发框架。行列融合存储技术,在兼顾 OLAP 和 OLTP 的同时,满足 HTAP 混合应用场景。
完成 Agent 部署后,您可以跟随本文教程在 TapData 中添加 Dameng 数据源,后续可将其作为源或目标库来构建数据管道。
支持版本
DM 7.x、8.x
数据源成熟度
Beta 数据源准备工作
在连接达梦数据库前,您还需要完成数据库账号的授权等准备工作:
- 作为源库
- 作为目标库
作为源库
以拥有 DBA 权限的身份登录达梦数据库。
依次执行下述格式的命令,创建用于数据复制/转换任务的用户。
CREATE USER username IDENTIFIED BY "password" DEFAULT TABLESPACE table_space_name;
- username:用户名。
- pass_word:密码。
- table_space_name:表空间名称。
为刚创建的账号授予权限,您也可以基于业务需求自定义权限控制。
-- 替换下述命令中的 username 为真实的用户名
GRANT dba TO username;
-- 或者使用下述更精细化的授权
GRANT SELECT TABLE, SELECT VIEW TO username;
GRANT SELECT ON "SYS"."V$RLOG" TO username;
GRANT SELECT ON "SYS"."V$ARCHIVED_LOG" TO username;如需获取源库的数据变更以实现增量同步,您还需要跟随下述步骤开启数据库的归档功能和归档日志。
提示您也可以执行
SELECT para_name, para_value FROM v$dm_ini WHERE para_name IN ('ARCH_INI','RLOG_APPEND_LOGIC');
命令来查看是否已开启该功能,返回结果中, PARA_VALUE 列的值为 1 表示已开启,可跳过本步骤。-- 修改数据库为 MOUNT 状态
ALTER DATABASE MOUNT;
-- 配置本地归档,DEST 指定的目录不存在时会自动创建
-- FILE_SIZE 表示归档文件大小、space_limit 表示空间大小限制
ALTER DATABASE ADD ARCHIVELOG 'DEST = /bak/dmdata/dameng, TYPE = local, FILE_SIZE = 1024, SPACE_LIMIT = 0';
-- 开启归档模式
ALTER DATABASE ARCHIVELOG;
-- 开启附加日志,如果有主键列,则记录 UPDATE/DELETE 时只包含主键列信息
ALTER SYSTEM SET 'RLOG_APPEND_LOGIC'=1 MEMORY;
-- 修改数据库为 OPEN 状态
ALTER DATABASE OPEN;
作为目标库
以拥有 DBA 权限的身份登录达梦数据库。
依次执行下述格式的命令,创建用于数据复制/转换任务的用户。
CREATE USER username IDENTIFIED BY "password" DEFAULT TABLESPACE table_space_name;
- username:用户名。
- password:密码。
- table_space_name:表空间名称。
为刚创建的账号授予权限,您也可以基于业务需求自定义权限控制。
-- 替换下述命令中的 username 为真实的用户名
GRANT CREATE TABLE, DELETE TABLE, INSERT TABLE, SELECT TABLE, UPDATE TABLE, CREATE INDEX TO username;
添加数据源
在左侧导航栏,单击连接管理。
单击页面右侧的创建。
在弹出的对话框中,搜索并选择 Dameng。
在跳转到的页面,根据下述说明填写达梦数据库的连接信息。
连接信息设置
- 连接名称:填写具有业务意义的独有名称。
- 连接类型:支持将达梦数据库作为源或目标库。
- 地址:数据库连接地址。
- 端口:数据库的服务端口。
- 数据库:填写数据库名称。
- Schema:Schema 名称,创建数据库用户时,达梦数据库会为自动创建一个与用户名相同的 Schema(全大写),如需连接多个 Schema 则需创建多个数据连接。
- 账号:数据库的账号。
- 密码:数据库账号对应的密码。
- 连接参数:额外的连接参数,默认为空。
- 时区:默认为数据库所用的时区,您也可以根据业务需求手动指定。
高级设置
包含表:默认为全部,您也可以选择自定义并填写包含的表,多个表之间用英文逗号(,)分隔。
排除表:打开该开关后,可以设定要排除的表,多个表之间用英文逗号(,)分隔。
Agent 设置:默认为平台自动分配,您也可以手动指定 Agent。
模型加载频率:数据源中模型数量大于 1 万时,TapData 将按照设置的时间定期刷新模型。
开启心跳表:当连接类型选择为源头和目标、源头时,支持打开该开关,由 TapData 在源库中创建一个名为 _tapdata_heartbeat_table 的心跳表并每隔 10 秒更新一次其中的数据(数据库账号需具备相关权限),用于数据源连接与任务的健康度监测。
提示数据源需在数据复制/开发任务引用并启动后,心跳任务任务才会启动,此时您可以再次进入该数据源的编辑页面,即可单击查看心跳任务。
单击连接测试,测试通过后单击保存。
提示如提示连接测试失败,请根据页面提示进行修复。