跳到主要内容
版本:2.x

连接 GitHub

GitHub 是一个用于版本控制和协作的代码托管平台,它允许您和其他人随时随地协同处理项目。Tapdata 支持将 GitHub 作为源库构建数据管道,帮助您读取指定仓库的 Issue 和 Pull Requests 变更数据,并同步到指定的数据源,本文介绍如何在 Tapdata 中添加 GitHub 数据源。

操作步骤

  1. 登录 Tapdata 平台。

  2. 在左侧导航栏,单击连接管理

  3. 在页面右侧,单击创建连接

  4. 在跳转到的页面,单击 Beta 数据源标签页,然后选择 GitHub

  5. 根据下述说明完成数据源配置。

    GitHub 连接设置

    • 连接名称:填写具有业务意义的独有名称。
    • 连接类型:仅支持源头
    • 共享挖掘:打开共享挖掘开关后,多个任务共享增量日志读取结果,无需从源库重复读取,可极大降低源库负载。
    • agent 设置:默认为平台自动分配,您也可以手动指定。
    • 模型加载频率:数据源中模型数量大于 1 万时,Tapdata 将按照本参数的设定定期刷新模型。
  6. 单击授权,在跳转到的 GitHub 授权页面,完成登录和授权操作(推荐以组织管理员身份授权)。

    完成操作后,页面将返回至数据源配置页面并显示成功授权

  7. 单击连接测试,测试通过后单击保存

    提示

    如提示连接测试失败,请根据页面提示进行修复。