参数 | 说明 |
任务名称 | 必填项 命名规则:仅支持中文、英文、数字和下划线 长度:不可超过100字符 |
任务模式 | 表单模式:适用于单表至单表离线同步,适用于 ODS 层无需数据清洗环节的数据同步。默认项。 画布模式:主要采用可视化拖拽方式,适用于包含清洗环节数据链路。 表单模式:适用于单表至单表离线同步,适用于 ODS 层无需数据清洗环节的数据同步 |
描述 | 选填项 |
序号 | 参数说明 | |
1 | | 任务操作栏。对整个任务生效的操作,包括保存、提交、锁定/解锁、前往运维、刷新、画布转换。 |
2 | 2-1 | 数据来源及目标:配置任务读取和写入的数据源、库、表以及读写方式。 |
| 2-2 | 字段映射:设置来源和目标端数据对应关系,后续任务仅同步具有映射关系的字段之间的数据。 说明: 部分非关系型数据库无法自动获取字段信息,需手动逐个添加字段或批量添加字段。 |
3 | | 任务配置,此配置信息对全局任务生效: 实时任务包括任务属性、版本管理配置,提供任务资源并行度、CU 用量配置等。 |
序号 | 参数说明 | |
1 | | 任务操作栏。对整个任务生效的操作,包括保存、提交、锁定/解锁、前往运维、刷新、表单转换等。 |
2 | | 数据节点菜单。根据链路对象分类为读取、写入、转换节点,支持拖拽方式直接添加节点至画布。 |
3 | 3-1 | 数据链路。由读取、写入、转换节点及节点间连线构成的数据链路,代表了同步任务内数据流向。 |
| 3-2 | 任务配置,此配置信息对全局任务生效: 实时任务包括任务属性、版本管理配置,提供任务资源并行度、CU 用量配置等。 |
类别 | 参数 | 说明 |
任务属性 | 任务名称/类型 | 展示当前任务名称及类型基本信息。 |
| 责任人 | 对此任务负责的一个或多个空间成员名称,默认为任务创建者。 |
| 描述 | 展示当前任务备注信息。 |
资源配置 | 集成资源组 | 指定当前任务使用的集成资源组名称,一个任务仅可绑定一个资源组。 |
| 资源分配方式 | 集成资源支持多种分配方式: 固定分配:此方式下不区分任务同步阶段,全量及增量同步过程中始终为当前任务分配固定资源量。此方式可避免任务间资源抢占,适用于任务运行过程中数据可能存在较大变动的场景。 按同步阶段分配:按全量和增量不同同步阶段分配计划的资源使用量,以节约整体资源用量。 |
| JobManager | 支持0.25、0.5、1、2C,设置后任务将默认占用此规格。 CU 任务实际占用 CU 数 = JobManager 规格 + TaskManager 规格 × 并行度。 |
| TaskManager | 支持0.25、0.5、1、2CU,设置后任务将默认占用此规格 。 CU 任务实际占用 CU 数 = JobManager 规格 + TaskManager 规格 × 并行度。 |
| 并行度 | 每个算子的默认并行度。 |
运行策略 | checkpoint 间隔 | 设置 checkpoint 间隔时间,支持分钟/秒级。 |
| 最大重启次数 | 设置在执行过程中发生故障时任务最大的重启阈值,若运行中重启次数超过此阈值,任务状态将变为失败。设置范围为[-1,100], 阈值为0表示不重启,-1 表示不限制最大重启次数。 |
| 关联告警 | 支持对当前任务关联告警规则 |
序号 | 参数 | 说明 |
1 | 保存 | 保存当前任务配置信息,包括数据节点配置、节点连线、任务属性配置。 |
2 | 提交 | 将当前任务提交至生产环境,提交时根据当前任务是否有生产态任务可选择不同运行策略。 若当前任务无生效的线上任务,即首次提交或线上任务处于“失败”状态,可直接提交。 若当前任务存在“运行中”或“暂停”状态的线上任务需选择不同策略。停止线上作业将抛弃之前任务运行位点,从头开始消费数据,保留作业状态将在重启后从之前最后消费位点继续运行。 说明: 单击立即启动任务将在提交后立即开始运行,否则需要手动触发才会正式运行。 |
3 | 锁定/解锁 | 默认创建者为首个持锁者,仅允许持锁者编辑任务配置及运行任务。若锁定者5分钟内没有编辑操作,其他人可点击图标抢锁,抢锁成功可进行编辑操作。 |
4 | 前往运维 | 根据当前任务名称快捷跳转至实时运维页面。 |
5 | 画布转换/表单转换 | 表单模式和画布模式可以互相转换。表单模式下提供画布转换功能,画布模式下提供表单转换功能。 说明: 当前仅支持任务在保存成功状态下才允许转换。 若画布模式包含转换节点,不支持转为表单模式。 |
检测分类 | 检测项 | 说明 |
任务配置检测 | 来源配置 | 检测来源端的必填项是否有缺失 |
| 目标配置 | 检测目标端的必填项是否有缺失 |
| 映射关系配置 | 检测字段映射是否已配置 |
| 资源组配置 | 检测资源组是否有配置 |
| 相同数据表检测 | 检测当前项目下所有的实时单表任务(包含已提交和未提交)是否有同样来源表或目标表或来源表与目标表都相同的情况。相同表的判断依据为是否是同一个数据源同一个 DB 下的同名表。此检测项主要用于同一个表不希望有多个任务重复读取的场景。 |
数据源检测 | 来源端连通性检测 | 检测来源端数据源跟任务配置的资源组是否网络联通。检测不通过可查看诊断信息,打通网络后可重新检测,否则任务大概率会运行失败。 |
| 目标端连通性检测 | 检测目标端数据源跟任务配置的资源组是否网络联通。检测不通过可查看诊断信息,打通网络后可重新检测,否则任务大概率会运行失败。 |
资源检测 | 资源状态检测 | 检测资源组是否为可用状态。若资源状态不可用,请更换任务配置的资源组,否则任务大概率会运行失败。 |
| 资源余量检测 | 检测资源组当前剩余的资源是否满足任务配置的资源需求。若检测不通过,请适当调小任务资源配置或扩容资源组。 |
任务状态 | 提交运行策略 | 说明 |
1、首次提交 2、已停止/检测异常/初始化(非首次提交) | 立即启动,从默认位点开始同步 | 此策略下将根据源端配置从默认位点开始读取。若源端配置为“全量+增量”读取方式,则默认先同步存量数据(全量阶段),完成后即可消费binlog获取变更数据(增量阶段);若源端配置为 “仅增量”读取,则默认使用binlog最新位点开始读取。 |
| 立即启动,指定时间点开始同步 | 此策略下需选择具体的开始时间,根据时间匹配位点。 1. 从指定时间点开始读取数据。若未匹配到指定位点,任务则默认从binlog最早位点开始同步 2. 若您源端读取方式为全量 + 增量,选择此策略将默认跳过全量阶段从增量的指定时间位点开始同步 |
| 暂不启动,稍后前往实时任务运维手动启动任务 | 此策略下仅提交任务到实时运维,不进行任务启动,后续可从实时运维页面批量启动任务。 |
运行中(非首次提交) | 继续运行,保留作业状态数据,从上次同步最后位点继续运行 | 此策略下新版本任务提交后,将从上次同步最后位点继续运行。 |
| 重新启动,从指定时间点继续运行 | 此策略下您可指定重新启动读取的位点,任务将忽略老版本从指定位点重新开始读取。若未找到指定的时间位点任务将默认从 binlog 最早位点开始同步。 |
| 重新启动,停止正在运行任务并丢弃任务状态,从默认位点开始运行 | 此策略下将停止正在运行的任务并丢弃任务状态,然后根据源端配置从默认位点开始读取。若源端配置为“全量 + 增量”读取方式,则默认先同步存量数据(全量阶段),完成后即可消费 binlog 获取变更数据(增量阶段);若源端配置为 “仅增量”读取,则默认使用 binlog 最新位点开始读取。 |
已暂停(非首次提交) | 继续运行,保留作业状态数据,从上次同步最后位点继续运行 | 此策略下新版本任务提交后,将从上次同步最后位点继续运行。 注意: 暂停操作时会生成快照,任务重新提交支持从最后位点继续运行。 强制暂停时不生成快照,任务重新提交支持从任务运行时最近一次生成的快照运行。这种暂停会导致任务数据重放一部分,如果目标写入是 Append 会有重复的数据,如果目标写入是 Upsert 则不会有重复问题。 |
| 重新启动,从指定时间点继续运行 | 此策略下您可指定重新启动读取的位点,任务将忽略老版本从指定位点重新开始读取。若未找到指定的时间位点任务将默认从 binlog 最早位点开始同步。 |
| 重新启动,停止正在运行任务并丢弃任务状态,从默认位点开始运行 | 此策略下将停止正在运行的任务并丢弃任务状态,然后根据源端配置从默认位点开始读取。若源端配置为“全量 + 增量”读取方式,则默认先同步存量数据(全量阶段),完成后即可消费 binlog 获取变更数据(增量阶段);若源端配置为 “仅增量”读取,则默认使用 binlog 最新位点开始读取。 |
失败(非首次提交) | 从上次运行失败(checkpoint)位点恢复运行 | 此策略下将从任务上一次运行失败的位点继续运行 |
| 重新启动,根据任务读取配置从默认位点开始运行 | 此策略下将根据源端配置从默认位点开始读取。若源端配置为“全量+增量”读取方式,则默认先同步存量数据(全量阶段),完成后即可消费binlog获取变更数据(增量阶段);若源端配置为 “仅增量”读取,则默认使用binlog最新位点开始读取。 |
操作中(非首次提交) | 不支持 | 线上有同名任务且状态为操作中时,不支持重新提交任务 |
本页内容是否解决了您的问题?