tencent cloud

文档反馈

Mongo/腾讯云 Mongo 数据源

最后更新时间:2024-11-01 17:12:17
    腾讯云 Mongo 数据源与 Mongo 数据源配置方式相同,此处以 Mongo 数据源为例进行讲解。

    支持版本

    支持 MongoDB 3.6、4.x、5.x、6.x 版本。

    使用限制

    1. 增量同步时,where 条件语法: create_time>= '${yyyy-MM-dd-1d HH:mm:ss}' and create_time < '${yyyy-MM-dd HH:mm:ss}'
    Bound 目前支持整型和日期函数配置。日期函数配置使用方法:
    // 转化为13位时间戳(毫秒)
    TimestampMillis('yyyy-MM-ddTHH:mm:00+0800')
    TimestampMillis('2023-07-10T00:00:00+0800')
    TimestampMillis('2023-07-10 00:00:00')
    TimestampMillis('2023-07-10')
    
    // 转化为10位时间戳(秒)
    TimestampSeconds('yyyy-MM-ddTHH:mm:00+0800')
    TimestampSeconds('2023-07-10T00:00:00+0800')
    TimestampSeconds('2023-07-10 00:00:00')
    TimestampSeconds('2023-07-10')
    2. 支持使用 MongoDB 数据库对应账号进行连接,如果您使用的是云数据库 MongoDB 版,默认会有一个 admin 账号。出于安全策略的考虑,在添加使用MongoDB 数据源时,请避免使用 admin 作为访问账号。
    3. 如果 MongoDB 为分片集群,则在配置数据源时,需要配置 mongos 地址,避免配置 mongod/shard 节点地址。否则同步任务在抽取 MongoDB 中数据时,可能会导致只查询到指定 shard 的数据,而非预期的全集。关于 mongos、mongod,详情请参见 mongos shards
    4. 在并发大于1的情况下,同步任务配置的集合中所有 _id 字段类型必须一致(例如,_id 字段都为 string 类型或者 ObjectId 类型),否则会出现部分数据无法同步的问题。
    说明:
    并发大于1时,任务拆分会使用 _id 字段进行划分,因而在此场景下 _id 字段不支持混合类型。如果 _id 有多种字段类型,您可以使用单并发的形式进行数据同步,且不配置 splitFactor 或 splitFactor 配置为1。

    Mongo 离线单表读取节点配置

    
    
    
    参数
    说明
    数据来源
    可用的 Mongo 数据源。
    支持选择、或者手动输入需读取的库名称
    默认将数据源绑定的数据库作为默认库,其他数据库需手动输入库名称。
    当数据源网络不联通导致无法直接拉取库信息时,可手动输入数据库名称。在数据集成网络连通的情况下,仍可进行数据同步。
    集合
    支持选择、或者手动输入需读取的集合。
    分割符
    当字段为数组类型时,使用分割符拼接数组内容。
    筛选条件(选填)
    根据数据类型填写对应筛选语句,该语句会作为将要同步数据的筛选条件。
    高级设置(选填)
    可根据业务需求配置参数。

    Mongo 离线单表写入节点配置

    
    
    
    参数
    说明
    数据去向
    选择当前项目中可用的 Mongodb 数据源。
    支持选择、或者手动输入需读取的库名称
    默认将数据源绑定的数据库作为默认库,其他数据库需手动输入库名称。
    当数据源网络不联通导致无法直接拉取库信息时,可手动输入数据库名称。在数据集成网络连通的情况下,仍可进行数据同步。
    集合
    支持选择、或者手动输入需读取的集合。
    写入模式
    表示写入数据时,是否针对相同的主键覆盖写入。默认使用 _id 每行记录的业务主键
    前置语句
    选填,表示数据同步写入 MongoDB 前的前置操作,请确保前置语句符合 JSON 语句要求,如{"type": "remove"}
    高级设置(选填)
    可根据业务需求配置参数。

    数据类型转换支持

    读取

    Mongo 读取支持的数据类型及转换对应关系如下(在处理 Mongo 时,会先将 Mongo 数据源的数据类型和数据处理引擎的数据类型做映射):
    Mongo 数据类型
    内部类型
    int32,int64,bigint
    Long
    double,decimal
    Double
    string, array,map,list
    String
    date,datetime
    Date
    boolean
    Boolean
    bytes
    Bytes

    写入

    Mongo 写入支持的数据类型及转换对应关系如下:
    内部类型
    Mongo 数据类型
    Long
    int, Long
    Double
    double,decimal
    String
    string, array
    Date
    date,datetime
    Boolean
    boolean
    Bytes
    bytes
    
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持