使用流计算 Oceanus 接入 COS

14天试用边缘安全加速平台 EO 限时免费

请输入关键字

Recent Pages

文档

文档对象存储实践教程大数据实践使用流计算 Oceanus 接入 COS

Download PDF

使用流计算 Oceanus 接入 COS

最后更新时间：2024-01-06 10:54:03

下载PDF

Oceanus 简介
流计算 Oceanus是大数据生态体系的实时化分析利器。只需几分钟，您就可以轻松构建网站点击流分析、电商精准推荐、物联网 IoT 等应用。流计算基于 Apache Flink 构建，提供全托管的云上服务，您无须关注基础设施的运维，并能便捷对接云上数据源，获得完善的配套支持。
流计算 Oceanus 提供了便捷的控制台环境，方便用户编写 SQL 分析语句或者上传运行自定义 JAR 包，支持作业运维管理。基于 Flink 技术，流计算可以在 PB 级数据集上支持亚秒级的处理延时。
目前 Oceanus 使用的是独享集群模式，用户可以在自己的集群中运行各类作业，并进行相关资源管理。本文将为您详细介绍如何使用 Oceanus 对接对象存储（Cloud Object Storage，COS）。
准备工作
创建 Oceanus 集群
登录 Oceanus 控制台，创建一个 Oceanus 集群。
创建 COS 存储桶
1. 登录 COS 控制台。
2. 在左侧导航栏中，单击存储桶列表。
3. 单击创建存储桶，创建一个存储桶。具体可参见 创建存储桶 文档。
说明
 当写入 COS 时，Oceanus 作业所运行的地域必须和 COS 在同一个地域。
实践步骤
前往 Oceanus 控制台，创建一个 SQL 作业，集群选择与 COS 在相同地域的集群。
1. 创建 Source
CREATE TABLE `random_source` ( 
  f_sequence INT, 
  f_random INT, 
  f_random_str VARCHAR 
  ) WITH ( 
  'connector' = 'datagen', 
  'rows-per-second'='10',                  -- 每秒产生的数据条数
  'fields.f_sequence.kind'='random',       -- 随机数
  'fields.f_sequence.min'='1',             -- 随机数的最小值
  'fields.f_sequence.max'='10',            -- 随机数的最大值
  'fields.f_random.kind'='random',         -- 随机数
  'fields.f_random.min'='1',               -- 随机数的最小值
  'fields.f_random.max'='100',             -- 随机数的最大值
  'fields.f_random_str.length'='10'        -- 随机字符串的长度
);
说明
 此处选用内置 connector datagen，请根据实际业务需求选择相应数据源。
2. 创建 Sink
-- 请将<存储桶名称>和<文件夹名称>替换成您实际的存储桶名称和文件夹名称
CREATE TABLE `cos_sink` (
  f_sequence INT, 
  f_random INT, 
  f_random_str VARCHAR
) PARTITIONED BY (f_sequence) WITH (
    'connector' = 'filesystem',
    'path'='cosn://<存储桶名称>/<文件夹名称>/',                 --- 数据写入的目录路径
    'format' = 'json',                                       --- 数据写入的格式
    'sink.rolling-policy.file-size' = '128MB',               --- 文件最大的大小
    'sink.rolling-policy.rollover-interval' = '30 min',      --- 文件最大写入时间
    'sink.partition-commit.delay' = '1 s',                   --- 分区提交延迟
    'sink.partition-commit.policy.kind' = 'success-file'     --- 分区提交方式
);
说明
 更多 Sink 的 WITH 参数，请参见Filesystem (HDFS/COS)文档。
3. 业务逻辑
INSERT INTO `cos_sink`
SELECT * FROM `random_source`;
注意
 此处只做展示，无实际业务目的。
4. 作业参数设置
在内置 Connector选择flink-connector-cos，在高级参数中对 COS 的地址进行如下配置：
fs.AbstractFileSystem.cosn.impl: org.apache.hadoop.fs.CosN
fs.cosn.impl: org.apache.hadoop.fs.CosFileSystem
fs.cosn.credentials.provider: org.apache.flink.fs.cos.OceanusCOSCredentialsProvider
fs.cosn.bucket.region: <COS 所在地域>
fs.cosn.userinfo.appid: <COS 所属用户的 appid>
作业配置说明如下：
请将<COS 所在地域>替换为您实际的 COS 地域，例如：ap-guangzhou。
请将<COS 所属用户的 appid>替换为您实际的 APPID，具体请进入 账号中心 查看。
说明
 具体的作业参数设置请参见Filesystem (HDFS/COS) 文档。
5. 启动作业
依次单击保存 > 语法检查 > 发布草稿，等待 SQL 作业启动后，即可前往相应 COS 目录中查看写入数据。

产品类别

文档章节

使用流计算 Oceanus 接入 COS

Oceanus 简介
准备工作
实践步骤

联系我们

联系我们，为您的业务提供专属服务。

技术支持

如果你想寻求进一步的帮助，通过工单与我们进行联络。我们提供7x24的工单服务。

7x24 电话支持

中国香港

+852 800 906 020 (免费)

美国

+1 844 606 0804 (免费)

英国

+44 808 196 4551 (免费)

加拿大

+1 888 605 7930 (免费)

澳大利亚

+61 1300 986 386 (免费)

EdgeOne 热线

+852 300 80699

更多本地服务热线陆续新增中

tencent cloud

新手专区

下一代CDN：EdgeOne

Elasticsearch Service 限时特惠

免费专区

腾讯云初创企业计划

特别优惠

对象存储特别优惠

热门产品

最新产品

专有云

腾讯云TStack

腾讯云企业版解决方案

计算场景

高性能计算解决方案

企业应用

Super App 解决方案

人工智能

视图AI解决方案

安全

直播安全

多媒体

智能音乐解决方案

微信生态解决方案

微信生态

Web3

元宇宙工具箱

计算

云服务器

弹性伸缩

批量计算

专用宿主机

数据库

云数据库 MySQL

云数据库 Redis®

时序数据库 CTSDB

TDSQL MySQL 版

数据传输服务

云数据库 MongoDB

云数据库 PostgreSQL

云数据库 SQL Server

游戏数据库 TcaplusDB

视频服务

云直播

云点播

媒体处理

云联络中心

游戏多媒体引擎

即时通信 IM

腾讯实时音视频

腾讯特效 SDK

人工智能与机器学习

大模型图像创作引擎

人脸融合

人脸核身

文字识别

腾讯云 TI 平台

大模型视频创作引擎

行业应用

腾讯健康组学平台

容器与中间件

消息队列 CKafka 版

云函数

容器服务

Serverless 容器服务

网络

负载均衡

私有网络

专线接入

云联网

NAT 网关

VPN 连接

共享带宽包

Anycast 公网加速

弹性网卡

网络流日志

全球应用加速

安全

天御验证码

主机安全