SQL 编辑器

数据湖计算

产品简介

购买指南

快速入门

操作指南

控制台操作介绍

数据开发与探索

数据探索

数据查询任务

数据作业

资源管理

运维管理

洞察管理

系统管理

用户与权限管理

监控与告警

开发指南

系统约束

客户端访问

JDBC 访问

实践教程

使用 Apache DolphinScheduler 调度 DLC 引擎提交任务

StarRocks 直接查询 DLC 内部存储

DLC 原生表

SQL 语法

SuperSQL 语法

统一语法

DDL 语法

ALTER DATABASE

ALTER DATABASE SET DBPROPERTIES

ALTER DATABASE SET LOCATION

DROP DATABASE

CREATE TABLE

REPLACE TABLE AS SELECT

SHOW COLUMNS IN TABLE

ALTER TABLE

ALTER TABLE ADD COLUMNS

ALTER TABLE ADD COLUMN AFTER/FIRST

ALTER TABLE DROP COLUMN

ALTER TABLE ADD PARTATION

SHOW PARTITIONS

ALTER TABLE DROP PARTITION

ALTER TABLE ADD PARTITION FIELD

ALTER TABLE DROP PARTITION FIELD

ALTER TABLE ... RENAME COLUMN

ALTER TABLE SET TBLPROPERTIES

ALTER TABLE SET LOCATION

ALTER TABLE ... WRITE ORDERED BY

ALTER TABLE ... WRITE DISTRIBUTED BY PARTITION

ALTER TABLE ... SET IDENTIFIER FIELDS

ALTER TABLE ... DROP IDENTIFIER FIELDS

ALTER VIEW

ALTER VIEW SET TBLPROPERTIES

DML 语法

DQL 语法

Iceberg 表语法

函数

统一函数

API 文档

Making API Requests

Data Table APIs

DescribeLakeFsDirSummary

DescribeLakeFsInfo

QueryResult

GenerateCreateMangedTableSql

Task APIs

Metadata APIs

DescribeForbiddenTablePro

DescribeDLCCatalogAccess

GrantDLCCatalogAccess

RevokeDLCCatalogAccess

DropDMSTable

DropDLCTable

DescribeDMSDatabaseList

Service Configuration APIs

CreateCHDFSBindingProduct

DeleteCHDFSBindingProduct

DescribeOtherCHDFSBindingList

CreateStoreLocation

DescribeStoreLocation

ModifyDataEngineDescription

RollbackDataEngineImage

SwitchDataEngine

SwitchDataEngineImage

UpgradeDataEngineImage

DeleteThirdPartyAccessUser

DescribeDataEngineImageVersions

DescribeSubUserAccessPolicy

DescribeThirdPartyAccessUser

RegisterThirdPartyAccessUser

RestartDataEngine

UpdateUserDataEngineConfig

UpdateDataEngineConfig

Permission Management APIs

Database APIs

ModifyAdvancedStoreLocation

ModifyGovernEventRule

DescribeAdvancedStoreLocation

Data Source Connection APIs

CheckDataEngineImageCanBeRollback

CheckDataEngineImageCanBeUpgrade

DescribeDataEnginePythonSparkImages

Data Optimization APIs

GetOptimizerPolicy

Data Engine APIs

CreateDataEngine

DescribeDataEnginesScaleDetail

DeleteDataEngine

RenewDataEngine

SuspendResumeDataEngine

UpdateDataEngine

DescribeUpdatableDataEngines

DescribeDataEngine

DescribeUserDataEngineConfig

CheckDataEngineConfigPairsValidity

通用类参考

第三方软件连接DLC操作指南

DLC 政策

文档数据湖计算操作指南控制台操作介绍数据开发与探索数据探索SQL 编辑器

SQL 编辑器

下载PDF

最后更新时间：2024-07-17 15:47:59

SQL 编辑器

最后更新时间： 2024-07-17 15:47:59

下载PDF

数据湖计算 DLC 提供的 SQL 编辑器支持使用统一的 SQL 语句进行数据查询，兼容 SparkSQL，您使用标准 SQL 即可完成数据查询任务。
您可以通过数据探索进入 SQL 编辑器，在编辑器内可完成简单的数据管理、多 Session 的数据查询、查询记录管理、下载记录管理。
数据管理
数据管理支持新增数据源、数据库管理及数据表管理。
新建数据目录
目前数据湖计算 DLC 支持管理 COS 及 EMR HIVE 的数据目录。操作步骤如下。
1. 登录 数据湖计算 DLC 控制台，选择服务地域，登录角色需要管理员权限。
2. 进入数据探索，鼠标移入库表列表上方的
﻿
图标，单击新建数据目录即可进入新建流程。
﻿

详细操作指南可参见 查询其他数据源。
数据库管理
通过 SQL 编辑器，支持对数据库行进创建、删除、查看详情操作。
数据表管理
通过 SQL 编辑器，支持对数据表进行创建、查询、查看详情操作。
默认数据库切换
使用 SQL 编辑器时，可以指定查询任务的默认数据库，指定后若在查询语句中未申明数据库，则查询将在默认数据库下执行。
1. 登录 数据湖计算 DLC 控制台，选择服务地域。
2. 进入数据探索，鼠标悬停需指定的数据库名称，单击
﻿
图标，单击切换为默认数据库即可将该数据库指定为默认数据库。
﻿
﻿
3. 或可以直接在默认数据库选择框切换。
﻿
﻿
数据查询
Session 管理
SQL 编辑器支持多个 Session 进行数据查询，每个 Session 内的配置独立（默认数据库、使用的计算引擎、查询记录等），方便用户进行多个任务运行及管理。
您可以通过单击
﻿
图标创建 Session，单击 tab 栏进行编辑器界面的切换。
﻿
﻿
﻿
为了方便您的查询使用，常用的 Session 您可以点击保存按钮将 Session 进行保存，同时您可以通过点击
﻿
图标快速打开您已保存的 Session。
﻿
﻿
针对已保存的 Session，您可以单击刷新按钮来更新同步已保存的信息，保证查询语句的准确性。
﻿
﻿
编辑器支持同时运行多个不同的 SQL 语句，单击运行按钮将会把编辑器内所有的 SQL 语句进行运行，同时拆分为多个 SQL 任务。
如需运行部分语句，可选中需运行的语句后单击部分运行。
﻿
﻿
﻿
引擎参数配置
选择数据引擎后，支持对数据引擎进行参数配置，选择数据引擎后，在高级设置单击添加即可进行配置。
﻿
﻿
﻿
当前支持配置参数如下：
引擎
配置名称
初始值
配置说明
SparkSQL
spark.sql.files.maxRecordsPerFile
0
写入单个文件的最大记录数。
如果该值为零或为负，则没有限制。
﻿
spark.sql.autoBroadcastJoinThreshold
10MB
配置执行连接时显示所有工作节点的表的最大字节大小。
通过将此值设置为“-1”，可以禁用显示。
﻿
spark.sql.shuffle.partitions
200
默认分区数。
﻿
spark.sql.sources.partitionOverwriteMode
static
该值为 static 时，在执行覆盖写操作之前，会删除所有符合条件的分区。
举例说明：分区表中有一个“2022-01”的分区，当使用 INSERT OVERWRITE 语句向表中写入“2022-02”这个分区的数据时，会把“2021-01”的分区数据也覆盖掉。
当该值为 dynamic 时，不会提前删除分区，而是在运行时覆盖那些有数据写入的分区。
﻿
spark.sql.files.maxPartitionBytes
128MB
读取文件时要打包到单个分区中的最大字节数。
Presto
use_mark_distinct
true
决定引擎在执行 distinct 函数时是否进行数据重分布。
如果查询中多次调用 distinct 函数，推荐将该参数设置为 false。
﻿
USEHIVEFUNCTION
true
执行查询时是否使用 Hive 函数；如需使用 presto 原生函数，请将参数设置为 false。
﻿
query_max_execution_time
-
用于设置查询超时，在查询执行的时间超过设置的时间后，查询会被终止。单位支持 d-天，h-小时，m-分钟，s-秒，ms-毫秒（举例：1d 代表1天，3m 代表3分钟）。
﻿
dlc.query.execution.mode
async
引擎查询执行模式，默认为 async 模式， 该模式任务会完成全量查询计算，并将结果保存到 COS，再返回给用户，允许用户在查询完成后下载查询结果。
用户也可以将该值改为 sync，在 sync 模式下，查询不一定会执行全量计算，部分结果可用后，会直接由引擎返回给用户，不再保存到 COS。因此用户可获得更低查询延迟和耗时， 但结果只在系统中保存30s。推荐不需要从 COS 下载完整查询结果，但期望更低查询延迟和耗时时使用该模式，例如查询探索阶段、BI 结果展示。
Presto 运行模式
当用户选择的引擎为 Presto 引擎时，数据探索运行支持用户选择“快速模式”运行或“全量模式”运行
1. 快速查询：速度更快，但查询结果并不能持久化保存，适用于探索阶段。
2. 全量模式：执行全量查询并将数据保存到对象存储中。
﻿
﻿
﻿
查询结果
通过 SQL 编辑器可直接查看查询结果，可以通过单击
﻿
图表展开或收起查询结果的展示高度。
﻿
﻿
控制台单个任务最多会返回1000条结果，如需更多结果可使用 API。
查询结果在未指定 COS 存储路径情况下支持下载到本地。
历史运行查询
每个 Session 可保存3个月内的运行历史，支持查看近24小时的查询结果。可通过运行历史快速查找过去执行的任务信息。
下载历史管理
每个 Session 的下载任务可在下载历史中查看，可查询下载任务状态及相关参数信息。

本页内容是否解决了您的问题？

您也可以联系销售或提交工单以寻求帮助。

是

否

引擎	配置名称	初始值	配置说明
SparkSQL	spark.sql.files.maxRecordsPerFile	0	写入单个文件的最大记录数。如果该值为零或为负，则没有限制。
		spark.sql.autoBroadcastJoinThreshold	10MB	配置执行连接时显示所有工作节点的表的最大字节大小。通过将此值设置为“-1”，可以禁用显示。
		spark.sql.shuffle.partitions	200	默认分区数。
		spark.sql.sources.partitionOverwriteMode	static	该值为 static 时，在执行覆盖写操作之前，会删除所有符合条件的分区。举例说明：分区表中有一个“2022-01”的分区，当使用 INSERT OVERWRITE 语句向表中写入“2022-02”这个分区的数据时，会把“2021-01”的分区数据也覆盖掉。当该值为 dynamic 时，不会提前删除分区，而是在运行时覆盖那些有数据写入的分区。
		spark.sql.files.maxPartitionBytes	128MB	读取文件时要打包到单个分区中的最大字节数。
Presto	use_mark_distinct	true	决定引擎在执行 distinct 函数时是否进行数据重分布。如果查询中多次调用 distinct 函数，推荐将该参数设置为 false。
		USEHIVEFUNCTION	true	执行查询时是否使用 Hive 函数；如需使用 presto 原生函数，请将参数设置为 false。
		query_max_execution_time	-	用于设置查询超时，在查询执行的时间超过设置的时间后，查询会被终止。单位支持 d-天，h-小时，m-分钟，s-秒，ms-毫秒（举例：1d 代表1天，3m 代表3分钟）。
		dlc.query.execution.mode	async	引擎查询执行模式，默认为 async 模式，该模式任务会完成全量查询计算，并将结果保存到 COS，再返回给用户，允许用户在查询完成后下载查询结果。用户也可以将该值改为 sync，在 sync 模式下，查询不一定会执行全量计算，部分结果可用后，会直接由引擎返回给用户，不再保存到 COS。因此用户可获得更低查询延迟和耗时，但结果只在系统中保存30s。推荐不需要从 COS 下载完整查询结果，但期望更低查询延迟和耗时时使用该模式，例如查询探索阶段、BI 结果展示。

tencent cloud

新手专区

下一代CDN：EdgeOne

Elasticsearch Service 限时0元试用

免费专区

腾讯云初创企业计划

特别优惠

轻量应用服务器最新优惠

轻量服务器优惠专场

对象存储特别优惠

热门产品

最新产品

专有云

腾讯云企业版解决方案

计算场景

高性能计算解决方案

企业应用

Super App 解决方案

人工智能

视图AI解决方案

安全

直播安全

多媒体

智能音乐解决方案

微信生态解决方案

微信生态

Web3

元宇宙工具箱

计算

云服务器

弹性伸缩

批量计算

专用宿主机

数据库

云数据库 MySQL

云数据库 Redis®

时序数据库 CTSDB

TDSQL MySQL 版

数据传输服务

云数据库 MongoDB

云数据库 PostgreSQL

云数据库 SQL Server

视频服务

云直播

云点播

媒体处理

云联络中心

游戏多媒体引擎

即时通信 IM

腾讯实时音视频

腾讯特效 SDK

人工智能与机器学习

大模型图像创作引擎

人脸融合

人脸核身

文字识别

大模型视频创作引擎

行业应用

腾讯健康组学平台

容器与中间件

消息队列 CKafka 版

云函数

容器服务

Serverless 容器服务

网络

负载均衡

私有网络

专线接入

云联网

NAT 网关

VPN 连接

共享带宽包

Anycast 公网加速

弹性网卡

网络流日志

全球应用加速

安全

天御验证码

主机安全

数据安全治理中心