tencent cloud

文档反馈

UDF 函数开发指南

最后更新时间:2024-07-31 18:03:25

    UDF 说明

    用户可通过编写 UDF 函数,打包为 JAR 文件后,在数据湖计算定义为函数在查询分析中使用。目前数据湖计算 DLC 的 UDF 为 HIVE 格式,继承 org.apache.hadoop.hive.ql.exec.UDF,实现 evaluate 方法。 示例:简单数组 UDF 函数。
    public class MyDiff extends UDF {
    public ArrayList<Integer> evaluate(ArrayList<Integer> input) {
    ArrayList<Integer> result = new ArrayList<Integer>();
    result.add(0, 0);
    for (int i = 1; i < input.size(); i++) {
    result.add(i, input.get(i) - input.get(i - 1));
    }
    return result;
    }
    }
    pom 文件参考:
    <dependencies>
    <dependency>
    <groupId>org.slf4j</groupId>
    <artifactId>slf4j-log4j12</artifactId>
    <version>1.7.16</version>
    <scope>test</scope>
    </dependency>
    <dependency>
    <groupId>org.apache.hive</groupId>
    <artifactId>hive-exec</artifactId>
    <version>1.2.1</version>
    </dependency>
    </dependencies>

    创建函数

    注意:
    如您创建的是 udaf/udtf 函数,需要在函数名相应加上 _udaf/_udtf 后缀。
    若您了解 SQL 语法,可通过数据探索执行 CREATE FUNCTION 语法完成函数创建,或通过可视化界面创建,流程如下:
    1. 登录 数据湖计算控制台 ,选择服务地域。
    2. 通过左侧导航菜单进入数据管理,选择需要创建的函数的数据库,如果需要创建新的数据库,可参见 数据目录及数据库管理
    
    3. 单击函数进入函数管理页面。
    4. 单击创建函数进行创建。
    
    UDF 的程序包支持本地上传或选择 COS 路径(需具备 COS 相关权限),示例为选择 COS 路径创建。 函数类名包含“包信息”及“函数的执行类名”。

    函数使用

    1. 登录 数据湖计算控制台,选择服务地域。
    2. 通过左侧导航菜单进入数据探索,选择计算引擎后即可使用 SQL 调用函数。
    
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持