Python实现MaxCompute UDF/UDAF/UDTF

MaxCompute 的 UDF 包括:UDF,UDAF 和 UDTF 三种函数,本文将重点介绍如何通过 Python实现这三种函数。

参数与返回值类型

参数与返回值通过如下方式指定:

@odps.udf.annotate(signature)

Python UDF目前支持ODPS SQL数据类型有:bigint, string, double, boolean和datetime。SQL语句在执行之前,所有函数的参数类型和返回值类型必须确定。因此对于Python这一动态类型语言,需要通过对UDF类加decorator的方式指定函数签名。

函数签名signature通过字符串指定,语法如下:

arg_type_list ‘->’ type_list

 

arg_type_list: type_list | ‘*’ | ”

 

type_list

点赞