deltaLakeCluster 表函数
这是对 deltaLake 表函数的扩展。
允许从指定集群中的多个节点并行处理 Amazon S3 中的 Delta Lake 表的文件。在发起者上,它创建与集群中所有节点的连接并动态调度每个文件。在工作节点上,它向发起者询问要处理的下一个任务并进行处理。这个过程将持续,直到所有任务完成。
语法
deltaLakeS3Cluster
是 deltaLakeCluster
的别名,二者均用于 S3。
参数
-
cluster_name
— 用于构建远程和本地服务器的地址和连接参数集合的集群名称。 -
所有其他参数的描述与等效的 deltaLake 表函数中的参数描述相同。
返回值
一个具有指定结构的表,用于从 S3 中指定的 Delta Lake 表读取数据。
虚拟列
_path
— 文件路径。类型:LowCardinality(String)
。_file
— 文件名称。类型:LowCardinality(String)
。_size
— 文件大小(以字节为单位)。类型:Nullable(UInt64)
。如果文件大小未知,则值为NULL
。_time
— 文件的最后修改时间。类型:Nullable(DateTime)
。如果时间未知,则值为NULL
。_etag
— 文件的 etag。类型:LowCardinality(String)
。如果 etag 未知,则值为NULL
。