Delta Lake 集成
用户可以通过表函数集成 Delta lake 表格式。
deltaLake 表函数
提供一个只读的类表接口,用于访问 Amazon S3、Azure Blob Storage 或本地挂载文件系统中的 Delta Lake 表。
语法
deltaLake
是 deltaLakeS3
的别名,支持兼容性。
参数
参数的描述与表函数 s3
、azureBlobStorage
、HDFS
和 file
中参数的描述相符。format
表示 Delta lake 表中数据文件的格式。
返回值
一个具有指定结构的表,用于读取指定 Delta Lake 表中的数据。
示例
从 S3 https://clickhouse-public-datasets.s3.amazonaws.com/delta_lake/hits/
中选择行:
虚拟列
_path
— 文件路径。类型:LowCardinality(String)
。_file
— 文件名。类型:LowCardinality(String)
。_size
— 文件大小(以字节为单位)。类型:Nullable(UInt64)
。如果文件大小未知,则值为NULL
。_time
— 文件的最后修改时间。类型:Nullable(DateTime)
。如果时间未知,则值为NULL
。_etag
— 文件的 etag。类型:LowCardinality(String)
。如果 etag 未知,则值为NULL
。