Delta Lake 集成
用户可以通过表函数集成 Delta lake 表格式。
deltaLake 表函数
提供一个只读的类表接口,用于访问 Amazon S3、Azure Blob Storage 或本地挂载文件系统中的 Delta Lake 表。
语法
deltaLake 是 deltaLakeS3 的别名,支持兼容性。
参数
参数的描述与表函数 s3、azureBlobStorage、HDFS 和 file 中参数的描述相符。format 表示 Delta lake 表中数据文件的格式。
返回值
一个具有指定结构的表,用于读取指定 Delta Lake 表中的数据。
示例
从 S3 https://clickhouse-public-datasets.s3.amazonaws.com/delta_lake/hits/ 中选择行:
虚拟列
- _path— 文件路径。类型:- LowCardinality(String)。
- _file— 文件名。类型:- LowCardinality(String)。
- _size— 文件大小(以字节为单位)。类型:- Nullable(UInt64)。如果文件大小未知,则值为- NULL。
- _time— 文件的最后修改时间。类型:- Nullable(DateTime)。如果时间未知,则值为- NULL。
- _etag— 文件的 etag。类型:- LowCardinality(String)。如果 etag 未知,则值为- NULL。
