跳到主要内容
跳到主要内容

MySQL 表引擎

MySQL 引擎允许您在存储于远程 MySQL 服务器上的数据上执行 SELECTINSERT 查询。

创建表

请查看 CREATE TABLE 查询的详细描述。

表结构可以与原始 MySQL 表结构不同:

  • 列名应与原始 MySQL 表中的相同,但您可以只使用其中的一些列,并且可以按任何顺序。
  • 列类型可能与原始 MySQL 表中的不同。ClickHouse 会尝试将值 cast 为 ClickHouse 数据类型。
  • external_table_functions_use_nulls 设置定义了如何处理 Nullable 列。默认值:1。如果为 0,则表函数不会生成 Nullable 列,并在插入时使用默认值代替 NULL。这也适用于数组中的 NULL 值。

引擎参数

  • host:port — MySQL 服务器地址。
  • database — 远程数据库名称。
  • table — 远程表名称。
  • user — MySQL 用户。
  • password — 用户密码。
  • replace_query — 将 INSERT INTO 查询转换为 REPLACE INTO 的标志。如果 replace_query=1,则查询会被替换。
  • on_duplicate_clause — 添加到 INSERT 查询中的 ON DUPLICATE KEY on_duplicate_clause 表达式。 示例:INSERT INTO t (c1,c2) VALUES ('a', 2) ON DUPLICATE KEY UPDATE c2 = c2 + 1,其中 on_duplicate_clauseUPDATE c2 = c2 + 1。请参阅 MySQL 文档 以查找可以与 ON DUPLICATE KEY 子句一起使用的 on_duplicate_clause。 要指定 on_duplicate_clause,您需要将 0 传递给 replace_query 参数。如果同时传递 replace_query = 1on_duplicate_clause,ClickHouse 将生成异常。

参数也可以通过 命名集合 传递。在这种情况下,hostport 应该单独指定。这种方法推荐用于生产环境。

简单的 WHERE 子句,例如 =, !=, >, >=, <, <= 在 MySQL 服务器上执行。

其余条件以及 LIMIT 抽样约束在查询到 MySQL 完成后,仅在 ClickHouse 中执行。

支持多个副本,必须通过 | 列出。例如:

使用示例

在 MySQL 中创建表:

使用普通参数在 ClickHouse 中创建表:

或者使用 命名集合

从 MySQL 表中检索数据:

设置

默认设置效率不高,因为它们甚至不重用连接。这些设置可以让您提高每秒由服务器运行的查询数。

connection_auto_close

允许在查询执行后自动关闭连接,即禁用连接重用。

可能的值:

  • 1 — 允许自动关闭连接,因此禁用连接重用。
  • 0 — 不允许自动关闭连接,因此启用连接重用。

默认值:1

connection_max_tries

设置池的重试次数(带故障转移)。

可能的值:

  • 正整数。
  • 0 — 不进行池的重试(带故障转移)。

默认值:3

connection_pool_size

连接池的大小(如果所有连接都在使用中,查询将等待直到某些连接被释放)。

可能的值:

  • 正整数。

默认值:16

connection_wait_timeout

等待空闲连接的超时(以秒为单位)(如果已经有 connection_pool_size 个活动连接),0 - 不等待。

可能的值:

  • 正整数。

默认值:5

connect_timeout

连接超时(以秒为单位)。

可能的值:

  • 正整数。

默认值:10

read_write_timeout

读/写超时(以秒为单位)。

可能的值:

  • 正整数。

默认值:300

参见