跳转到主内容
跳转到主内容

primes 表函数

  • primes() – 返回一个具有无限行、仅包含名为 prime 的单列 (UInt64) 的表,该列按升序包含从 2 开始的素数。使用 LIMIT (以及可选的 OFFSET) 来限制行数。

  • primes(N) – 返回一个仅包含 prime 列 (UInt64) 的表,该列包含从 2 开始的前 N 个素数。

  • primes(N, M) – 返回一个仅包含 prime 列 (UInt64) 的表,该列包含从第 N 个素数开始的 M 个素数 (素数索引从 0 开始计数) 。

  • primes(N, M, S) – 返回一个仅包含 prime 列 (UInt64) 的表,该列包含从第 N 个素数开始、按步长 S (按素数索引) 的 M 个素数 (素数索引从 0 开始计数) 。返回的素数对应索引 N, N + S, N + 2S, ..., N + (M - 1)SS 必须 >= 1

这与 system.primes 系统表类似。

以下查询是等价的:

SELECT * FROM primes(10);
SELECT * FROM primes(0, 10);
SELECT * FROM primes() LIMIT 10;
SELECT * FROM system.primes LIMIT 10;
SELECT * FROM system.primes WHERE prime IN (2, 3, 5, 7, 11, 13, 17, 19, 23, 29);

下面的查询同样是等价的:

SELECT * FROM primes(10, 10);
SELECT * FROM primes() LIMIT 10 OFFSET 10;
SELECT * FROM system.primes LIMIT 10 OFFSET 10;

示例

前 10 个质数。

SELECT * FROM primes(10);
  ┌─prime─┐
  │     2 │
  │     3 │
  │     5 │
  │     7 │
  │    11 │
  │    13 │
  │    17 │
  │    19 │
  │    23 │
  │    29 │
  └───────┘

第一个大于 1e15 的素数。

SELECT prime FROM primes() WHERE prime > 1e15 LIMIT 1;
  ┌────────────prime─┐
  │ 1000000000000037 │ -- 1.00 quadrillion
  └──────────────────┘

在非常大的范围内,针对质数求解一个模条件:找到第一个满足 p >= 10^15p65537 取模结果为 1 的质数 p

SELECT prime
FROM primes()
WHERE prime >= 1e15
  AND prime % 65537 = 1
LIMIT 1;
 ┌────────────prime─┐
 │ 1000000001218399 │ -- 1.00 quadrillion
 └──────────────────┘

前 7 个梅森素数。

SELECT prime
FROM primes()
WHERE bitAnd(prime, prime + 1) = 0
LIMIT 7;
  ┌──prime─┐
  │      3 │
  │      7 │
  │     31 │
  │    127 │
  │   8191 │
  │ 131071 │
  │ 524287 │
  └────────┘

注意事项

  • 速度最快的是使用默认步长 (1) 的简单区间形式和点过滤查询,例如 primes(N)primes() LIMIT N。这些形式使用经过优化的素数生成器,可以高效地计算非常大的素数。
  • 对于无界数据源 (primes() / system.primes) ,可以在生成过程中应用诸如 prime BETWEEN ...prime IN (...)prime = ... 这样的简单值过滤器,以限制搜索的取值范围。例如,下面的查询几乎可以瞬间完成:
SELECT sum(prime)
FROM primes()
WHERE prime BETWEEN 1e6 AND 1e6 + 100
   OR prime BETWEEN 1e12 AND 1e12 + 100
   OR prime BETWEEN 1e15 AND 1e15 + 100
   OR prime IN (9999999967, 9999999971, 9999999973)
   OR prime = 1000000000000037;
  ┌───────sum(prime)─┐
  │ 2004010006000641 │ -- 2.00 quadrillion
  └──────────────────┘

1 row in set. Elapsed: 0.090 sec. 
  • 这种数值范围优化不适用于带有 WHERE 的有界表函数 (primes(N)primes(offset, count[, step])) ,因为这些变体是按素数序号定义一个有限表的,为了保持语义,必须在生成该表之后再应用 WHERE 过滤条件。
  • 使用非零偏移量和/或大于 1 的步长 (primes(offset, count) / primes(offset, count, step)) 可能会更慢,因为内部可能需要先生成并跳过额外的质数。如果你不需要偏移量或步长,可以省略这两个参数。