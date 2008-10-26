Самым простым и мощным инструментом для загрузки данных является clickhouse-client : многофункциональный нативный клиент командной строки. Чтобы загрузить данные, вы снова можете воспользоваться выводом схемы, полагаясь на то, что ClickHouse определит типы колонок.

Выполните следующую команду, чтобы создать таблицу и вставить данные непосредственно из удаленного CSV-файла, обратившись к содержимому через функцию url . Схема определяется автоматически:

CREATE TABLE hackernews ENGINE = MergeTree ORDER BY tuple ( ) EMPTY AS SELECT * FROM url('https://datasets-documentation.s3.eu-west-3.amazonaws.com/hackernews/hacknernews.csv.gz', 'CSVWithNames');

Это создает пустую таблицу, используя схему, выведенную из данных. Команда DESCRIBE TABLE позволяет нам понять присвоенные типы.

DESCRIBE TABLE hackernews

┌─name────────┬─type─────────────────────┬ │ id │ Nullable(Float64) │ │ deleted │ Nullable(Float64) │ │ type │ Nullable(String) │ │ by │ Nullable(String) │ │ time │ Nullable(String) │ │ text │ Nullable(String) │ │ dead │ Nullable(Float64) │ │ parent │ Nullable(Float64) │ │ poll │ Nullable(Float64) │ │ kids │ Array(Nullable(Float64)) │ │ url │ Nullable(String) │ │ score │ Nullable(Float64) │ │ title │ Nullable(String) │ │ parts │ Array(Nullable(Float64)) │ │ descendants │ Nullable(Float64) │ └─────────────┴──────────────────────────┴

Чтобы вставить данные в эту таблицу, используйте команду INSERT INTO, SELECT . Вместе с функцией url данные будут передаваться напрямую из URL:

INSERT INTO hackernews SELECT * FROM url('https://datasets-documentation.s3.eu-west-3.amazonaws.com/hackernews/hacknernews.csv.gz', 'CSVWithNames')

Вы успешно вставили 28 миллионов строк в ClickHouse одной командой!