Java 클라이언트

v0.8+

프로토콜을 통해 데이터베이스 서버와 통신하는 Java 클라이언트 라이브러리입니다. 현재 구현은 HTTP 인터페이스만 지원합니다. 이 라이브러리는 서버에 요청을 전송하기 위한 자체 API를 제공합니다. 또한 다양한 바이너리 데이터 형식(RowBinary* 및 Native*)을 처리할 수 있는 도구도 제공합니다.

설정

Maven Central (프로젝트 웹 페이지): https://mvnrepository.com/artifact/com.clickhouse/client-v2
Nightly 빌드(저장소 링크): https://central.sonatype.com/repository/maven-snapshots/
이전 Nightly 빌드용 Artifactory(저장소 링크): https://s01.oss.sonatype.org/content/repositories/snapshots/

Maven
Gradle (Kotlin)
Gradle

<dependency>
  <groupId>com.clickhouse</groupId>
  <artifactId>client-v2</artifactId>
  <version>0.9.8</version>
</dependency>

kotlin // https://mvnrepository.com/artifact/com.clickhouse/client-v2 implementation("com.clickhouse:client-v2:0.9.8")

groovy // https://mvnrepository.com/artifact/com.clickhouse/client-v2 implementation 'com.clickhouse:client-v2:0.9.8'

초기화

Client 객체는 com.clickhouse.client.api.Client.Builder#build()에 의해 초기화됩니다. 각 클라이언트는 고유한 컨텍스트를 가지며 객체는 클라이언트 간에 공유되지 않습니다. Builder는 편리한 설정을 위한 구성 메서드를 제공합니다.

예시:

 Client client = new Client.Builder()
                .addEndpoint("https://clickhouse-cloud-instance:8443/")
                .setUsername(user)
                .setPassword(password)
                .build();

Client는 AutoCloseable이며 더 이상 필요하지 않을 때에는 닫아야 합니다.

인증

인증은 초기화 단계에서 클라이언트별로 구성됩니다. 지원되는 인증 방식은 세 가지입니다: 비밀번호, 액세스 토큰, SSL 클라이언트 인증서.

비밀번호 기반 인증을 사용하려면 setUsername(String) 및 setPassword(String)을 호출하여 사용자 이름과 비밀번호를 설정해야 합니다:

 Client client = new Client.Builder()
        .addEndpoint("https://clickhouse-cloud-instance:8443/")
        .setUsername(user)
        .setPassword(password)
        .build();

액세스 토큰 인증을 사용하려면 setAccessToken(String)을 호출하여 액세스 토큰을 설정해야 합니다:

 Client client = new Client.Builder()
        .addEndpoint("https://clickhouse-cloud-instance:8443/")
        .setAccessToken(userAccessToken)
        .build();

SSL 클라이언트 인증서를 통한 인증을 사용하려면 setUsername(String), useSSLAuthentication(boolean), setClientCertificate(String), setClientKey(String) 메서드를 호출해 사용자 이름을 설정하고 SSL 인증을 활성화하며, 클라이언트 인증서와 클라이언트 키를 설정해야 합니다:

Client client = new Client.Builder()
        .useSSLAuthentication(true)
        .setUsername("some_user")
        .setClientCertificate("some_user.crt")
        .setClientKey("some_user.key")

참고

SSL 인증은 프로덕션 환경에서 문제 해결이 어려울 수 있습니다. 이는 SSL 라이브러리에서 발생하는 많은 오류가 충분한 정보를 제공하지 않기 때문입니다. 예를 들어, 클라이언트 인증서와 키가 일치하지 않으면 서버가 즉시 연결을 종료합니다(HTTP의 경우 HTTP 요청이 전송되기 전에 이루어지는 연결 초기화 단계에서 연결이 종료되므로 서버에서 어떤 응답도 보내지 않습니다).

인증서와 키를 확인하려면 openssl과 같은 도구를 사용하십시오:

키 무결성 확인: openssl rsa -in [key-file.key] -check -noout
클라이언트 인증서에 있는 CN이 사용자와 일치하는지 확인하십시오:
- 사용자 인증서에서 CN을 가져옵니다 - openssl x509 -noout -subject -in [user.cert]
- 데이터베이스에 동일한 값이 설정되어 있는지 확인합니다: select name, auth_type, auth_params from system.users where auth_type = 'ssl_certificate' (쿼리는 auth_params를 {"common_names":["some_user"]}와 같은 형태로 출력합니다)

설정

모든 설정은 인스턴스 메서드(구성 메서드)로 정의되며, 각 값이 적용되는 범위와 컨텍스트를 명확히 합니다. 주요 구성 매개변수는 하나의 범위(클라이언트 또는 작업)에서 정의되며, 서로를 덮어쓰지 않습니다.

구성은 클라이언트 생성 시 정의됩니다. com.clickhouse.client.api.Client.Builder를 참조하세요.

클라이언트 구성

메서드	인수	설명	기본값	키
`addEndpoint(String endpoint)`	`endpoint` - URL 형식의 서버 주소	사용 가능한 서버 목록에 서버 엔드포인트를 추가합니다. 현재는 하나의 엔드포인트만 지원됩니다.	`none`	`none`
`addEndpoint(Protocol protocol, String host, int port, boolean secure)`	`protocol` - 연결 프로토콜 `host` - IP 또는 호스트 이름 `secure` - HTTPS 사용	사용 가능한 서버 목록에 서버 엔드포인트를 추가합니다. 현재는 하나의 엔드포인트만 지원됩니다.	`none`	`none`
`enableConnectionPool(boolean enable)`	`enable` - 활성/비활성 플래그	커넥션 풀 사용 여부를 설정합니다.	`true`	`connection_pool_enabled`
`setMaxConnections(int maxConnections)`	`maxConnections` - 커넥션 개수	클라이언트가 각 서버 엔드포인트에 대해 열 수 있는 최대 커넥션 수를 설정합니다.	`10`	`max_open_connections`
`setConnectionTTL(long timeout, ChronoUnit unit)`	`timeout` - 타임아웃 값 `unit` - 시간 단위	지정된 시간 이후 연결을 비활성 상태로 간주할 TTL을 설정합니다.	`-1`	`connection_ttl`
`setKeepAliveTimeout(long timeout, ChronoUnit unit)`	`timeout` - 타임아웃 값 `unit` - 시간 단위	HTTP 커넥션 Keep-Alive 타임아웃을 설정합니다. Keep-Alive를 비활성화하려면 `0`으로 설정합니다.	-	`http_keep_alive_timeout`
`setConnectionReuseStrategy(ConnectionReuseStrategy strategy)`	`strategy` - `LIFO` 또는 `FIFO`	커넥션 풀에서 사용할 커넥션 재사용 전략을 선택합니다.	`FIFO`	`connection_reuse_strategy`
`setDefaultDatabase(String database)`	`database` - 데이터베이스 이름	기본 데이터베이스를 설정합니다.	`default`	`database`

Method	Arguments	Description	Default	Key
`setUsername(String username)`	`username` - username for authentication	이후 구성에서 선택되는 인증 방법에 사용할 사용자 이름을 설정합니다.	`default`	`user`
`setPassword(String password)`	`password` - secret value	비밀번호 인증에 사용할 비밀값을 설정하고, 해당 인증 방법을 실질적으로 선택합니다.	-	`password`
`setAccessToken(String accessToken)`	`accessToken` - access token string	인증에 사용할 액세스 토큰을 설정하며, 이에 해당하는 인증 방법을 선택합니다.	-	`access_token`
`useSSLAuthentication(boolean useSSLAuthentication)`	`useSSLAuthentication` - flag to enable SSL auth	SSL 클라이언트 인증서를 인증 방법으로 설정합니다.	-	`ssl_authentication`
`useHTTPBasicAuth(boolean useBasicAuth)`	`useBasicAuth` - flag to enable/disable	사용자-비밀번호 인증에 기본 HTTP 인증을 사용할지 여부를 설정합니다. 특수 문자가 포함된 비밀번호로 인한 문제를 방지합니다.	`true`	`http_use_basic_auth`
`useBearerTokenAuth(String bearerToken)`	`bearerToken` - an encoded bearer token	Bearer 토큰 인증 사용 여부와 사용할 토큰을 지정합니다. 토큰은 있는 그대로 전송됩니다.	-	`bearer_token`

Method	Arguments	Description	Default	Key
`setConnectTimeout(long timeout, ChronoUnit unit)`	`timeout` - 타임아웃 값 `unit` - 시간 단위	모든 아웃바운드 연결의 시작 타임아웃을 설정합니다.	-	`connection_timeout`
`setConnectionRequestTimeout(long timeout, ChronoUnit unit)`	`timeout` - 타임아웃 값 `unit` - 시간 단위	연결 요청 타임아웃을 설정합니다. 이 값은 풀에서 연결을 가져올 때만 적용됩니다.	`10000`	`connection_request_timeout`
`setSocketTimeout(long timeout, ChronoUnit unit)`	`timeout` - 타임아웃 값 `unit` - 시간 단위	읽기 및 쓰기 작업에 영향을 주는 소켓 타임아웃을 설정합니다.	`0`	`socket_timeout`
`setExecutionTimeout(long timeout, ChronoUnit timeUnit)`	`timeout` - 타임아웃 값 `timeUnit` - 시간 단위	쿼리의 최대 실행 타임아웃을 설정합니다.	`0`	`max_execution_time`
`retryOnFailures(ClientFaultCause ...causes)`	`causes` - `ClientFaultCause`의 열거형 상수	복구 가능하거나 재시도 가능한 오류 유형을 설정합니다.	`NoHttpResponse` `ConnectTimeout` `ConnectionRequestTimeout`	`client_retry_on_failures`
`setMaxRetries(int maxRetries)`	`maxRetries` - 재시도 횟수	`retryOnFailures`에서 정의한 오류에 대한 최대 재시도 횟수를 설정합니다.	`3`	`retry`

Method	Arguments	Description	Default	Key
`setSocketRcvbuf(long size)`	`size` - 바이트 단위의 크기	TCP 소켓 수신 버퍼를 설정합니다. 이 버퍼는 JVM 메모리 외부에 있습니다.	`8196`	`socket_rcvbuf`
`setSocketSndbuf(long size)`	`size` - 바이트 단위의 크기	TCP 소켓 송신 버퍼를 설정합니다. 이 버퍼는 JVM 메모리 외부에 있습니다.	`8196`	`socket_sndbuf`
`setSocketKeepAlive(boolean value)`	`value` - 활성화/비활성화 플래그	모든 TCP 소켓에 `SO_KEEPALIVE` 옵션을 설정합니다. TCP Keep Alive는 연결이 유지되고 있는지 확인하는 메커니즘을 활성화합니다.	-	`socket_keepalive`
`setSocketTcpNodelay(boolean value)`	`value` - 활성화/비활성화 플래그	모든 TCP 소켓에 `SO_NODELAY` 옵션을 설정합니다. 이 TCP 옵션은 소켓이 가능한 한 빨리 데이터를 전송하도록 합니다.	-	`socket_tcp_nodelay`
`setSocketLinger(int secondsToWait)`	`secondsToWait` - 초 단위 시간	클라이언트가 생성하는 모든 TCP 소켓의 linger 시간을 설정합니다.	-	`socket_linger`

Method	Arguments	Description	Default	Key
`compressServerResponse(boolean enabled)`	`enabled` - 활성/비활성 플래그	서버가 응답을 압축할지 여부를 설정합니다.	`true`	`compress`
`compressClientRequest(boolean enabled)`	`enabled` - 활성/비활성 플래그	클라이언트가 요청을 압축할지 여부를 설정합니다.	`false`	`decompress`
`useHttpCompression(boolean enabled)`	`enabled` - 활성/비활성 플래그	해당 옵션이 활성화된 경우 클라이언트/서버 통신에 HTTP 압축을 사용할지 여부를 설정합니다.	-	-
`appCompressedData(boolean enabled)`	`enabled` - 활성/비활성 플래그	압축을 애플리케이션에서 처리함을 클라이언트에 알립니다.	`false`	`app_compressed_data`
`setLZ4UncompressedBufferSize(int size)`	`size` - 바이트 단위 크기	비압축 데이터 스트림의 일부를 수신할 버퍼의 크기를 설정합니다.	`65536`	`compression.lz4.uncompressed_buffer_size`
`disableNativeCompression`	`disable` - 비활성화 플래그	기본(native) 압축을 비활성화합니다. `true`로 설정하면 기본 압축이 비활성화됩니다.	`false`	`disable_native_compression`

Method	Arguments	Description	Default	Key
`setSSLTrustStore(String path)`	`path` - 로컬 시스템의 파일 경로	클라이언트가 서버 호스트 검증을 위해 SSL truststore를 사용하도록 설정합니다.	-	`trust_store`
`setSSLTrustStorePassword(String password)`	`password` - 비밀값	`setSSLTrustStore`로 지정한 SSL truststore의 잠금을 해제하는 데 사용할 비밀번호를 설정합니다.	-	`key_store_password`
`setSSLTrustStoreType(String type)`	`type` - truststore 유형 이름	`setSSLTrustStore`로 지정한 truststore의 유형을 설정합니다.	-	`key_store_type`
`setRootCertificate(String path)`	`path` - 로컬 시스템의 파일 경로	클라이언트가 서버 호스트 검증을 위해 지정된 루트(CA) 인증서를 사용하도록 설정합니다.	-	`sslrootcert`
`setClientCertificate(String path)`	`path` - 로컬 시스템의 파일 경로	SSL 연결을 초기화하고 SSL 인증에 사용할 클라이언트 인증서 경로를 설정합니다.	-	`sslcert`
`setClientKey(String path)`	`path` - 로컬 시스템의 파일 경로	서버와의 SSL 통신을 암호화하는 데 사용할 클라이언트 개인 키를 설정합니다.	-	`ssl_key`
`sslSocketSNI(String sni)`	`sni` - 서버 이름 문자열	SSL/TLS 연결에서 SNI(Server Name Indication)에 사용할 서버 이름을 설정합니다.	-	`ssl_socket_sni`

Method	Arguments	Description	Default	Key
`addProxy(ProxyType type, String host, int port)`	`type` - 프록시 유형 `host` - 프록시 호스트 이름 또는 IP `port` - 프록시 포트	서버와 통신할 때 사용할 프록시를 설정합니다.	-	`proxy_type`, `proxy_host`, `proxy_port`
`setProxyCredentials(String user, String pass)`	`user` - 프록시 사용자 이름 `pass` - 비밀번호	프록시 인증에 사용할 사용자 인증 정보를 설정합니다.	-	`proxy_user`, `proxy_password`

Method	Arguments	Description	Default	Key
`setHttpCookiesEnabled(boolean enabled)`	`enabled` - 활성화/비활성화 플래그	HTTP 쿠키를 저장하고 서버로 다시 전송할지 여부를 설정합니다.	-	-
`httpHeader(String key, String value)`	`key` - HTTP 헤더 키 `value` - 문자열 값	단일 HTTP 헤더의 값을 설정합니다. 이전 값은 덮어씁니다.	`none`	`none`
`httpHeader(String key, Collection values)`	`key` - HTTP 헤더 키 `values` - 문자열 값 목록	단일 HTTP 헤더의 여러 값을 설정합니다. 이전 값은 덮어씁니다.	`none`	`none`
`httpHeaders(Map headers)`	`headers` - HTTP 헤더가 담긴 맵	여러 HTTP 헤더 값을 한 번에 설정합니다.	`none`	`none`
`useHttpFormDataForQuery(boolean enable)`	`enable` - 활성화/비활성화 플래그	쿼리 파라미터를 URL 대신 요청 본문의 HTTP 폼 데이터로 전송할지 여부를 설정합니다. 서버 측 압축이 활성화된 경우에만 동작합니다. 클라이언트 수준 압축이 활성화된 경우, 각 파라미터가 multipart 콘텐츠로 전송되므로 파라미터가 있는 쿼리 요청에 대해서는 클라이언트 수준 압축이 비활성화됩니다.	`false`	`client.http.use_form_request_for_query`

Method	인수	Description	Default	Key
`serverSetting(String name, String value)`	`name` - 설정 이름 `value` - 설정 값	각 쿼리와 함께 서버로 전달할 설정을 지정합니다. 개별 작업 설정이 이를 재정의할 수 있습니다. 설정 목록	`none`	`none`
`serverSetting(String name, Collection values)`	`name` - 설정 이름 `values` - 설정 값 목록	여러 값을 서버로 전달할 설정을 지정합니다. 예를 들어 roles와 같이 사용할 수 있습니다.	`none`	`none`
`setOption("custom_settings_prefix", value)`	`value` - 접두어 문자열	서버로 전달되는 사용자 정의 설정의 접두어를 설정합니다. 서버 구성과 일치해야 합니다. ClickHouse 문서를 참조하십시오.	`custom_`	`custom_settings_prefix`

Method	Arguments	Description	Default	Key
`useServerTimeZone(boolean useServerTimeZone)`	`useServerTimeZone` - flag to enable/disable	DateTime 및 Date 컬럼 값을 디코딩할 때 클라이언트가 서버 타임존을 사용할지 설정합니다.	`true`	`use_server_time_zone`
`useTimeZone(String timeZone)`	`timeZone` - java valid timezone ID	DateTime 및 Date 컬럼 값을 디코딩할 때 지정된 타임존을 사용할지 설정합니다. 서버 타임존 설정을 재정의합니다.	-	`use_time_zone`
`setServerTimeZone(String timeZone)`	`timeZone` - java valid timezone ID	서버 측 타임존을 설정합니다. 기본적으로 UTC 타임존이 사용됩니다.	`UTC`	`server_time_zone`

Method	Arguments	Description	Default	Key
`setOption(String key, String value)`	`key` - 구성 옵션 키 `value` - 옵션 값	클라이언트 옵션의 원시 값을 설정합니다. 속성 파일에서 구성을 읽어올 때 유용합니다.	-	-
`useAsyncRequests(boolean async)`	`async` - 활성화/비활성화 플래그	클라이언트가 요청을 별도의 스레드에서 실행할지 여부를 설정합니다. 애플리케이션이 멀티 스레드 작업을 더 잘 구성할 수 있으므로 기본적으로 비활성화되어 있습니다.	`false`	`async`
`setSharedOperationExecutor(ExecutorService executorService)`	`executorService` - ExecutorService 인스턴스	작업을 위한 ExecutorService를 설정합니다.	`none`	`none`
`setQueryIdGenerator(Supplier<String> supplier)`	`supplier` - 쿼리 ID를 생성하는 `Supplier<String>` 구현체	작업 설정(`InsertSettings`, `QuerySettings`)에 쿼리 ID가 지정되지 않은 경우 사용될 사용자 정의 쿼리 ID 생성기를 설정합니다.	-	-
`setClientNetworkBufferSize(int size)`	`size` - 바이트 단위 크기	소켓과 애플리케이션 사이에서 데이터를 복사하는 데 사용되는 애플리케이션 메모리 공간 내 버퍼의 크기를 설정합니다.	`300000`	`client_network_buffer_size`
`allowBinaryReaderToReuseBuffers(boolean reuse)`	`reuse` - 활성화/비활성화 플래그	활성화된 경우 리더가 숫자 변환(transcoding)을 위해 미리 할당된 버퍼를 재사용합니다. 숫자 데이터에 대한 GC 부하를 줄여 줍니다.	-	-
`columnToMethodMatchingStrategy(ColumnToMethodMatchingStrategy strategy)`	`strategy` - 매칭 전략 구현체	DTO를 등록할 때 DTO 클래스 필드와 DB 컬럼을 매칭하기 위해 사용할 사용자 정의 전략을 설정합니다.	`none`	`none`
`setClientName(String clientName)`	`clientName` - 애플리케이션 이름 문자열	호출하는 애플리케이션에 대한 추가 정보를 설정합니다. `User-Agent` 헤더로 전달됩니다.	-	`client_name`
`registerClientMetrics(Object registry, String name)`	`registry` - Micrometer registry 인스턴스 `name` - 메트릭 그룹 이름	Micrometer(https://micrometer.io/) registry 인스턴스에 센서를 등록합니다.	-	-
`setServerVersion(String version)`	`version` - 서버 버전 문자열	버전 자동 감지가 수행되지 않도록 서버 버전을 설정합니다.	-	`server_version`
`typeHintMapping(Map typeHintMapping)`	`typeHintMapping` - 타입 힌트 맵	ClickHouse 타입에 대한 타입 힌트 매핑을 설정합니다. 예를 들어, 다차원 배열이 Java 컨테이너로 표현되도록 할 수 있습니다.	-	`type_hint_mapping`

클라이언트 식별

쿼리 로그에는 요청을 보낸 애플리케이션을 식별하는 두 가지 필드가 있습니다: client_name과 http_user_agent입니다. 네이티브 TCP 프로토콜은 애플리케이션을 식별하기 위해 client_name을 사용하고, HTTP 프로토콜은 http_user_agent를 사용합니다. 클라이언트 빌더에는 두 프로토콜 모두에 대해 올바른 값을 설정하는 setClientName 메서드가 있습니다. http_user_agent 필드는 User-Agent 헤더의 공통 형식에 따라 설정됩니다: application-name[/version] [(operating-system; architecture; ...)]. 이 값들의 집합은 각 계층(애플리케이션, 클라이언트 라이브러리, HTTP 클라이언트 라이브러리)마다 반복됩니다. setClientName 메서드로 설정한 값이 목록에서 가장 먼저 나타납니다.

예시:

client.setClientName("my-app-01/1.0");

다음과 같은 http_user_agent 값이 설정됩니다:

my-app-01/1.0 clickhouse-java-v2/0.9.6-SNAPSHOT (Linux; jvm:17.0.17) Apache-HttpClient/5.4.4

애플리케이션은 자신을 식별하기 위해 HTTP 헤더 User-Agent를 직접 설정할 수 있습니다. 단, clickhouse-java-v2/0.9.6-SNAPSHOT 파트가 헤더 끝에 자동으로 추가됩니다.

작업 식별

쿼리 로그에는 작업을 식별하고 쿼리 로그에 추가 정보를 기록하는 데 사용할 수 있는 query_id 및 log_comment라는 두 개의 필드가 추가로 있습니다.

query_id는 작업의 고유 식별자입니다. 애플리케이션에서 QuerySettings 클래스의 setQueryId 메서드를 호출하여 설정할 수 있습니다.

QuerySettings querySettings = new QuerySettings();
querySettings.setQueryId("some-query-id");

log_comment은 쿼리 로그에 추가할 수 있는 주석입니다. 애플리케이션에서 QuerySettings 클래스의 logComment 메서드를 호출하여 설정할 수 있습니다.

QuerySettings querySettings = new QuerySettings();
querySettings.logComment("some-comment");

서버 설정

서버 측 설정은 클라이언트 생성 시 한 번 클라이언트 수준에서 설정할 수 있으며(Builder의 serverSetting 메서드 참조), 작업 수준에서도 설정할 수 있습니다(작업 설정 클래스의 serverSetting 메서드 참조).

 try (Client client = new Client.Builder().addEndpoint(Protocol.HTTP, "localhost", mockServer.port(), false)
        .setUsername("default")
        .setPassword(ClickHouseServerForTest.getPassword())
        .compressClientRequest(true)

        // Client level
        .serverSetting("max_threads", "10")
        .serverSetting("async_insert", "1")
        .serverSetting("roles", Arrays.asList("role1", "role2"))

        .build()) {

	// Operation level
	QuerySettings querySettings = new QuerySettings();
	querySettings.serverSetting("session_timezone", "Europe/Zurich");

	...
}

⚠️ setOption 메서드(Client.Builder 또는 작업 설정 클래스)를 통해 옵션을 설정하는 경우, 서버 설정 이름 앞에 clickhouse_setting_ 접두사를 붙여야 합니다. 이때 com.clickhouse.client.api.ClientConfigProperties#serverSetting() 메서드를 사용하면 편리합니다.

사용자 지정 HTTP Header

사용자 지정 HTTP 헤더는 모든 작업(클라이언트 수준)에 대해 또는 단일 작업(작업 수준)에 대해 설정할 수 있습니다.


QuerySettings settings = new QuerySettings()
    .httpHeader(HttpHeaders.REFERER, clientReferer)
    .setQueryId(qId);

setOption 메서드(Client.Builder 또는 작업 설정 클래스)를 통해 옵션을 설정하는 경우 사용자 지정 헤더 이름에는 http_header_ 접두사를 붙여야 합니다. 이 경우 com.clickhouse.client.api.ClientConfigProperties#httpHeader() 메서드가 유용할 수 있습니다.

공통 정의

ClickHouseFormat

지원되는 형식을 나타내는 열거형(Enum)입니다. ClickHouse가 지원하는 모든 형식을 포함합니다.

raw - 원시 데이터는 사용자가 직접 트랜스코딩해야 합니다
full - 클라이언트가 데이터를 자체적으로 트랜스코딩할 수 있으며, 원시 데이터 스트림을 그대로 받아들입니다
- - 이 형식에서는 ClickHouse가 이 작업을 지원하지 않습니다

이 클라이언트 버전에서 지원하는 형식은 다음과 같습니다:

포맷	입력	출력
TabSeparated	raw	raw
TabSeparatedRaw	raw	raw
TabSeparatedWithNames	raw	raw
TabSeparatedWithNamesAndTypes	raw	raw
TabSeparatedRawWithNames	raw	raw
TabSeparatedRawWithNamesAndTypes	raw	raw
Template	raw	raw
TemplateIgnoreSpaces	raw	-
CSV	raw	raw
CSVWithNames	raw	raw
CSVWithNamesAndTypes	raw	raw
CustomSeparated	raw	raw
CustomSeparatedWithNames	raw	raw
CustomSeparatedWithNamesAndTypes	raw	raw
SQLInsert	-	raw
Values	raw	raw
Vertical	-	raw
JSON	raw	raw
JSONAsString	raw	-
JSONAsObject	raw	-
JSONStrings	raw	raw
JSONColumns	raw	raw
JSONColumnsWithMetadata	raw	raw
JSONCompact	raw	raw
JSONCompactStrings	-	raw
JSONCompactColumns	raw	raw
JSONEachRow	raw	raw
PrettyJSONEachRow	-	raw
JSONEachRowWithProgress	-	raw
JSONStringsEachRow	raw	raw
JSONStringsEachRowWithProgress	-	raw
JSONCompactEachRow	raw	raw
JSONCompactEachRowWithNames	raw	raw
JSONCompactEachRowWithNamesAndTypes	raw	raw
JSONCompactStringsEachRow	raw	raw
JSONCompactStringsEachRowWithNames	raw	raw
JSONCompactStringsEachRowWithNamesAndTypes	raw	raw
JSONObjectEachRow	raw	raw
BSONEachRow	raw	raw
TSKV	raw	raw
Pretty	-	raw
PrettyNoEscapes	-	raw
PrettyMonoBlock	-	raw
PrettyNoEscapesMonoBlock	-	raw
PrettyCompact	-	raw
PrettyCompactNoEscapes	-	raw
PrettyCompactMonoBlock	-	raw
PrettyCompactNoEscapesMonoBlock	-	raw
PrettySpace	-	raw
PrettySpaceNoEscapes	-	raw
PrettySpaceMonoBlock	-	raw
PrettySpaceNoEscapesMonoBlock	-	raw
Prometheus	-	raw
Protobuf	raw	raw
ProtobufSingle	raw	raw
ProtobufList	raw	raw
Avro	raw	raw
AvroConfluent	raw	-
Parquet	raw	raw
ParquetMetadata	raw	-
Arrow	raw	raw
ArrowStream	raw	raw
ORC	raw	raw
One	raw	-
Npy	raw	raw
RowBinary	full	full
RowBinaryWithNames	full	full
RowBinaryWithNamesAndTypes	full	full
RowBinaryWithDefaults	full	-
Native	full	raw
Null	-	raw
XML	-	raw
CapnProto	raw	raw
LineAsString	raw	raw
Regexp	raw	-
RawBLOB	raw	raw
MsgPack	raw	raw
MySQLDump	raw	-
DWARF	raw	-
Markdown	-	raw
Form	raw	-

Insert API

insert(String tableName, InputStream data, ClickHouseFormat format)

지정된 형식으로 인코딩된 바이트를 담은 InputStream으로 데이터를 입력받습니다. data는 지정된 format으로 인코딩되어 있어야 합니다.

시그니처

CompletableFuture<InsertResponse> insert(String tableName, InputStream data, ClickHouseFormat format, InsertSettings settings)
CompletableFuture<InsertResponse> insert(String tableName, InputStream data, ClickHouseFormat format)

매개변수

tableName - 대상 테이블 이름.

data - 인코딩된 데이터가 담긴 입력 스트림입니다.

format - 데이터가 인코딩된 형식입니다.

settings - 요청 설정입니다.

반환값

InsertResponse 타입의 Future로, 작업 결과와 서버 측 메트릭과 같은 추가 정보를 반환합니다.

예시

try (InputStream dataStream = getDataStream()) {
    try (InsertResponse response = client.insert(TABLE_NAME, dataStream, ClickHouseFormat.JSONEachRow,
            insertSettings).get(3, TimeUnit.SECONDS)) {

        log.info("Insert finished: {} rows written", response.getMetrics().getMetric(ServerMetrics.NUM_ROWS_WRITTEN).getLong());
    } catch (Exception e) {
        log.error("Failed to write JSONEachRow data", e);
        throw new RuntimeException(e);
    }
}

insert(String tableName, List<?> data, InsertSettings settings)

데이터베이스에 쓰기 요청을 보냅니다. 객체 목록은 효율적인 형식으로 변환된 후 서버로 전송됩니다. 목록 항목의 클래스는 register(Class, TableSchema) 메서드를 사용해 미리 등록해야 합니다.

시그니처

client.insert(String tableName, List<?> data, InsertSettings settings)
client.insert(String tableName, List<?> data)

매개변수

tableName - 대상 테이블의 이름입니다.

data - DTO(Data Transfer Object) 객체 컬렉션입니다.

settings - 요청 설정입니다.

반환값

InsertResponse 타입의 Future — 작업 결과와 서버 측 메트릭과 같은 추가 정보를 포함합니다.

예시

// Important step (done once) - register class to pre-compile object serializer according to the table schema.
client.register(ArticleViewEvent.class, client.getTableSchema(TABLE_NAME));

List<ArticleViewEvent> events = loadBatch();

try (InsertResponse response = client.insert(TABLE_NAME, events).get()) {
    // handle response, then it will be closed and connection that served request will be released.
}

InsertSettings

삽입 작업에 대한 구성 옵션입니다.

설정 메서드

메서드	설명
`setQueryId(String queryId)`	작업에 할당될 쿼리 ID를 설정합니다. 기본값은 `null`입니다.
`setDeduplicationToken(String token)`	중복 제거 토큰을 설정합니다. 이 토큰은 서버로 전송되어 쿼리를 식별하는 데 사용할 수 있습니다. 기본값은 `null`입니다.
`setInputStreamCopyBufferSize(int size)`	복사 버퍼 크기입니다. 이 버퍼는 쓰기 작업 중 사용자 제공 입력 스트림의 데이터를 출력 스트림으로 복사할 때 사용됩니다. 기본값: `8196`.
`serverSetting(String name, String value)`	작업에 대한 개별 서버 설정을 지정합니다.
`serverSetting(String name, Collection values)`	작업에 대해 여러 값을 갖는 개별 서버 설정을 지정합니다. 컬렉션의 항목은 `String` 값이어야 합니다.
`setDBRoles(Collection dbRoles)`	작업 실행 전에 적용할 DB 역할을 설정합니다. 컬렉션의 항목은 `String` 값이어야 합니다.
`setOption(String option, Object value)`	구성 옵션을 raw 형식으로 설정합니다. 이는 서버 설정이 아닙니다.

InsertResponse

삽입 작업 결과를 담는 응답 객체입니다. 클라이언트가 서버로부터 응답을 받은 경우에만 사용할 수 있습니다.

참고

이전 응답의 모든 데이터를 완전히 읽기 전까지는 연결을 재사용할 수 없으므로, 연결을 반환하려면 이 객체를 가능한 한 빨리 닫아야 합니다.

메서드	설명
`OperationMetrics getMetrics()`	작업 메트릭이 포함된 객체를 반환합니다.
`String getQueryId()`	애플리케이션이 작업에 할당한 Query id를 반환합니다(작업 설정 또는 서버를 통해 할당됨).

쿼리 API

query(String sqlQuery)

sqlQuery를 있는 그대로 전송합니다. 응답 형식은 쿼리 설정에 의해 지정됩니다. QueryResponse는 해당 형식을 지원하는 리더가 소비해야 하는 응답 스트림에 대한 참조를 유지합니다.

시그니처

CompletableFuture<QueryResponse> query(String sqlQuery, QuerySettings settings)
CompletableFuture<QueryResponse> query(String sqlQuery)

매개변수

sqlQuery - 단일 SQL 문입니다. 쿼리는 있는 그대로 서버로 전송됩니다.

settings - 요청 설정입니다.

반환값

QueryResponse 타입의 Future로, 결과 데이터셋과 서버 측 메트릭과 같은 추가 정보를 포함합니다. 데이터셋을 모두 읽은 후 Response 객체를 닫아야 합니다.

예시

final String sql = "select * from " + TABLE_NAME + " where title <> '' limit 10";

// Default format is RowBinaryWithNamesAndTypesFormatReader so reader have all information about columns
try (QueryResponse response = client.query(sql).get(3, TimeUnit.SECONDS);) {

    // Create a reader to access the data in a convenient way
    ClickHouseBinaryFormatReader reader = client.newBinaryFormatReader(response);

    while (reader.hasNext()) {
        reader.next(); // Read the next record from stream and parse it

        // get values
        double id = reader.getDouble("id");
        String title = reader.getString("title");
        String url = reader.getString("url");

        // collecting data
    }
} catch (Exception e) {
    log.error("Failed to read data", e);
}

// put business logic outside of the reading block to release http connection asap.

query(String sqlQuery, Map<String, Object> queryParams, QuerySettings settings)

sqlQuery를 그대로 전송합니다. 또한 서버가 SQL 표현식을 컴파일할 수 있도록 쿼리 매개변수도 함께 전송합니다.

시그니처

CompletableFuture<QueryResponse> query(String sqlQuery, Map<String, Object> queryParams, QuerySettings settings)

매개변수

sqlQuery - {} 플레이스홀더를 포함하는 SQL 표현식입니다.

queryParams - 서버 측에서 SQL 표현식을 완성하는 데 사용하는 변수 맵입니다.

settings - 요청 설정입니다.

반환값

QueryResponse 타입의 Future로, 결과 데이터셋과 서버 측 메트릭과 같은 추가 정보를 포함합니다. 데이터셋을 모두 읽은 후 Response 객체를 닫아야 합니다.

예시


// define parameters. They will be sent to the server along with the request.
Map<String, Object> queryParams = new HashMap<>();
queryParams.put("param1", 2);

try (QueryResponse response =
        client.query("SELECT * FROM " + table + " WHERE col1 >= {param1:UInt32}", queryParams, new QuerySettings()).get()) {

    // Create a reader to access the data in a convenient way
    ClickHouseBinaryFormatReader reader = client.newBinaryFormatReader(response);

    while (reader.hasNext()) {
        reader.next(); // Read the next record from stream and parse it

        // reading data
    }

} catch (Exception e) {
    log.error("Failed to read data", e);
}

queryAll(String sqlQuery)

RowBinaryWithNamesAndTypes 형식의 데이터를 조회합니다. 결과는 컬렉션으로 반환됩니다. 읽기 성능은 리더를 사용할 때와 동일하지만, 전체 데이터셋을 메모리에 유지해야 하므로 더 많은 메모리가 필요합니다.

시그니처

List<GenericRecord> queryAll(String sqlQuery)

매개변수

sqlQuery - 서버에서 데이터를 조회하기 위한 SQL 표현식입니다.

반환값

결과 데이터를 행 형식으로 접근할 수 있도록 하는 GenericRecord 객체들의 목록으로 표현된 전체 데이터셋입니다.

예시

try {
    log.info("Reading whole table and process record by record");
    final String sql = "select * from " + TABLE_NAME + " where title <> ''";

    // Read whole result set and process it record by record
    client.queryAll(sql).forEach(row -> {
        double id = row.getDouble("id");
        String title = row.getString("title");
        String url = row.getString("url");

        log.info("id: {}, title: {}, url: {}", id, title, url);
    });
} catch (Exception e) {
    log.error("Failed to read data", e);
}

QuerySettings

쿼리 작업에 대한 구성 옵션입니다.

설정 메서드

메서드	설명
`setQueryId(String queryId)`	작업에 할당될 Query id를 설정합니다.
`setFormat(ClickHouseFormat format)`	응답 형식을 설정합니다. 사용 가능한 전체 형식 목록은 `RowBinaryWithNamesAndTypes`를 참조하십시오.
`setMaxExecutionTime(Integer maxExecutionTime)`	서버에서 작업 실행 시간을 설정합니다. Read 타임아웃에는 영향을 주지 않습니다.
`waitEndOfQuery(Boolean waitEndOfQuery)`	응답을 보내기 전에 쿼리가 끝날 때까지 기다리도록 서버에 요청합니다.
`setUseServerTimeZone(Boolean useServerTimeZone)`	연산 결과의 날짜/시간 타입을 파싱할 때 서버 타임존(클라이언트 구성 참조)이 사용됩니다. 기본값은 `false`입니다.
`setUseTimeZone(String timeZone)`	`timeZone`을 시간 변환에 사용하도록 서버에 요청합니다. session_timezone을 참조하십시오.
`serverSetting(String name, String value)`	작업에 대한 개별 서버 설정을 지정합니다.
`serverSetting(String name, Collection values)`	단일 작업에 대해 여러 값을 사용하는 개별 서버 설정을 지정합니다. 컬렉션의 각 항목은 `String` 값이어야 합니다.
`setDBRoles(Collection dbRoles)`	작업 실행 전에 적용할 DB 역할을 설정합니다. 컬렉션의 항목은 `String` 값이어야 합니다.
`setOption(String option, Object value)`	원시 형식으로 구성 옵션을 설정합니다. 이것은 서버 설정이 아닙니다.

QueryResponse

쿼리 실행 결과를 담고 있는 응답 객체입니다. 클라이언트가 서버로부터 응답을 받은 경우에만 사용 가능합니다.

참고

이전 응답의 모든 데이터를 완전히 읽기 전까지는 연결을 재사용할 수 없으므로, 연결을 반환하려면 이 객체를 가능한 한 빨리 닫아야 합니다.

메서드	설명
`ClickHouseFormat getFormat()`	응답 데이터가 인코딩된 포맷을 반환합니다.
`InputStream getInputStream()`	지정된 포맷으로 된 비압축 데이터의 바이트 스트림을 반환합니다.
`OperationMetrics getMetrics()`	작업 메트릭이 포함된 객체를 반환합니다.
`String getQueryId()`	애플리케이션이 작업에 할당한 Query id를 반환합니다(작업 설정 또는 서버를 통해 할당됨).
`TimeZone getTimeZone()`	응답에서 Date/DateTime 타입을 처리하는 데 사용해야 하는 시간대를 반환합니다.

예시

예제 코드는 저장소에서 확인할 수 있습니다.
Spring 서비스 구현을 참고하십시오

공통 API

getTableSchema(String table)

table에 대한 테이블 schema를 가져옵니다.

시그니처

TableSchema getTableSchema(String table)
TableSchema getTableSchema(String table, String database)

매개변수

table - 스키마 데이터를 가져올 테이블 이름입니다.

database - 대상 테이블이 정의된 데이터베이스.

반환값

테이블의 컬럼 목록이 포함된 TableSchema 객체를 반환합니다.

getTableSchemaFromQuery(String sql)

SQL 문에서 schema를 가져옵니다.

시그니처

TableSchema getTableSchemaFromQuery(String sql)

매개변수

sql - 스키마를 반환하는 "SELECT" SQL 문입니다.

반환값

sql 표현식과 일치하는 컬럼들로 구성된 TableSchema 객체를 반환합니다.

TableSchema

register(Class<?> clazz, TableSchema schema)

Java 클래스가 schema를 사용하여 데이터를 쓰고 읽을 수 있도록 직렬화 및 역직렬화 레이어를 컴파일합니다. 이 메서드는 getter/setter 쌍과 해당 컬럼에 대한 직렬화기 및 역직렬화기를 생성합니다. 컬럼 매칭은 메서드 이름에서 컬럼 이름을 추출하여 수행됩니다. 예를 들어, getFirstName은 first_name 또는 firstname 컬럼에 대응됩니다.

시그니처

void register(Class<?> clazz, TableSchema schema)

매개변수

clazz - 데이터를 읽고 쓰는 데 사용되는 POJO를 나타내는 클래스입니다.

schema - POJO 속성과 매칭하는 데 사용할 데이터 스키마입니다.

예시

client.register(ArticleViewEvent.class, client.getTableSchema(TABLE_NAME));

사용 예시

전체 예제 코드는 저장소의 'example` 폴더에 저장되어 있습니다:

client-v2 - 주요 예제 모음입니다.
demo-service - Spring Boot 애플리케이션에서 클라이언트를 사용하는 예제입니다.
demo-kotlin-service - Ktor(Kotlin) 애플리케이션에서 클라이언트를 사용하는 방법을 보여주는 예제입니다.

데이터 읽기

데이터를 읽는 대표적인 방법은 두 가지입니다:

query() 메서드는 데이터가 들어 있는 InputStream을 포함한 저수준의 QueryResponse 객체를 반환합니다. 일반적으로 스트리밍 읽기를 위해 ClickHouseBinaryFormatReader와 함께 사용되지만 다른 사용자 정의 리더 구현과 함께 사용할 수도 있습니다. QueryResponse는 결과 집합의 메타데이터와 메트릭에 대한 접근도 제공합니다.
queryAll() 메서드와 GenericRecord를 사용하면 행 단위로 데이터에 편리하게 접근할 수 있습니다. 이 경우 결과 집합 전체가 메모리에 로드됩니다.
queryRecords() 메서드는 com.clickhouse.client.api.query.Records를 반환하며, 이는 GenericRecord 객체에 대한 이터레이터입니다. 이 메서드는 스트리밍 방식을 사용하며 (데이터는 메모리에 로드되지 않음) GenericRecord를 사용해 데이터에 접근합니다.

참고: 스트리밍 방식은 데이터를 네트워크 스트림에서 직접 읽기 때문에 읽기 속도가 충분히 빠르지 않으면 서버 쓰기 타임아웃이 발생할 수 있습니다.

배열 읽기

ClickHouseBinaryFormatReader 메서드

getList(...) - 임의의 Array(...)를 List<T> 형태로 읽습니다. 유연한 타입 읽기에 적합한 기본 옵션입니다. 중첩 배열을 지원합니다.
getByteArray(...), getShortArray(...), getIntArray(...), getLongArray(...), getFloatArray(...), getDoubleArray(...), getBooleanArray(...) - primitive 타입과 호환되는 값의 1차원 배열에 가장 적합합니다.
getStringArray(...) - Array(String)(및 이름으로 표현되는 enum 값)을 위한 메서드입니다.
getObjectArray(...) - 중첩 배열을 포함해 모든 Array(...) 요소 타입에 사용할 수 있는 범용 옵션입니다. 널 허용 값을 포함하는 배열이나 중첩 배열을 읽을 때 사용합니다.

모든 메서드에는 인덱스 기반 및 이름 기반 오버로드가 제공됩니다. 인덱스는 1부터 시작합니다. 인덱스 기반 메서드는 컬럼에 직접 접근합니다. 이름 기반 메서드는 매 호출마다 인덱스를 조회해야 합니다.

try (QueryResponse response = client.query("SELECT * FROM my_table").get()) {
    ClickHouseBinaryFormatReader reader = client.newBinaryFormatReader(response);
    while (reader.next() != null) {

        Object[] uint64 = reader.getObjectArray("uint64_arr"); // Array(UInt64) -> BigInteger[]
        Object[] arr2d = reader.getObjectArray("arr2d");       // Array(Array(Int64)) -> Object[]

        // nested arrays are returned as nested Object[]:
        Object[] firstInner = (Object[]) arr2d[0];
        Long firstValue = (Long) firstInner[0];
    }
}

GenericRecord 메서드

getList(...) - 임의의 Array(...)를 List<T> 형태로 읽습니다. 유연한 타입 읽기에 적합한 기본 옵션입니다. 중첩 배열을 지원합니다.
getByteArray(...), getShortArray(...), getIntArray(...), getLongArray(...), getFloatArray(...), getDoubleArray(...), getBooleanArray(...) - 기본(primitive) 타입과 호환되는 값으로 이루어진 1차원 배열에 가장 적합합니다.
getStringArray(...) - Array(String)(및 이름으로 표현되는 enum 값)을 위한 메서드입니다.
getObjectArray(...) - 중첩 배열을 포함한 모든 Array(...) 요소 타입에 사용할 수 있는 범용 옵션입니다. 널 허용 값을 포함하는 배열과 중첩 배열을 읽을 때 사용합니다.

try (QueryResponse response = client.query("SELECT * FROM my_table").get()) {
    List<GenericRecord> rows = client.queryAll(
        "SELECT int_arr, arr2d_nullable FROM test_arrays ORDER BY id");

    for (GenericRecord row : rows) {
        Object[] intArr = row.getObjectArray("int_arr");                 // Array(Int32) -> Integer[]
        Object[] arr2d = row.getObjectArray("arr2d_nullable");           // Array(Array(Nullable(Int32)))

        Object[] inner = (Object[]) arr2d[0];
        Object maybeNull = inner[1]; // may be null
    }
}

마이그레이션 가이드

Old client (V1) was using com.clickhouse.client.ClickHouseClient#builder as start point. The new client (V2) uses similar pattern with com.clickhouse.client.api.Client.Builder. Main differences are:

구현체를 가져오기 위해 service loader를 사용하지는 않습니다. com.clickhouse.client.api.Client는 향후 다양한 구현을 위한 파사드 클래스입니다.
구성 소스 수가 더 적습니다. 하나는 builder에 제공되고, 다른 하나는 작업 설정(QuerySettings, InsertSettings)에 제공됩니다. 이전 버전에서는 노드별 구성이 있었고 경우에 따라 환경 변수를 로드했습니다.

구성 매개변수 대응표

V1에서 설정과 관련된 enum 클래스는 3가지입니다:

com.clickhouse.client.config.ClickHouseDefaults - 대부분의 사용 사례에서 설정해야 하는 구성 매개변수입니다. 예: USER, PASSWORD.
com.clickhouse.client.config.ClickHouseClientOption - 클라이언트 전용 구성 매개변수입니다. 예: HEALTH_CHECK_INTERVAL.
com.clickhouse.client.http.config.ClickHouseHttpOption - HTTP 인터페이스 전용 구성 매개변수입니다. 예: RECEIVE_QUERY_PROGRESS.

이 클래스들은 매개변수를 그룹화하고 명확한 분리를 제공하기 위해 설계되었습니다. 그러나 일부 경우에는 혼란을 초래하기도 했습니다(com.clickhouse.client.config.ClickHouseDefaults#ASYNC와 com.clickhouse.client.config.ClickHouseClientOption#ASYNC 사이에 차이가 있는지 여부 등). 새로운 V2 클라이언트는 com.clickhouse.client.api.Client.Builder를 모든 가능한 클라이언트 구성 옵션의 단일 딕셔너리로 사용합니다. 모든 구성 매개변수 이름은 com.clickhouse.client.api.ClientConfigProperties에 나열되어 있습니다.

아래 표는 새 클라이언트에서 지원되는 이전 옵션과 그 새로운 의미를 보여줍니다.

범례: ✔ = 지원됨, ✗ = 제거됨

V1 설정	V2 Builder 메서드	비고
`ClickHouseDefaults#HOST`	`Client.Builder#addEndpoint`
`ClickHouseDefaults#PROTOCOL`	✗	V2에서는 HTTP만 지원합니다
`ClickHouseDefaults#DATABASE` `ClickHouseClientOption#DATABASE`	`Client.Builder#setDefaultDatabase`
`ClickHouseDefaults#USER`	`Client.Builder#setUsername`
`ClickHouseDefaults#PASSWORD`	`Client.Builder#setPassword`
`ClickHouseClientOption#CONNECTION_TIMEOUT`	`Client.Builder#setConnectTimeout`
`ClickHouseClientOption#CONNECTION_TTL`	`Client.Builder#setConnectionTTL`
`ClickHouseHttpOption#MAX_OPEN_CONNECTIONS`	`Client.Builder#setMaxConnections`
`ClickHouseHttpOption#KEEP_ALIVE` `ClickHouseHttpOption#KEEP_ALIVE_TIMEOUT`	`Client.Builder#setKeepAliveTimeout`
`ClickHouseHttpOption#CONNECTION_REUSE_STRATEGY`	`Client.Builder#setConnectionReuseStrategy`
`ClickHouseHttpOption#USE_BASIC_AUTHENTICATION`	`Client.Builder#useHTTPBasicAuth`

V1 Configuration	V2 Builder Method	Comments
`ClickHouseDefaults#SSL_CERTIFICATE_TYPE`	✗
`ClickHouseDefaults#SSL_KEY_ALGORITHM`	✗
`ClickHouseDefaults#SSL_PROTOCOL`	✗
`ClickHouseClientOption#SSL`	✗	See `Client.Builder#addEndpoint`
`ClickHouseClientOption#SSL_MODE`	✗
`ClickHouseClientOption#SSL_ROOT_CERTIFICATE`	`Client.Builder#setRootCertificate`	SSL Auth should be enabled by `useSSLAuthentication`
`ClickHouseClientOption#SSL_CERTIFICATE`	`Client.Builder#setClientCertificate`
`ClickHouseClientOption#SSL_KEY`	`Client.Builder#setClientKey`
`ClickHouseClientOption#KEY_STORE_TYPE`	`Client.Builder#setSSLTrustStoreType`
`ClickHouseClientOption#TRUST_STORE`	`Client.Builder#setSSLTrustStore`
`ClickHouseClientOption#KEY_STORE_PASSWORD`	`Client.Builder#setSSLTrustStorePassword`
`ClickHouseClientOption#SSL_SOCKET_SNI`	`Client.Builder#sslSocketSNI`
`ClickHouseClientOption#CUSTOM_SOCKET_FACTORY`	✗
`ClickHouseClientOption#CUSTOM_SOCKET_FACTORY_OPTIONS`	✗	See `Client.Builder#sslSocketSNI` to set SNI

V1 Configuration	V2 Builder Method	Comments
`ClickHouseClientOption#SOCKET_TIMEOUT`	`Client.Builder#setSocketTimeout`
`ClickHouseClientOption#SOCKET_REUSEADDR`	`Client.Builder#setSocketReuseAddress`
`ClickHouseClientOption#SOCKET_KEEPALIVE`	`Client.Builder#setSocketKeepAlive`
`ClickHouseClientOption#SOCKET_LINGER`	`Client.Builder#setSocketLinger`
`ClickHouseClientOption#SOCKET_IP_TOS`	✗
`ClickHouseClientOption#SOCKET_TCP_NODELAY`	`Client.Builder#setSocketTcpNodelay`
`ClickHouseClientOption#SOCKET_RCVBUF`	`Client.Builder#setSocketRcvbuf`
`ClickHouseClientOption#SOCKET_SNDBUF`	`Client.Builder#setSocketSndbuf`

V1 구성	V2 Builder 메서드	설명
`ClickHouseClientOption#COMPRESS`	`Client.Builder#compressServerResponse`	관련 항목 `useHttpCompression`
`ClickHouseClientOption#DECOMPRESS`	`Client.Builder#compressClientRequest`	관련 항목 `useHttpCompression`
`ClickHouseClientOption#COMPRESS_ALGORITHM`	✗	HTTP가 아닌 경우 `LZ4`를 사용합니다. HTTP는 `Accept-Encoding`을 사용합니다
`ClickHouseClientOption#DECOMPRESS_ALGORITHM`	✗	HTTP가 아닌 경우 `LZ4`를 사용합니다. HTTP는 `Content-Encoding`을 사용합니다
`ClickHouseClientOption#COMPRESS_LEVEL`	✗
`ClickHouseClientOption#DECOMPRESS_LEVEL`	✗

V1 Configuration	V2 Builder Method	Comments
`ClickHouseClientOption#PROXY_TYPE`	`Client.Builder#addProxy`
`ClickHouseClientOption#PROXY_HOST`	`Client.Builder#addProxy`
`ClickHouseClientOption#PROXY_PORT`	`Client.Builder#addProxy`
`ClickHouseClientOption#PROXY_USERNAME`	`Client.Builder#setProxyCredentials`
`ClickHouseClientOption#PROXY_PASSWORD`	`Client.Builder#setProxyCredentials`

V1 Configuration	V2 Builder Method	Comments
`ClickHouseClientOption#MAX_EXECUTION_TIME`	`Client.Builder#setExecutionTimeout`
`ClickHouseClientOption#RETRY`	`Client.Builder#setMaxRetries`	See also `retryOnFailures`
`ClickHouseHttpOption#AHC_RETRY_ON_FAILURE`	`Client.Builder#retryOnFailures`
`ClickHouseClientOption#FAILOVER`	✗
`ClickHouseClientOption#REPEAT_ON_SESSION_LOCK`	✗
`ClickHouseClientOption#SESSION_ID`	✗
`ClickHouseClientOption#SESSION_CHECK`	✗
`ClickHouseClientOption#SESSION_TIMEOUT`	✗

V1 Configuration	V2 Builder Method	Comments
`ClickHouseDefaults#SERVER_TIME_ZONE` `ClickHouseClientOption#SERVER_TIME_ZONE`	`Client.Builder#setServerTimeZone`
`ClickHouseClientOption#USE_SERVER_TIME_ZONE`	`Client.Builder#useServerTimeZone`
`ClickHouseClientOption#USE_SERVER_TIME_ZONE_FOR_DATES`
`ClickHouseClientOption#USE_TIME_ZONE`	`Client.Builder#useTimeZone`

V1 Configuration	V2 Builder Method	Comments
`ClickHouseClientOption#BUFFER_SIZE`	`Client.Builder#setClientNetworkBufferSize`
`ClickHouseClientOption#BUFFER_QUEUE_VARIATION`	✗
`ClickHouseClientOption#READ_BUFFER_SIZE`	✗
`ClickHouseClientOption#WRITE_BUFFER_SIZE`	✗
`ClickHouseClientOption#REQUEST_CHUNK_SIZE`	✗
`ClickHouseClientOption#REQUEST_BUFFERING`	✗
`ClickHouseClientOption#RESPONSE_BUFFERING`	✗
`ClickHouseClientOption#MAX_BUFFER_SIZE`	✗
`ClickHouseClientOption#MAX_QUEUED_BUFFERS`	✗
`ClickHouseClientOption#MAX_QUEUED_REQUESTS`	✗
`ClickHouseClientOption#REUSE_VALUE_WRAPPER`	✗

V1 구성	V2 Builder 메서드	설명
`ClickHouseDefaults#ASYNC` `ClickHouseClientOption#ASYNC`	`Client.Builder#useAsyncRequests`
`ClickHouseDefaults#MAX_SCHEDULER_THREADS`	✗	`setSharedOperationExecutor` 참조
`ClickHouseDefaults#MAX_THREADS`	✗	`setSharedOperationExecutor` 참조
`ClickHouseDefaults#THREAD_KEEPALIVE_TIMEOUT`	`setSharedOperationExecutor` 참조
`ClickHouseClientOption#MAX_THREADS_PER_CLIENT`	✗
`ClickHouseClientOption#MAX_CORE_THREAD_TTL`	✗

V1 Configuration	V2 Builder Method	Comments
`ClickHouseHttpOption#CUSTOM_HEADERS`	`Client.Builder#httpHeaders`
`ClickHouseHttpOption#CUSTOM_PARAMS`	✗	See `Client.Builder#serverSetting`
`ClickHouseClientOption#CLIENT_NAME`	`Client.Builder#setClientName`
`ClickHouseHttpOption#CONNECTION_PROVIDER`	✗
`ClickHouseHttpOption#DEFAULT_RESPONSE`	✗
`ClickHouseHttpOption#SEND_HTTP_CLIENT_ID`	✗
`ClickHouseHttpOption#AHC_VALIDATE_AFTER_INACTIVITY`	✗	Always enabled when Apache Http Client is used

V1 Configuration	V2 Builder Method	Comments
`ClickHouseDefaults#FORMAT` `ClickHouseClientOption#FORMAT`	✗	Moved to operation settings (`QuerySettings` and `InsertSettings`)
`ClickHouseClientOption#QUERY_ID`	✗	See `QuerySettings` and `InsertSettings`
`ClickHouseClientOption#LOG_LEADING_COMMENT`	✗	See `QuerySettings#logComment` and `InsertSettings#logComment`
`ClickHouseClientOption#MAX_RESULT_ROWS`	✗	Is server side setting
`ClickHouseClientOption#RESULT_OVERFLOW_MODE`	✗	Is server side setting
`ClickHouseHttpOption#RECEIVE_QUERY_PROGRESS`	✗	Server side setting
`ClickHouseHttpOption#WAIT_END_OF_QUERY`	✗	Server side setting
`ClickHouseHttpOption#REMEMBER_LAST_SET_ROLES`	`Client#setDBRoles`	Runtime config now. See also `QuerySettings#setDBRoles` and `InsertSettings#setDBRoles`

V1 Configuration	V2 Builder Method	Comments
`ClickHouseClientOption#AUTO_DISCOVERY`	✗
`ClickHouseClientOption#LOAD_BALANCING_POLICY`	✗
`ClickHouseClientOption#LOAD_BALANCING_TAGS`	✗
`ClickHouseClientOption#HEALTH_CHECK_INTERVAL`	✗
`ClickHouseClientOption#HEALTH_CHECK_METHOD`	✗
`ClickHouseClientOption#NODE_DISCOVERY_INTERVAL`	✗
`ClickHouseClientOption#NODE_DISCOVERY_LIMIT`	✗
`ClickHouseClientOption#NODE_CHECK_INTERVAL`	✗
`ClickHouseClientOption#NODE_GROUP_SIZE`	✗
`ClickHouseClientOption#CHECK_ALL_NODES`	✗

V1 Configuration	V2 Builder Method	Comments
`ClickHouseDefaults#AUTO_SESSION`	✗	Session support will be reviewed
`ClickHouseDefaults#BUFFERING`	✗
`ClickHouseDefaults#MAX_REQUESTS`	✗
`ClickHouseDefaults#ROUNDING_MODE`
`ClickHouseDefaults#SERVER_VERSION` `ClickHouseClientOption#SERVER_VERSION`	`Client.Builder#setServerVersion`
`ClickHouseDefaults#SRV_RESOLVE`	✗
`ClickHouseClientOption#CUSTOM_SETTINGS`
`ClickHouseClientOption#PRODUCT_NAME`	✗	Use client name
`ClickHouseClientOption#RENAME_RESPONSE_COLUMN`	✗
`ClickHouseClientOption#SERVER_REVISION`	✗
`ClickHouseClientOption#TRANSACTION_TIMEOUT`	✗
`ClickHouseClientOption#WIDEN_UNSIGNED_TYPES`	✗
`ClickHouseClientOption#USE_BINARY_STRING`	✗
`ClickHouseClientOption#USE_BLOCKING_QUEUE`	✗
`ClickHouseClientOption#USE_COMPILATION`	✗
`ClickHouseClientOption#USE_OBJECTS_IN_ARRAYS`	✗
`ClickHouseClientOption#MAX_MAPPER_CACHE`	✗
`ClickHouseClientOption#MEASURE_REQUEST_TIME`	✗

일반적인 차이점

Client V2 uses less proprietary classes to increase portability. For example, V2 works with any implementation of java.io.InputStream for writing data to a server.
Client V2의 async 설정은 기본적으로 off입니다. 이는 추가 스레드를 사용하지 않으므로 클라이언트에 대한 제어를 애플리케이션에서 더 많이 할 수 있음을 의미합니다. 이 설정은 대부분의 사용 사례에서 off로 유지해야 합니다. async를 활성화하면 요청마다 별도의 스레드가 생성됩니다. 이는 애플리케이션에서 제어하는 executor를 사용할 때만 의미가 있습니다(참조: com.clickhouse.client.api.Client.Builder#setSharedOperationExecutor)

데이터 쓰기

use any implementation of java.io.InputStream. V1 com.clickhouse.data.ClickHouseInputStream is supported but NOT recommended.
입력 스트림의 끝이 감지되면 적절히 처리됩니다. 이전에는 요청의 출력 스트림을 닫아야 했습니다.

V1 TSV 형식 데이터 삽입.

InputStream inData = getInData();
ClickHouseRequest.Mutation request = client.read(server)
        .write()
        .table(tableName)
        .format(ClickHouseFormat.TSV);
ClickHouseConfig config = request.getConfig();
CompletableFuture<ClickHouseResponse> future;
try (ClickHousePipedOutputStream requestBody = ClickHouseDataStreamFactory.getInstance()
        .createPipedOutputStream(config)) {
    // start the worker thread which transfer data from the input into ClickHouse
    future = request.data(requestBody.getInputStream()).execute();

    // Copy data from inData stream to requestBody stream

    // We need to close the stream before getting a response
    requestBody.close();

    try (ClickHouseResponse response = future.get()) {
        ClickHouseResponseSummary summary = response.getSummary();
        Assert.assertEquals(summary.getWrittenRows(), numRows, "Num of written rows");
    }
}

V2 TSV 형식 데이터 삽입.

InputStream inData = getInData();
InsertSettings settings = new InsertSettings().setInputStreamCopyBufferSize(8198 * 2); // set copy buffer size
try (InsertResponse response = client.insert(tableName, inData, ClickHouseFormat.TSV, settings).get(30, TimeUnit.SECONDS)) {

  // Insert is complete at this point

} catch (Exception e) {
 // Handle exception
}

호출할 메서드는 하나뿐입니다. 별도의 요청 객체를 생성할 필요가 없습니다.
모든 데이터 복사가 완료되면 요청 본문(request body) 스트림이 자동으로 닫힙니다.
새로운 저수준 API인 com.clickhouse.client.api.Client#insert(java.lang.String, java.util.List<java.lang.String>, com.clickhouse.client.api.DataStreamWriter, com.clickhouse.data.ClickHouseFormat, com.clickhouse.client.api.insert.InsertSettings)도 사용할 수 있습니다. com.clickhouse.client.api.DataStreamWriter는 사용자 지정 데이터 쓰기 로직을 구현할 수 있도록 설계되었습니다. 예를 들어 큐에서 데이터를 읽는 로직을 구현하는 데 사용할 수 있습니다.

데이터 읽기

데이터는 기본적으로 RowBinaryWithNamesAndTypes 형식으로 읽어집니다. 현재 데이터 바인딩이 필요한 경우 이 형식만 지원됩니다.
데이터는 List<GenericRecord> com.clickhouse.client.api.Client#queryAll(java.lang.String) 메서드를 사용하여 레코드 컬렉션으로 읽을 수 있습니다. 이 메서드는 데이터를 메모리에 로드한 후 연결을 해제합니다. 추가 처리는 필요하지 않습니다. GenericRecord는 데이터에 접근할 수 있도록 하며, 일부 타입 변환 기능을 제공합니다.

Collection<GenericRecord> records = client.queryAll("SELECT * FROM table");
for (GenericRecord record : records) {
    int rowId = record.getInteger("rowID");
    String name = record.getString("name");
    LocalDateTime ts = record.getLocalDateTime("ts");
}

속성	기본값	설명
auto_discovery	`false`	클라이언트가 시스템 테이블 및/또는 clickhouse-keeper/zookeeper에서 추가 노드를 검색할지 여부입니다.
node_discovery_interval	`0`	밀리초 단위의 노드 검색 주기이며, 값이 0 이하이면 한 번만 검색합니다.
node_discovery_limit	`100`	한 번에 발견할 수 있는 최대 노드 수입니다. 값이 0 이하이면 제한이 없음을 의미합니다.

속성	기본값	설명
load_balancing_policy	`""`	로드 밸런싱 정책은 다음 중 하나일 수 있습니다: `firstAlive` - 요청이 관리 노드 목록에서 정상인 첫 번째 노드로 전송됩니다. `random` - 요청이 관리 노드 목록에서 임의의 노드로 전송됩니다. `roundRobin` - 요청이 관리 노드 목록의 각 노드로 순서대로 전송됩니다. `ClickHouseLoadBalancingPolicy`를 구현하는 완전 수식 클래스 이름(fully qualified class name) - 사용자 지정 로드 밸런싱 정책 지정하지 않으면 요청은 관리 노드 목록의 첫 번째 노드로 전송됩니다.
load_balancing_tags	`""`	노드를 필터링하기 위한 로드 밸런싱 태그입니다. 요청은 지정된 태그가 있는 노드에만 전송됩니다.
health_check_interval	`0`	밀리초 단위의 상태 검사 인터벌이며, 값이 0 이하이면 1회만 수행됩니다.
health_check_method	`ClickHouseHealthCheckMethod.SELECT_ONE`	헬스 체크 방법입니다. 다음 값 중 하나를 사용할 수 있습니다: `ClickHouseHealthCheckMethod.SELECT_ONE` - `select 1` 쿼리로 헬스 체크를 수행합니다 `ClickHouseHealthCheckMethod.PING` - 프로토콜별 헬스 체크 방식으로, 일반적으로 더 빠릅니다
node_check_interval	`0`	노드 검사 간격(밀리초)입니다. 음수 값은 0으로 처리됩니다. 마지막 검사 이후 지정된 시간이 경과했을 때 노드 상태를 확인합니다. `health_check_interval`과 `node_check_interval`의 차이는, `health_check_interval` 옵션이 노드 목록(전체 또는 장애 노드)의 상태를 확인하는 백그라운드 작업을 스케줄링하는 반면, `node_check_interval`은 특정 노드에 대해 마지막 검사 이후 상태를 다시 확인하기까지 경과해야 하는 최소 시간을 지정한다는 점입니다
check_all_nodes	`false`	모든 노드에 대해 헬스 체크를 수행할지, 아니면 장애가 발생한 노드에 대해서만 수행할지 여부입니다.

속성	기본값	설명
failover	`0`	요청에 대해 failover가 발생할 수 있는 최대 횟수입니다. 0 또는 음수 값은 failover를 수행하지 않음을 의미합니다. Failover는 장애를 복구하기 위해 실패한 요청을 다른 노드로 전송합니다(로드 밸런싱 정책에 따름).
retry	`0`	단일 요청에 대해 허용되는 재시도 최대 횟수입니다. 값이 0 또는 음수이면 재시도를 수행하지 않음을 의미합니다. 재시도는 ClickHouse 서버가 `NETWORK_ERROR` 오류 코드를 반환한 경우에만 동일한 노드로 요청을 다시 전송합니다
repeat_on_session_lock	`true`	세션이 잠긴 상태일 때 `session_timeout` 또는 `connect_timeout`에 따라 시간 초과가 발생할 때까지 실행을 반복할지 여부입니다. ClickHouse 서버가 `SESSION_IS_LOCKED` 오류 코드를 반환하면 실패한 요청을 다시 시도합니다.

설정​

초기화​

인증​

설정​

클라이언트 구성​

클라이언트 식별​

작업 식별​

서버 설정​

사용자 지정 HTTP Header​

공통 정의​

ClickHouseFormat​

Insert API​

insert(String tableName, InputStream data, ClickHouseFormat format)​

insert(String tableName, List<?> data, InsertSettings settings)​

InsertSettings​

InsertResponse​

쿼리 API​

query(String sqlQuery)​

query(String sqlQuery, Map<String, Object> queryParams, QuerySettings settings)​

queryAll(String sqlQuery)​

QuerySettings​

QueryResponse​

예시​

공통 API​

getTableSchema(String table)​

getTableSchemaFromQuery(String sql)​

TableSchema​

register(Class<?> clazz, TableSchema schema)​

사용 예시​

데이터 읽기​

배열 읽기​

마이그레이션 가이드​

구성 매개변수 대응표​

일반적인 차이점​

데이터 쓰기​

데이터 읽기​

설정​

초기화​

쿼리 API​

스트리밍 쿼리 API​

Insert API​

주요 기능​

압축​

여러 쿼리​

명명된 매개변수(Named Parameters)​

노드 검색​

로드 밸런싱​

장애 조치 및 재시도​

사용자 지정 HTTP 헤더 추가하기​