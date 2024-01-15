Логирование в DataStore

DataStore использует стандартный модуль логирования языка Python. В этом руководстве описано, как настроить логирование для отладки.

from chdb import datastore as pd from chdb.datastore.config import config # Enable debug logging config.enable_debug() # Now all operations will log details ds = pd.read_csv("data.csv") result = ds.filter(ds['age'] > 25).to_df()

Уровень Значение Описание DEBUG 10 Подробная информация для отладки INFO 20 Общая информация о работе системы WARNING 30 Предупреждения (уровень по умолчанию) ERROR 40 Сообщения об ошибках CRITICAL 50 Критические сбои

import logging from chdb.datastore.config import config # Using standard logging levels config.set_log_level(logging.DEBUG) config.set_log_level(logging.INFO) config.set_log_level(logging.WARNING) # Default config.set_log_level(logging.ERROR) # Using quick preset config.enable_debug() # Sets DEBUG level + verbose format

config.set_log_format("simple")

Вывод:

DEBUG - Executing SQL query DEBUG - Cache miss for key abc123

config.set_log_format("verbose")

Результат:

2024-01-15 10:30:45.123 DEBUG datastore.core - Executing SQL query 2024-01-15 10:30:45.456 DEBUG datastore.cache - Cache miss for key abc123

Сгенерированные SQL-запросы

Выбор исполнительного движка

Операции кэша (попадания/промахи)

Время выполнения операций

Информация об источнике данных

DEBUG - Creating DataStore from file 'data.csv' DEBUG - SQL: SELECT * FROM file('data.csv', 'CSVWithNames') WHERE age > 25 DEBUG - Using engine: chdb DEBUG - Execution time: 0.089s DEBUG - Cache: Storing result (key: abc123)

Завершение крупных операций

Изменения конфигурации

Подключения к источникам данных

INFO - Loaded 1,000,000 rows from data.csv INFO - Execution engine set to: chdb INFO - Connected to MySQL: localhost:3306/mydb

Использование устаревших функций

Предупреждения о производительности

Некритические проблемы

WARNING - Large result set (>1M rows) may cause memory issues WARNING - Cache TTL exceeded, re-executing query WARNING - Column 'date' has mixed types, using string

Ошибки при выполнении запросов

Ошибки подключения

Ошибки преобразования данных

ERROR - Failed to execute SQL: syntax error near 'FORM' ERROR - Connection to MySQL failed: timeout ERROR - Cannot convert column 'price' to float

import logging # Configure root logger logging.basicConfig( level=logging.DEBUG, format='%(asctime)s - %(name)s - %(levelname)s - %(message)s', handlers=[ logging.FileHandler('datastore.log'), logging.StreamHandler() ] ) # Get DataStore logger ds_logger = logging.getLogger('chdb.datastore') ds_logger.setLevel(logging.DEBUG)

import logging # Create file handler file_handler = logging.FileHandler('datastore_debug.log') file_handler.setLevel(logging.DEBUG) file_handler.setFormatter(logging.Formatter( '%(asctime)s - %(name)s - %(levelname)s - %(message)s' )) # Add to DataStore logger ds_logger = logging.getLogger('chdb.datastore') ds_logger.addHandler(file_handler)

import logging # Suppress all DataStore logs logging.getLogger('chdb.datastore').setLevel(logging.CRITICAL) # Or using config config.set_log_level(logging.CRITICAL)

config.enable_debug() ds = pd.read_csv("data.csv") result = ds.filter(ds['age'] > 25).groupby('city').sum()

Вывод логов:

DEBUG - Creating DataStore from file 'data.csv' DEBUG - Building filter: age > 25 DEBUG - Building groupby: city DEBUG - Building aggregation: sum DEBUG - Generated SQL: SELECT city, SUM(*) FROM file('data.csv', 'CSVWithNames') WHERE age > 25 GROUP BY city

config.enable_debug() result = ds.filter(ds['x'] > 10).apply(custom_func)

Вывод логов:

DEBUG - filter: selecting engine (eligible: chdb, pandas) DEBUG - filter: using chdb (SQL-compatible) DEBUG - apply: selecting engine (eligible: pandas) DEBUG - apply: using pandas (custom function)

config.enable_debug() # First execution result1 = ds.filter(ds['age'] > 25).to_df() # DEBUG - Cache miss for query hash abc123 # DEBUG - Executing query... # DEBUG - Caching result (key: abc123, size: 1.2MB) # Second execution (same query) result2 = ds.filter(ds['age'] > 25).to_df() # DEBUG - Cache hit for query hash abc123 # DEBUG - Returning cached result

config.enable_debug() config.enable_profiling() # Logs will show timing for each operation result = (ds .filter(ds['amount'] > 100) .groupby('region') .agg({'amount': 'sum'}) .to_df() )

Вывод логов:

DEBUG - filter: 0.002ms DEBUG - groupby: 0.001ms DEBUG - agg: 0.003ms DEBUG - SQL generation: 0.012ms DEBUG - SQL execution: 89.456ms <- Main time spent here DEBUG - Result conversion: 2.345ms

import logging from chdb.datastore.config import config # Production: minimal logging config.set_log_level(logging.WARNING) config.set_log_format("simple") config.set_profiling_enabled(False)

import logging from logging.handlers import RotatingFileHandler # Create rotating file handler handler = RotatingFileHandler( 'datastore.log', maxBytes=10*1024*1024, # 10MB backupCount=5 ) handler.setLevel(logging.WARNING) # Add to DataStore logger logging.getLogger('chdb.datastore').addHandler(handler)

Вы также можете настроить логирование с помощью переменных окружения:

# Set log level export CHDB_LOG_LEVEL=DEBUG # Set log format export CHDB_LOG_FORMAT=verbose

import os import logging # Read from environment log_level = os.environ.get('CHDB_LOG_LEVEL', 'WARNING') config.set_log_level(getattr(logging, log_level))