Настройки сеанса

Все приведённые ниже настройки также доступны в таблице system.settings. Эти настройки автоматически генерируются на основе исходного кода.

add_http_cors_header

Добавлять HTTP-заголовок CORS.

additional_result_filter

Дополнительное выражение фильтрации, применяемое к результату запроса SELECT. Эта настройка не применяется к подзапросам.

Пример

INSERT INTO table_1 VALUES (1, 'a'), (2, 'bb'), (3, 'ccc'), (4, 'dddd');
SElECT * FROM table_1;

┌─x─┬─y────┐
│ 1 │ a    │
│ 2 │ bb   │
│ 3 │ ccc  │
│ 4 │ dddd │
└───┴──────┘

SELECT *
FROM table_1
SETTINGS additional_result_filter = 'x != 2'

┌─x─┬─y────┐
│ 1 │ a    │
│ 3 │ ccc  │
│ 4 │ dddd │
└───┴──────┘

additional_table_filters

Дополнительное выражение фильтрации, применяемое после чтения данных из указанной таблицы.

Пример

INSERT INTO table_1 VALUES (1, 'a'), (2, 'bb'), (3, 'ccc'), (4, 'dddd');
SELECT * FROM table_1;

┌─x─┬─y────┐
│ 1 │ a    │
│ 2 │ bb   │
│ 3 │ ccc  │
│ 4 │ dddd │
└───┴──────┘

SELECT *
FROM table_1
SETTINGS additional_table_filters = {'table_1': 'x != 2'}

┌─x─┬─y────┐
│ 1 │ a    │
│ 3 │ ccc  │
│ 4 │ dddd │
└───┴──────┘

aggregate_functions_null_for_empty

Включает или отключает перезапись всех агрегатных функций в запросе с добавлением к ним суффикса -OrNull. Включите этот параметр для совместимости со стандартом SQL. Реализовано через перезапись запроса (аналогично настройке count_distinct_implementation), чтобы получать единообразные результаты для распределённых запросов.

Возможные значения:

0 — Отключено.
1 — Включено.

Пример

Рассмотрим следующий запрос с агрегатными функциями:

SELECT SUM(-1), MAX(0) FROM system.one WHERE 0;

При aggregate_functions_null_for_empty = 0 это даст такой результат:

┌─SUM(-1)─┬─MAX(0)─┐
│       0 │      0 │
└─────────┴────────┘

При установке aggregate_functions_null_for_empty = 1 результат будет следующим:

┌─SUMOrNull(-1)─┬─MAXOrNull(0)─┐
│          NULL │         NULL │
└───────────────┴──────────────┘

aggregation_in_order_max_block_bytes

Максимальный размер блока в байтах, накапливаемого во время агрегации по первичному ключу. Меньший размер блока позволяет в большей степени распараллелить финальный этап слияния результатов агрегации.

aggregation_memory_efficient_merge_threads

Количество потоков, используемых для слияния промежуточных результатов агрегации в режиме эффективного использования памяти. Чем больше значение, тем больше потребление памяти. 0 означает то же самое, что и max_threads.

allow_aggregate_partitions_independently

Включает независимую агрегацию партиций в отдельных потоках, когда ключ партиционирования соответствует ключу GROUP BY. Полезно, когда число партиций близко к числу ядер, а размеры партиций примерно одинаковы.

allow_archive_path_syntax

Движки File/S3 и табличная функция будут интерпретировать пути с :: как <archive>::<file>, если архив имеет допустимое расширение.

allow_asynchronous_read_from_io_pool_for_merge_tree

Использовать фоновый пул ввода-вывода для чтения из таблиц MergeTree. Этот параметр может увеличить производительность для запросов, ограниченных подсистемой ввода-вывода.

allow_changing_replica_until_first_data_packet

Если параметр включён, в хеджированных запросах можно устанавливать новое соединение до получения первого пакета данных, даже если уже был достигнут некоторый прогресс (но прогресс не обновлялся в течение тайм-аута receive_data_timeout), в противном случае смена реплики запрещается после первого зафиксированного прогресса.

allow_create_index_without_type

Разрешает выполнение запроса CREATE INDEX без указания TYPE. Такой запрос будет проигнорирован. Предназначено для тестов совместимости с SQL.

allow_custom_error_code_in_throwif

Включает возможность задания пользовательского кода ошибки в функции throwIf(). Если установлено значение true, выбрасываемые исключения могут иметь неожиданные коды ошибок.

allow_ddl

Если установлено значение true, то пользователю разрешается выполнять DDL-запросы.

allow_deprecated_database_ordinary

Разрешить создание баз данных с устаревшим движком базы данных Ordinary

allow_deprecated_error_prone_window_functions

Разрешить использование устаревших оконных функций, склонных к возникновению ошибок (neighbor, runningAccumulate, runningDifferenceStartingWithFirstValue, runningDifference)

allow_deprecated_snowflake_conversion_functions

Функции snowflakeToDateTime, snowflakeToDateTime64, dateTimeToSnowflake и dateTime64ToSnowflake помечены как устаревшие и по умолчанию отключены. Используйте вместо них функции snowflakeIDToDateTime, snowflakeIDToDateTime64, dateTimeToSnowflakeID и dateTime64ToSnowflakeID.

Чтобы повторно включить устаревшие функции (например, в переходный период), установите для этой настройки значение true.

allow_deprecated_syntax_for_merge_tree

Разрешает создавать таблицы *MergeTree с устаревшим синтаксисом определения движка таблицы

allow_distributed_ddl

Если параметр имеет значение true, пользователю разрешено выполнять распределённые DDL-запросы.

allow_drop_detached

Разрешает выполнение запросов ALTER TABLE ... DROP DETACHED PART[ITION] ...

allow_dynamic_type_in_join_keys

Разрешает использование типа Dynamic в ключах JOIN. Параметр добавлен для совместимости. Не рекомендуется использовать тип Dynamic в ключах JOIN, так как сравнение с другими типами может приводить к неожиданным результатам.

allow_execute_multiif_columnar

Разрешает выполнять функцию multiIf в колоночном режиме

allow_experimental_alias_table_engine

Experimental feature. Learn more.

Позволяет создавать таблицы с движком Alias.

allow_experimental_analyzer

Псевдонимы: enable_analyzer

Разрешает использование нового анализатора запросов.

allow_experimental_codecs

Experimental feature. Learn more.

Если установлено значение true, можно указывать экспериментальные кодеки сжатия (но таких кодеков у нас ещё нет, поэтому эта опция ничего не делает).

allow_experimental_correlated_subqueries

Beta feature. Learn more.

Разрешает выполнение коррелированных подзапросов.

allow_experimental_database_glue_catalog

Beta feature. Learn more.

Псевдонимы: allow_database_glue_catalog

Включает экспериментальный движок базы данных DataLakeCatalog с catalog_type = 'glue'

allow_experimental_database_hms_catalog

Experimental feature. Learn more.

Разрешает использование экспериментального движка базы данных DataLakeCatalog с catalog_type = 'hms'

allow_experimental_database_iceberg

Beta feature. Learn more.

Псевдонимы: allow_database_iceberg

Разрешает использование экспериментального движка базы данных DataLakeCatalog с catalog_type = 'iceberg'.

allow_experimental_database_materialized_postgresql

Experimental feature. Learn more.

Позволяет создать базу данных с движком Engine=MaterializedPostgreSQL(...).

allow_experimental_database_unity_catalog

Beta feature. Learn more.

Aliases: allow_database_unity_catalog

Разрешает использование экспериментального движка базы данных DataLakeCatalog с catalog_type = 'unity'

allow_experimental_delta_kernel_rs

Beta feature. Learn more.

Разрешает использование экспериментальной реализации delta-kernel-rs.

allow_experimental_delta_lake_writes

Experimental feature. Learn more.

Включает экспериментальную функцию записи через delta-kernel.

allow_experimental_full_text_index

Experimental feature. Learn more.

Если установлено в значение true, разрешает использование экспериментального полнотекстового индекса.

allow_experimental_funnel_functions

Experimental feature. Learn more.

Включает экспериментальные функции для анализа воронок.

allow_experimental_hash_functions

Experimental feature. Learn more.

Включает экспериментальные хеш-функции

allow_experimental_iceberg_compaction

Experimental feature. Learn more.

Позволяет явным образом использовать команду OPTIMIZE для таблиц формата Iceberg.

allow_experimental_insert_into_iceberg

Experimental feature. Learn more.

Разрешает выполнять запросы INSERT в таблицы Iceberg.

allow_experimental_join_right_table_sorting

Experimental feature. Learn more.

Если параметр установлен в значение true и выполняются условия join_to_sort_minimum_perkey_rows и join_to_sort_maximum_table_rows, правая таблица будет пересортирована по ключу для повышения производительности левого или внутреннего хеш-соединения.

allow_experimental_kafka_offsets_storage_in_keeper

Experimental feature. Learn more.

Разрешает использование экспериментальной функции хранения смещений Kafka в ClickHouse Keeper. Если параметр включён, для движка таблицы Kafka можно указать путь в ClickHouse Keeper и имя реплики. В результате вместо обычного движка Kafka будет использоваться новый тип движка хранения, в котором зафиксированные смещения хранятся преимущественно в ClickHouse Keeper.

allow_experimental_kusto_dialect

Experimental feature. Learn more.

Включает поддержку языка запросов Kusto (KQL) — альтернативы SQL.

allow_experimental_materialized_postgresql_table

Experimental feature. Learn more.

Позволяет использовать движок таблицы MaterializedPostgreSQL. По умолчанию отключён, так как эта возможность является экспериментальной.

allow_experimental_nlp_functions

Experimental feature. Learn more.

Включает экспериментальные функции для обработки естественного языка.

allow_experimental_parallel_reading_from_replicas

Beta feature. Learn more.

Псевдонимы: enable_parallel_replicas

Использовать до max_parallel_replicas реплик с каждого шарда для выполнения запроса SELECT. Чтение параллелизуется и динамически координируется. 0 — отключено, 1 — включено, при ошибке параллельное чтение тихо отключается, 2 — включено, при ошибке выбрасывается исключение.

allow_experimental_prql_dialect

Experimental feature. Learn more.

Включает поддержку PRQL — альтернативного диалекта SQL.

allow_experimental_qbit_type

Experimental feature. Learn more.

Позволяет создавать тип данных QBit.

allow_experimental_query_deduplication

Experimental feature. Learn more.

Экспериментальная дедупликация данных для запросов SELECT на основе UUID частей данных

allow_experimental_statistics

Experimental feature. Learn more.

Псевдонимы: allow_experimental_statistic

Позволяет задавать столбцы со статистикой и управлять статистикой.

allow_experimental_time_series_aggregate_functions

Experimental feature. Learn more.

Псевдонимы: allow_experimental_ts_to_grid_aggregate_function

Экспериментальные агрегатные функции семейства timeSeries* для ресемплинга временных рядов в стиле Prometheus, вычисления rate и delta.

allow_experimental_time_series_table

Experimental feature. Learn more.

Позволяет создавать таблицы с движком таблицы TimeSeries. Возможные значения:

0 — движок таблицы TimeSeries отключен.
1 — движок таблицы TimeSeries включен.

allow_experimental_time_time64_type

Experimental feature. Learn more.

Псевдонимы: enable_time_time64_type

Позволяет создавать типы данных Time и Time64.

allow_experimental_window_view

Experimental feature. Learn more.

Включает WINDOW VIEW. Функциональность пока недостаточно стабильна.

allow_experimental_ytsaurus_dictionary_source

Experimental feature. Learn more.

Экспериментальный источник словарных данных для интеграции с YTsaurus.

allow_experimental_ytsaurus_table_engine

Experimental feature. Learn more.

Экспериментальный табличный движок для интеграции с YTsaurus.

allow_experimental_ytsaurus_table_function

Experimental feature. Learn more.

Экспериментальный табличный движок для интеграции с YTsaurus.

allow_general_join_planning

Разрешает использование более общего алгоритма планирования JOIN, который может обрабатывать более сложные условия, но работает только с hash join. Если hash join не включён, то независимо от значения этой настройки используется обычный алгоритм планирования JOIN.

allow_get_client_http_header

Разрешает использовать функцию getClientHTTPHeader, которая позволяет получить значение заголовка из текущего HTTP-запроса. По соображениям безопасности по умолчанию эта функция отключена, так как некоторые заголовки, такие как Cookie, могут содержать конфиденциальную информацию. Обратите внимание, что заголовки X-ClickHouse-* и Authentication всегда недоступны и не могут быть получены с помощью этой функции.

allow_hyperscan

Разрешает функции, использующие библиотеку Hyperscan. Отключите, чтобы избежать потенциально длительной компиляции и чрезмерного потребления ресурсов.

allow_introspection_functions

Включает или отключает функции интроспекции для профилирования запросов.

Возможные значения:

1 — функции интроспекции включены.
0 — функции интроспекции отключены.

См. также

Sampling Query Profiler
Системная таблица trace_log

allow_materialized_view_with_bad_select

Разрешает выполнять CREATE MATERIALIZED VIEW с запросом SELECT, который ссылается на несуществующие таблицы или столбцы. Такой запрос должен оставаться синтаксически корректным. Не применяется к обновляемым материализованным представлениям. Не применяется, если схему материализованного представления нужно выводить из запроса SELECT (то есть если в CREATE нет списка столбцов и нет таблицы, указанной в TO). Может использоваться для создания материализованного представления до создания его исходной таблицы.

allow_named_collection_override_by_default

Разрешает по умолчанию переопределять поля именованных коллекций.

allow_non_metadata_alters

Разрешает выполнять операции ALTER, которые изменяют не только метаданные таблиц, но и данные на диске.

allow_nonconst_timezone_arguments

Разрешить неконстантные аргументы часового пояса в некоторых временных функциях, таких как toTimeZone(), fromUnixTimestamp*(), snowflakeToDateTime*(). Этот параметр существует только для обеспечения совместимости. В ClickHouse часовой пояс является свойством типа данных и, соответственно, столбца. Включение этого параметра создаёт ложное впечатление, что разные значения в одном столбце могут иметь разные часовые пояса. Поэтому не включайте этот параметр.

allow_nondeterministic_mutations

Пользовательская настройка, которая разрешает мутациям на реплицируемых таблицах использовать недетерминированные функции, такие как dictGet.

Учитывая, что, например, словари могут быть рассинхронизированы между узлами, мутации, которые получают из них значения, по умолчанию запрещены на реплицируемых таблицах. Включение этой настройки разрешает такое поведение и перекладывает на пользователя ответственность за то, чтобы используемые данные были синхронизированы на всех узлах.

Пример

<profiles>
    <default>
        <allow_nondeterministic_mutations>1</allow_nondeterministic_mutations>

        <!-- ... -->
    </default>

    <!-- ... -->

</profiles>

allow_nondeterministic_optimize_skip_unused_shards

Разрешить использование недетерминированных функций (таких как rand или dictGet; для dictGet при обновлениях есть некоторые особенности) в ключе шардинга.

Возможные значения:

0 — Запрещено.
1 — Разрешено.

allow_not_comparable_types_in_comparison_functions

Разрешает или запрещает использование несравнимых типов (например, JSON/AggregateFunction) в функциях сравнения equal/less/greater/etc.

allow_not_comparable_types_in_order_by

Позволяет или запрещает использование несравниваемых типов (например, JSON/AggregateFunction) в ключах ORDER BY.

allow_prefetched_read_pool_for_local_filesystem

Предпочитать пул потоков упреждающего чтения, если все части находятся в локальной файловой системе

allow_prefetched_read_pool_for_remote_filesystem

Предпочитать пул потоков предварительной выборки, если все части находятся в удалённой файловой системе

allow_push_predicate_ast_for_distributed_subqueries

Разрешает проталкивание предиката на уровне AST для распределённых подзапросов с включённым анализатором

allow_push_predicate_when_subquery_contains_with

Разрешает проталкивание предиката, если подзапрос содержит конструкцию WITH

allow_reorder_prewhere_conditions

Разрешить изменение порядка условий при их переносе из WHERE в PREWHERE для оптимизации фильтрации

allow_settings_after_format_in_insert

Определяет, разрешено ли использовать SETTINGS после FORMAT в запросах INSERT. Использовать эту настройку не рекомендуется, так как при этом часть SETTINGS может интерпретироваться как значения.

Пример:

INSERT INTO FUNCTION null('foo String') SETTINGS max_threads=1 VALUES ('bar');

Однако следующий запрос будет работать только при включённой настройке allow_settings_after_format_in_insert:

SET allow_settings_after_format_in_insert=1;
INSERT INTO FUNCTION null('foo String') VALUES ('bar') SETTINGS max_threads=1;

Возможные значения:

0 — Запретить.
1 — Разрешить.

Примечание

Используйте этот параметр только для обеспечения обратной совместимости, если ваши сценарии использования зависят от старого синтаксиса.

allow_simdjson

Разрешает использование библиотеки simdjson в функциях JSON*, если доступны инструкции AVX2. Если параметр отключен, будет использоваться библиотека rapidjson.

allow_special_serialization_kinds_in_output_formats

Позволяет выводить столбцы со специальными типами сериализации, такими как Sparse и Replicated, без преобразования их в полное представление столбца. Это помогает избежать лишнего копирования данных при форматировании.

allow_statistics_optimize

Experimental feature. Learn more.

Синонимы: allow_statistic_optimize

Разрешает использовать статистику при оптимизации запросов

allow_suspicious_codecs

Если установлено в значение true, позволяет указывать бессмысленные кодеки сжатия.

allow_suspicious_fixed_string_types

В операторе CREATE TABLE эта настройка позволяет создавать столбцы типа FixedString(n) с n > 256. FixedString с длиной >= 256 считается подозрительным и, скорее всего, указывает на неправильное использование типа.

allow_suspicious_indices

Отклоняет первичные/вторичные индексы и ключи сортировки с одинаковыми выражениями

allow_suspicious_low_cardinality_types

Разрешает или запрещает использование LowCardinality с типами данных фиксированного размера 8 байт или меньше: числовыми типами данных и FixedString(8_bytes_or_less).

Для небольших фиксированных значений использование LowCardinality обычно неэффективно, поскольку ClickHouse хранит числовой индекс для каждой строки. В результате:

Расход дискового пространства может увеличиться.
Потребление оперативной памяти может быть выше в зависимости от размера словаря.
Некоторые функции могут работать медленнее из-за дополнительных операций кодирования/декодирования.

Время слияний в таблицах движка MergeTree может увеличиваться по всем указанным выше причинам.

Возможные значения:

1 — использование LowCardinality не ограничено.
0 — использование LowCardinality ограничено.

allow_suspicious_primary_key

Разрешить подозрительные варианты PRIMARY KEY/ORDER BY для MergeTree (например, SimpleAggregateFunction).

allow_suspicious_ttl_expressions

Отклоняет выражения TTL, которые не зависят ни от одного из столбцов таблицы. В большинстве случаев это указывает на ошибку пользователя.

allow_suspicious_types_in_group_by

Разрешает или запрещает использование типов Variant и Dynamic в ключах GROUP BY.

allow_suspicious_types_in_order_by

Разрешает или запрещает использование типов Variant и Dynamic в ключах ORDER BY.

allow_suspicious_variant_types

В операторе CREATE TABLE можно указывать тип Variant с похожими вариантами (например, с разными числовыми или типами дат). Включение этой настройки может привести к неоднозначности при работе со значениями похожих типов.

allow_unrestricted_reads_from_keeper

Разрешает неограниченное (без ограничения по пути) чтение из таблицы system.zookeeper; может быть полезно, но небезопасно для ZooKeeper

alter_move_to_space_execute_async

Выполнять ALTER TABLE MOVE ... TO [DISK|VOLUME] в асинхронном режиме

alter_partition_verbose_result

Включает или отключает вывод информации о кусках, к которым операции с партициями и кусками были успешно применены. Применимо к ATTACH PARTITION|PART и к FREEZE PARTITION.

Возможные значения:

0 — отключить подробный вывод.
1 — включить подробный вывод.

Пример

CREATE TABLE test(a Int64, d Date, s String) ENGINE = MergeTree PARTITION BY toYYYYMDECLARE(d) ORDER BY a;
INSERT INTO test VALUES(1, '2021-01-01', '');
INSERT INTO test VALUES(1, '2021-01-01', '');
ALTER TABLE test DETACH PARTITION ID '202101';

ALTER TABLE test ATTACH PARTITION ID '202101' SETTINGS alter_partition_verbose_result = 1;

┌─command_type─────┬─partition_id─┬─part_name────┬─old_part_name─┐
│ ATTACH PARTITION │ 202101       │ 202101_7_7_0 │ 202101_5_5_0  │
│ ATTACH PARTITION │ 202101       │ 202101_8_8_0 │ 202101_6_6_0  │
└──────────────────┴──────────────┴──────────────┴───────────────┘

ALTER TABLE test FREEZE SETTINGS alter_partition_verbose_result = 1;

┌─command_type─┬─partition_id─┬─part_name────┬─backup_name─┬─backup_path───────────────────┬─part_backup_path────────────────────────────────────────────┐
│ FREEZE ALL   │ 202101       │ 202101_7_7_0 │ 8           │ /var/lib/clickhouse/shadow/8/ │ /var/lib/clickhouse/shadow/8/data/default/test/202101_7_7_0 │
│ FREEZE ALL   │ 202101       │ 202101_8_8_0 │ 8           │ /var/lib/clickhouse/shadow/8/ │ /var/lib/clickhouse/shadow/8/data/default/test/202101_8_8_0 │
└──────────────┴──────────────┴──────────────┴─────────────┴───────────────────────────────┴─────────────────────────────────────────────────────────────┘

alter_sync

Псевдонимы: replication_alter_partitions_sync

Позволяет задать ожидание выполнения действий на репликах для запросов ALTER, OPTIMIZE или TRUNCATE.

Возможные значения:

0 — Не ждать.
1 — Ждать собственного выполнения.
2 — Ждать выполнения на всех репликах.

Значение по умолчанию в Cloud: 1.

Примечание

alter_sync применим только к таблицам Replicated; он не влияет на изменения таблиц, не являющихся Replicated.

alter_update_mode

Режим выполнения запросов ALTER, содержащих команды UPDATE.

Возможные значения:

heavy — выполняет обычную мутацию.
lightweight — выполняет облегчённое обновление, если это возможно, в противном случае выполняет обычную мутацию.
lightweight_force — выполняет облегчённое обновление, если это возможно, в противном случае генерирует исключение.

analyze_index_with_space_filling_curves

Если в индексе таблицы используется кривая, заполняющая пространство, например ORDER BY mortonEncode(x, y) или ORDER BY hilbertEncode(x, y), и запрос содержит условия на её аргументы, например x >= 10 AND x <= 20 AND y >= 20 AND y <= 30, то для анализа индекса используется эта кривая, заполняющая пространство.

analyzer_compatibility_allow_compound_identifiers_in_unflatten_nested

Разрешает добавление составных идентификаторов к столбцам типа Nested. Это параметр совместимости, поскольку он изменяет результат запроса. Когда параметр отключен, запрос SELECT a.b.c FROM table ARRAY JOIN a не работает, а результат SELECT a FROM table не включает столбец a.b.c в результат для Nested a.

analyzer_compatibility_join_using_top_level_identifier

Принудительное разрешение идентификатора в JOIN USING по проекции (например, в SELECT a + 1 AS b FROM t1 JOIN t2 USING (b) соединение будет выполняться по условию t1.a + 1 = t2.b, а не t1.b = t2.b).

any_join_distinct_right_table_keys

Включает устаревшее поведение сервера ClickHouse в операциях ANY INNER|LEFT JOIN.

Примечание

Используйте этот параметр только для обратной совместимости, если ваши сценарии зависят от устаревшего поведения операций JOIN.

Когда устаревшее поведение включено:

Результаты операций t1 ANY LEFT JOIN t2 и t2 ANY RIGHT JOIN t1 не одинаковы, поскольку ClickHouse использует логику с отображением ключей таблиц слева направо «многие‑к‑одному».
Результаты операций ANY INNER JOIN содержат все строки из левой таблицы, как и операции SEMI LEFT JOIN.

Когда устаревшее поведение отключено:

Результаты операций t1 ANY LEFT JOIN t2 и t2 ANY RIGHT JOIN t1 одинаковы, поскольку ClickHouse использует логику, обеспечивающую отображение ключей «один‑ко‑многим» в операциях ANY RIGHT JOIN.
Результаты операций ANY INNER JOIN содержат по одной строке на ключ из левой и правой таблиц.

Возможные значения:

0 — устаревшее поведение отключено.
1 — устаревшее поведение включено.

См. также:

Строгость JOIN

apply_deleted_mask

Включает фильтрацию строк, удалённых с помощью легковесного удаления (lightweight DELETE). Если параметр отключён, запрос сможет читать эти строки. Это полезно для отладки и сценариев восстановления удалённых данных.

apply_mutations_on_fly

Если установлено значение true, мутации (операции UPDATE и DELETE), которые ещё не материализованы в части данных, будут применяться при выполнении запросов SELECT.

apply_patch_parts

Если установлено значение true, патч-части (легковесные обновления) применяются при выполнении запросов SELECT.

apply_patch_parts_join_cache_buckets

Количество бакетов во временном кэше при применении частей патча в режиме Join.

apply_settings_from_server

Определяет, должен ли клиент принимать настройки от сервера.

Эта настройка влияет только на операции, выполняемые на стороне клиента, в частности на разбор входных данных INSERT и форматирование результата запроса. Основная часть выполнения запроса происходит на сервере и не зависит от этой настройки.

Обычно эту настройку следует задавать в профиле пользователя (users.xml или запросы вида ALTER USER), а не через клиент (аргументы командной строки клиента, запрос SET или секция SETTINGS запроса SELECT). Через клиент её можно изменить на false, но нельзя изменить на true (потому что сервер не будет отправлять настройки, если в профиле пользователя указано apply_settings_from_server = false).

Обратите внимание, что изначально (24.12) существовала серверная настройка (send_settings_to_client), но позже она была заменена этой клиентской настройкой для повышения удобства использования.

arrow_flight_request_descriptor_type

Тип дескриптора, используемого для запросов Arrow Flight. Режим path отправляет имя набора данных как дескриптор пути. Режим command отправляет SQL‑запрос как дескриптор команды (требуется для Dremio).

Возможные значения:

path — использовать FlightDescriptor::Path (значение по умолчанию, работает с большинством серверов Arrow Flight)
command — использовать FlightDescriptor::Command с запросом SELECT (требуется для Dremio)

asterisk_include_alias_columns

Включать столбцы типа ALIAS в запросах с подстановочным символом (SELECT *).

Возможные значения:

0 — отключено
1 — включено

asterisk_include_materialized_columns

Включать столбцы MATERIALIZED для запросов с использованием подстановочного символа (SELECT *).

Возможные значения:

0 - отключено
1 - включено

async_insert

Если значение равно true, данные из запроса INSERT помещаются в очередь и позднее в фоновом режиме записываются в таблицу. Если параметр wait_for_async_insert имеет значение false, запрос INSERT обрабатывается почти мгновенно, в противном случае клиент будет ждать, пока данные не будут записаны в таблицу.

async_insert_busy_timeout_decrease_rate

Экспоненциальный коэффициент уменьшения адаптивного тайм-аута асинхронной вставки

async_insert_busy_timeout_increase_rate

Экспоненциальный коэффициент увеличения адаптивного таймаута асинхронной вставки

async_insert_busy_timeout_max_ms

Псевдонимы: async_insert_busy_timeout_ms

Максимальное время ожидания до сброса накопленных данных по запросу, отсчитываемое с момента появления первых данных.

async_insert_busy_timeout_min_ms

Если автонастройка включена параметром async_insert_use_adaptive_busy_timeout, это минимальное время ожидания перед сбросом накопленных данных для одного запроса, отсчитываемое с момента появления первых данных. Оно также служит начальным значением для адаптивного алгоритма.

async_insert_deduplicate

Для асинхронных запросов INSERT в реплицированной таблице определяет, должна ли выполняться дедупликация вставляемых блоков.

async_insert_max_data_size

Максимальный размер в байтах неразобранных данных, собираемых для одного запроса перед вставкой.

async_insert_max_query_number

Максимальное количество запросов INSERT до выполнения фактической вставки. Влияет только в том случае, если параметр async_insert_deduplicate равен 1.

async_insert_poll_timeout_ms

Таймаут для опроса очереди асинхронных вставок

async_insert_use_adaptive_busy_timeout

Если установлено в значение true, используется адаптивный таймаут занятости для асинхронных вставок

async_query_sending_for_remote

Включает асинхронное создание соединений и отправку запросов при выполнении удалённого запроса.

По умолчанию включено.

async_socket_for_remote

Включает асинхронное чтение из сокета при выполнении удалённого запроса.

По умолчанию включена.

azure_allow_parallel_part_upload

Использовать несколько потоков для многокомпонентной (multipart) загрузки в Azure.

azure_check_objects_after_upload

Проверять каждый загруженный объект в Azure Blob Storage для подтверждения успешной загрузки

azure_connect_timeout_ms

Таймаут подключения к хосту дисков Azure.

azure_create_new_file_on_insert

Включает или отключает создание нового файла при каждой вставке в таблицы движка Azure

azure_ignore_file_doesnt_exist

Игнорировать отсутствие файлов при чтении по определённым ключам.

Возможные значения:

1 — SELECT возвращает пустой результат.
0 — SELECT выбрасывает исключение.

azure_list_object_keys_size

Максимальное количество файлов, которое может быть возвращено за один запросом ListObject

azure_max_blocks_in_multipart_upload

Максимальное количество блоков при multipart-загрузке в Azure.

azure_max_get_burst

Максимальное количество запросов, которые могут быть отправлены одновременно до достижения ограничения на число запросов в секунду. По умолчанию (0) эквивалентно значению azure_max_get_rps.

azure_max_get_rps

Ограничение скорости GET-запросов к Azure (число запросов в секунду) перед применением троттлинга. Ноль означает отсутствие лимита.

azure_max_inflight_parts_for_one_file

Максимальное количество одновременно загружаемых частей файла в запросе многокомпонентной загрузки (multipart upload). 0 означает отсутствие ограничений.

azure_max_put_burst

Максимальное число запросов, которые могут быть отправлены одновременно до достижения ограничения на число запросов в секунду. По умолчанию (0) соответствует значению azure_max_put_rps.

azure_max_put_rps

Ограничение количества PUT-запросов к Azure в секунду до начала ограничения скорости (throttling). Ноль означает отсутствие ограничения.

azure_max_redirects

Максимально допустимое число переходов при перенаправлении в Azure.

azure_max_single_part_copy_size

Максимальный размер объекта, который можно скопировать с использованием одиночного копирования в хранилище Azure Blob Storage.

azure_max_single_part_upload_size

Максимальный размер объекта для загрузки одним запросом (singlepart) в Azure Blob Storage.

azure_max_single_read_retries

Максимальное количество повторных попыток при одном чтении из Azure Blob Storage.

azure_max_unexpected_write_error_retries

Максимальное количество повторных попыток при возникновении неожиданных ошибок при записи в Azure Blob Storage

azure_max_upload_part_size

Максимальный размер фрагмента при многочастичной загрузке в Azure Blob Storage.

azure_min_upload_part_size

Минимальный размер части, отправляемой при многокомпонентной загрузке в Azure Blob Storage.

azure_request_timeout_ms

Таймаут неактивности при отправке и получении данных в/из Azure. Операция завершается с ошибкой, если отдельный вызов TCP-чтения или записи блокируется дольше этого времени.

azure_sdk_max_retries

Максимальное число повторных попыток в Azure SDK

azure_sdk_retry_initial_backoff_ms

Минимальный интервал между повторными попытками в Azure SDK

azure_sdk_retry_max_backoff_ms

Максимальная задержка между повторными попытками в Azure SDK

azure_skip_empty_files

Включает или отключает пропуск пустых файлов в движке S3.

Возможные значения:

0 — SELECT выбрасывает исключение, если пустой файл несовместим с запрошенным форматом.
1 — SELECT возвращает пустой результат для пустого файла.

azure_strict_upload_part_size

Точный размер части данных, загружаемой при многокомпонентной (multipart) загрузке в объектное хранилище Azure Blob Storage.

azure_throw_on_zero_files_match

Выдавать ошибку, если не удалось сопоставить ни одного файла в соответствии с правилами раскрытия glob-шаблонов.

Возможные значения:

1 — SELECT генерирует исключение.
0 — SELECT возвращает пустой результат.

azure_truncate_on_insert

Включает или отключает усечение таблиц движка Azure перед вставкой данных.

azure_upload_part_size_multiply_factor

Умножает azure_min_upload_part_size на этот коэффициент каждый раз, когда в рамках одной операции записи в Azure Blob Storage было загружено azure_multiply_parts_count_threshold частей.

azure_upload_part_size_multiply_parts_count_threshold

Каждый раз, когда в хранилище Azure Blob загружается указанное количество частей, значение azure_min_upload_part_size умножается на azure_upload_part_size_multiply_factor.

azure_use_adaptive_timeouts

Если значение параметра установлено в true, для всех запросов к Azure первые две попытки выполняются с малыми тайм-аутами отправки и получения данных. Если значение параметра установлено в false, все попытки выполняются с одинаковыми тайм-аутами.

backup_restore_batch_size_for_keeper_multi

Максимальный размер пакета для multi-запроса к [Zoo]Keeper во время резервного копирования или восстановления

backup_restore_batch_size_for_keeper_multiread

Максимальный размер пакета операций для запроса multiread к [Zoo]Keeper во время резервного копирования или восстановления

backup_restore_failure_after_host_disconnected_for_seconds

Если хост во время операции BACKUP ON CLUSTER или RESTORE ON CLUSTER не пересоздаёт свой эфемерный узел alive в ZooKeeper в течение этого времени, то вся операция резервного копирования или восстановления считается неуспешной. Это значение должно быть больше любого разумного времени, необходимого хосту для повторного подключения к ZooKeeper после сбоя. Ноль означает отсутствие ограничения.

backup_restore_finish_timeout_after_error_sec

Как долго инициатор должен ждать, пока другие хосты отреагируют на узел error и прекратят выполнение текущей операции BACKUP ON CLUSTER или RESTORE ON CLUSTER.

backup_restore_keeper_fault_injection_probability

Приблизительная вероятность сбоя запроса к Keeper во время резервного копирования или восстановления. Допустимое значение находится в диапазоне от 0.0f до 1.0f включительно.

backup_restore_keeper_fault_injection_seed

0 — случайное начальное значение, иначе значение настройки

backup_restore_keeper_max_retries

Максимальное число повторных попыток выполнения операций [Zoo]Keeper во время выполнения операции BACKUP или RESTORE. Должно быть достаточно большим, чтобы вся операция не завершилась неудачей из-за временного сбоя [Zoo]Keeper.

backup_restore_keeper_max_retries_while_handling_error

Максимальное число повторных попыток выполнения операций [Zoo]Keeper при обработке ошибки операции BACKUP ON CLUSTER или RESTORE ON CLUSTER.

backup_restore_keeper_max_retries_while_initializing

Максимальное число повторных попыток операций [Zoo]Keeper при инициализации операции BACKUP ON CLUSTER или RESTORE ON CLUSTER.

backup_restore_keeper_retry_initial_backoff_ms

Начальный интервал ожидания перед повторной попыткой (backoff) для операций [Zoo]Keeper при создании или восстановлении резервной копии

backup_restore_keeper_retry_max_backoff_ms

Максимальный интервал ожидания при повторных попытках операций [Zoo]Keeper во время создания или восстановления резервной копии

backup_restore_keeper_value_max_size

Максимальный размер данных узла [Zoo]Keeper при резервном копировании

backup_restore_s3_retry_attempts

Параметр для Aws::Client::RetryStrategy, Aws::Client сам выполняет повторные попытки, 0 отключает повторы. Применяется только при резервном копировании и восстановлении.

backup_restore_s3_retry_initial_backoff_ms

Начальная задержка (backoff) в миллисекундах перед первой повторной попыткой во время резервного копирования и восстановления. Каждая последующая повторная попытка увеличивает задержку экспоненциально, вплоть до максимального значения, заданного параметром backup_restore_s3_retry_max_backoff_ms.

backup_restore_s3_retry_jitter_factor

Коэффициент джиттера, применяемый к задержке между повторными попытками (backoff) в Aws::Client::RetryStrategy во время операций резервного копирования и восстановления. Вычисленная задержка умножается на случайный коэффициент в диапазоне [1.0, 1.0 + jitter], но не более максимального значения backup_restore_s3_retry_max_backoff_ms. Должен находиться в интервале [0.0, 1.0].

backup_restore_s3_retry_max_backoff_ms

Максимальная задержка в миллисекундах между повторными попытками при выполнении операций резервного копирования и восстановления.

backup_slow_all_threads_after_retryable_s3_error

При значении true все потоки, выполняющие запросы к S3 к одной и той же конечной точке (endpoint) резервного копирования, замедляются после того, как любой отдельный запрос к S3 получает временную ошибку S3, допускающую повторную попытку, такую как «Slow Down». При значении false каждый поток обрабатывает задержку (backoff) для запросов к S3 независимо от остальных.

cache_warmer_threads

ClickHouse Cloud only

Параметр действует только в ClickHouse Cloud. Количество фоновых потоков для упреждающей (спекулятивной) загрузки новых частей данных в файловый кэш, когда включён cache_populated_by_fetch. Значение 0 отключает параметр.

calculate_text_stack_trace

Вычислять текстовый стек вызовов (stack trace) при возникновении исключений во время выполнения запроса. Это значение используется по умолчанию. Требует поиска символов, что может замедлить фаззинг‑тесты при выполнении большого количества некорректных запросов. В обычных случаях не следует отключать эту опцию.

cancel_http_readonly_queries_on_client_close

Отменяет HTTP-запросы только для чтения (например, SELECT), когда клиент закрывает соединение, не дожидаясь ответа.

Значение по умолчанию в облаке: 0.

cast_ipv4_ipv6_default_on_conversion_error

Оператор CAST к типу IPv4, оператор CAST к типу IPv6, а также функции toIPv4 и toIPv6 будут возвращать значение по умолчанию вместо выбрасывания исключения при ошибке преобразования.

cast_keep_nullable

Включает или отключает сохранение типа данных Nullable при операциях CAST.

Когда настройка включена и аргумент функции CAST имеет тип Nullable, результат также преобразуется в тип Nullable. Когда настройка отключена, результат всегда имеет именно целевой тип.

Возможные значения:

0 — Результат CAST имеет в точности указанный целевой тип.
1 — Если тип аргумента — Nullable, результат CAST преобразуется в Nullable(DestinationDataType).

Примеры

Следующий запрос возвращает результат именно целевого типа данных:

SET cast_keep_nullable = 0;
SELECT CAST(toNullable(toInt32(0)) AS Int32) as x, toTypeName(x);

Результат:

┌─x─┬─toTypeName(CAST(toNullable(toInt32(0)), 'Int32'))─┐
│ 0 │ Int32                                             │
└───┴───────────────────────────────────────────────────┘

Следующий запрос приводит к добавлению модификатора Nullable к целевому типу данных:

SET cast_keep_nullable = 1;
SELECT CAST(toNullable(toInt32(0)) AS Int32) as x, toTypeName(x);

Результат:

┌─x─┬─toTypeName(CAST(toNullable(toInt32(0)), 'Int32'))─┐
│ 0 │ Nullable(Int32)                                   │
└───┴───────────────────────────────────────────────────┘

См. также

Функция CAST

cast_string_to_date_time_mode

Позволяет выбрать парсер текстового представления даты и времени при приведении значения из типа String к DateTime.

Возможные значения:

'best_effort' — Включает расширенный разбор.

ClickHouse может разбирать базовый формат YYYY-MM-DD HH:MM:SS и все форматы даты и времени стандарта ISO 8601. Например, '2018-06-08T01:02:03.000Z'.
'best_effort_us' — Аналогичен best_effort (см. различия в parseDateTimeBestEffortUS)
'basic' — Использовать базовый парсер.

ClickHouse может разбирать только базовый формат YYYY-MM-DD HH:MM:SS или YYYY-MM-DD. Например, 2019-08-20 10:18:56 или 2019-08-20.

См. также:

cast_string_to_dynamic_use_inference

Использовать вывод типов при преобразовании String в Dynamic

cast_string_to_variant_use_inference

Использовать выведение типов при преобразовании из String в Variant.

check_query_single_value_result

Определяет уровень детализации результата запроса CHECK TABLE для движков семейства MergeTree.

Возможные значения:

0 — запрос показывает статус проверки для каждой части данных таблицы.
1 — запрос показывает общий статус проверки таблицы.

check_referential_table_dependencies

Проверяет, не нарушит ли DDL-запрос (например, DROP TABLE или RENAME) ссылочные зависимости

check_table_dependencies

Проверьте, что DDL-запрос (например, DROP TABLE или RENAME) не нарушит зависимости

checksum_on_read

Проверять контрольные суммы при чтении. Этот параметр включён по умолчанию и всегда должен быть включён в продуктивных средах. Не стоит ожидать какой-либо выгоды от его отключения. Его можно использовать только для экспериментов и бенчмарков. Настройка применима только к таблицам семейства MergeTree. Для других табличных движков и при получении данных по сети контрольные суммы всегда проверяются.

cloud_mode

Облачный режим

cloud_mode_database_engine

Движок базы данных, допустимый в ClickHouse Cloud. 1 — переписывать DDL‑операторы для использования реплицируемой базы данных, 2 — переписывать DDL‑операторы для использования общей базы данных.

cloud_mode_engine

Семейство движков, разрешённых в Cloud.

0 — разрешить все движки
1 — переписывать DDL так, чтобы использовать *ReplicatedMergeTree
2 — переписывать DDL так, чтобы использовать SharedMergeTree
3 — переписывать DDL так, чтобы использовать SharedMergeTree, кроме случаев, когда явно указан удалённый диск (remote disk)

Тип UInt64, чтобы минимизировать публичную часть

cluster_for_parallel_replicas

Beta feature. Learn more.

Кластер для шарда, в который входит текущий сервер

cluster_function_process_archive_on_multiple_nodes

Если имеет значение true, повышает производительность обработки архивов в кластерных функциях. Для обеспечения совместимости и во избежание ошибок при обновлении до версии 25.7+ следует установить значение false, если вы используете кластерные функции с архивами в версиях до 25.7.

cluster_table_function_buckets_batch_size

Определяет примерный размер пакета (в байтах), используемого при распределённой обработке задач в табличных функциях cluster с разбиением по bucket. Система накапливает данные, пока не будет достигнуто это минимальное значение. Фактический размер может быть немного больше для выравнивания по границам данных.

cluster_table_function_split_granularity

Определяет, как данные разбиваются на задачи при выполнении табличной функции CLUSTER.

Этот параметр задаёт уровень детализации распределения нагрузки по кластеру:

file — каждая задача обрабатывает целый файл.
bucket — задачи создаются для каждого внутреннего блока данных внутри файла (например, для групп строк (row groups) в Parquet).

Выбор более мелкой гранулярности (например, bucket) может улучшить параллелизм при работе с небольшим количеством крупных файлов. Например, если Parquet‑файл содержит несколько групп строк, включение гранулярности bucket позволяет обрабатывать каждую группу независимо разными исполнителями.

collect_hash_table_stats_during_aggregation

Включает сбор статистики о хеш-таблицах для оптимизации выделения памяти

collect_hash_table_stats_during_joins

Включает сбор статистики о хеш-таблицах для оптимизации использования памяти.

compatibility

Параметр compatibility указывает ClickHouse использовать набор настроек по умолчанию из предыдущей версии ClickHouse; сама предыдущая версия задаётся значением этого параметра.

Если какие-либо настройки заданы в значения, отличные от значений по умолчанию, то эти настройки сохраняются (параметр compatibility влияет только на параметры, которые не были изменены).

Этот параметр принимает номер версии ClickHouse в виде строки, например 22.3, 22.8. Пустое значение означает, что параметр отключён.

По умолчанию отключён.

Примечание

В ClickHouse Cloud значение параметра compatibility по умолчанию на уровне сервиса должно быть установлено службой поддержки ClickHouse Cloud. Пожалуйста, откройте обращение в службу поддержки, чтобы его установить. Однако параметр compatibility может быть переопределён на уровне пользователя, роли, профиля, запроса или сеанса с использованием стандартных механизмов настройки ClickHouse, например SET compatibility = '22.3' в сеансе или SETTINGS compatibility = '22.3' в запросе.

compatibility_ignore_auto_increment_in_create_table

Игнорировать ключевое слово AUTO_INCREMENT в объявлении столбца, если параметр имеет значение true; в противном случае возвращать ошибку. Упрощает миграцию с MySQL.

compatibility_ignore_collation_in_create_table

Совместимость: игнорировать сортировку в CREATE TABLE

compile_aggregate_expressions

Включает или отключает JIT-компиляцию агрегатных функций в нативный код. Включение этого параметра может повысить производительность.

Возможные значения:

0 — агрегация выполняется без JIT-компиляции.
1 — агрегация выполняется с использованием JIT-компиляции.

См. также

min_count_to_compile_aggregate_expression

compile_expressions

Компилирует некоторые скалярные функции и операторы в нативный код.

compile_sort_description

Компилировать описание сортировки в нативный код.

connect_timeout

Таймаут ожидания подключения при отсутствии реплик.

connect_timeout_with_failover_ms

Таймаут в миллисекундах для подключения к удалённому серверу для движка таблиц Distributed, если в определении кластера используются секции shard и replica. Если подключиться не удалось, выполняется несколько попыток подключения к различным репликам.

connect_timeout_with_failover_secure_ms

Тайм-аут ожидания подключения при выборе первой работоспособной реплики (для безопасных подключений).

connection_pool_max_wait_ms

Время ожидания подключения в миллисекундах, когда пул соединений заполнен.

Возможные значения:

Положительное целое число.
0 — бесконечное время ожидания.

connections_with_failover_max_tries

Максимальное количество попыток подключения к каждой реплике для движка таблицы Distributed.

convert_query_to_cnf

Если установлено значение true, запрос SELECT будет преобразован в конъюнктивную нормальную форму (CNF). В некоторых случаях переписывание запроса в CNF может выполняться быстрее (подробности см. в этом issue на GitHub).

Например, обратите внимание, что следующий запрос SELECT не изменяется (поведение по умолчанию):

EXPLAIN SYNTAX
SELECT *
FROM
(
    SELECT number AS x
    FROM numbers(20)
) AS a
WHERE ((x >= 1) AND (x <= 5)) OR ((x >= 10) AND (x <= 15))
SETTINGS convert_query_to_cnf = false;

Результат:

┌─explain────────────────────────────────────────────────────────┐
│ SELECT x                                                       │
│ FROM                                                           │
│ (                                                              │
│     SELECT number AS x                                         │
│     FROM numbers(20)                                           │
│     WHERE ((x >= 1) AND (x <= 5)) OR ((x >= 10) AND (x <= 15)) │
│ ) AS a                                                         │
│ WHERE ((x >= 1) AND (x <= 5)) OR ((x >= 10) AND (x <= 15))     │
│ SETTINGS convert_query_to_cnf = 0                              │
└────────────────────────────────────────────────────────────────┘

Давайте установим параметр convert_query_to_cnf в true и посмотрим, что изменится:

EXPLAIN SYNTAX
SELECT *
FROM
(
    SELECT number AS x
    FROM numbers(20)
) AS a
WHERE ((x >= 1) AND (x <= 5)) OR ((x >= 10) AND (x <= 15))
SETTINGS convert_query_to_cnf = true;

Обратите внимание, что условие WHERE переписано в КНФ, но результирующий набор данных идентичен — булева логика осталась прежней:

┌─explain───────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ SELECT x                                                                                                              │
│ FROM                                                                                                                  │
│ (                                                                                                                     │
│     SELECT number AS x                                                                                                │
│     FROM numbers(20)                                                                                                  │
│     WHERE ((x <= 15) OR (x <= 5)) AND ((x <= 15) OR (x >= 1)) AND ((x >= 10) OR (x <= 5)) AND ((x >= 10) OR (x >= 1)) │
│ ) AS a                                                                                                                │
│ WHERE ((x >= 10) OR (x >= 1)) AND ((x >= 10) OR (x <= 5)) AND ((x <= 15) OR (x >= 1)) AND ((x <= 15) OR (x <= 5))     │
│ SETTINGS convert_query_to_cnf = 1                                                                                     │
└───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

Возможные значения: true, false

correlated_subqueries_default_join_kind

Управляет типом соединений в декоррелированном плане запроса. Значение по умолчанию — right, что означает, что декоррелированный план будет содержать RIGHT JOIN с подзапросом в качестве правого источника.

Возможные значения:

left — в процессе декорреляции будут создаваться LEFT JOIN, а входная таблица будет находиться слева.
right — в процессе декорреляции будут создаваться RIGHT JOIN, а входная таблица будет находиться справа.

correlated_subqueries_substitute_equivalent_expressions

Использует фильтрующие выражения, чтобы определять эквивалентные выражения и подставлять их вместо создания операции CROSS JOIN.

count_distinct_implementation

Указывает, какая из функций uniq* должна использоваться для вычисления конструкции COUNT(DISTINCT ...).

Возможные значения:

count_distinct_optimization

Преобразует COUNT(DISTINCT ...) в подзапрос с GROUP BY

count_matches_stop_at_empty_match

Останавливает подсчёт, как только в функции countMatches происходит совпадение шаблона с пустой строкой.

create_if_not_exists

Включает IF NOT EXISTS для оператора CREATE по умолчанию. Если задана либо эта настройка, либо IF NOT EXISTS, и таблица с указанным именем уже существует, исключение не будет возбуждено.

create_index_ignore_unique

Игнорировать ключевое слово UNIQUE в CREATE UNIQUE INDEX. Предназначено для тестирования совместимости с SQL.

create_replicated_merge_tree_fault_injection_probability

Вероятность инъекции сбоя при создании таблицы после создания метаданных в ZooKeeper

create_table_empty_primary_key_by_default

Позволяет создавать таблицы MergeTree с пустым первичным ключом, если не указаны ORDER BY и PRIMARY KEY.

cross_join_min_bytes_to_compress

Минимальный размер блока, подлежащего сжатию при выполнении CROSS JOIN. Нулевое значение означает отключение этого порога. Блок сжимается, когда достигается любой из двух порогов (по числу строк или по количеству байт).

cross_join_min_rows_to_compress

Минимальное количество строк для сжатия блока при выполнении CROSS JOIN. Нулевое значение означает отключение этого порога. Блок сжимается, как только достигнут любой из двух порогов (по строкам или по байтам).

data_type_default_nullable

Задает, что типы данных без явных модификаторов NULL или NOT NULL в определении столбца будут Nullable по умолчанию.

Возможные значения:

1 — Типы данных в определениях столбцов по умолчанию задаются как Nullable.
0 — Типы данных в определениях столбцов по умолчанию задаются как не Nullable.

database_atomic_wait_for_drop_and_detach_synchronously

Добавляет модификатор SYNC для всех запросов DROP и DETACH.

Возможные значения:

0 — запросы будут выполняться с задержкой.
1 — запросы будут выполняться без задержки.

database_replicated_allow_explicit_uuid

0 — Запрещать явное указание UUID таблиц в реплицируемых базах данных. 1 — Разрешать. 2 — Разрешать, но игнорировать указанный UUID и вместо него генерировать случайный.

database_replicated_allow_heavy_create

Разрешает длительные DDL-запросы (CREATE AS SELECT и POPULATE) в движке базы данных Replicated. Учтите, что это может надолго заблокировать очередь DDL-запросов.

database_replicated_allow_only_replicated_engine

Разрешает создавать в базе данных с движком Replicated только Replicated-таблицы

database_replicated_allow_replicated_engine_arguments

0 - Не разрешать явно указывать путь в ZooKeeper и имя реплики для таблиц *MergeTree в реплицируемых базах данных. 1 - Разрешать. 2 - Разрешать, но игнорировать указанный путь и вместо этого использовать путь по умолчанию. 3 - Разрешать и не выводить предупреждение в лог.

database_replicated_always_detach_permanently

Выполнять DETACH TABLE как DETACH TABLE PERMANENTLY, если используется движок базы данных Replicated

database_replicated_enforce_synchronous_settings

Принудительно включает синхронное ожидание выполнения некоторых запросов (см. также database_atomic_wait_for_drop_and_detach_synchronously, mutations_sync, alter_sync). Не рекомендуется включать этот параметр.

database_replicated_initial_query_timeout_sec

Задает время ожидания в секундах, в течение которого начальный DDL-запрос должен ждать, пока база данных Replicated обработает предыдущие записи в очереди DDL.

Возможные значения:

Положительное целое число.
0 — без ограничений.

database_shared_drop_table_delay_seconds

Задержка в секундах перед фактическим удалением таблицы из базы данных Shared после её удаления. Это позволяет восстановить таблицу в течение этого времени с помощью запроса UNDROP TABLE.

decimal_check_overflow

Проверять переполнение при выполнении десятичных арифметических операций и операций сравнения

deduplicate_blocks_in_dependent_materialized_views

Включает или отключает проверку на дубликаты для материализованных представлений, которые получают данные из таблиц Replicated*.

Возможные значения:

0 — Отключено. 1 — Включено.

Когда параметр включен, ClickHouse выполняет дедупликацию блоков в материализованных представлениях, зависящих от таблиц Replicated*. Этот параметр полезен для обеспечения того, чтобы материализованные представления не содержали дублирующихся данных при повторной попытке операции вставки после сбоя.

См. также

Обработка NULL в операторах IN

default_materialized_view_sql_security

Позволяет задать значение по умолчанию для параметра SQL SECURITY при создании материализованного представления. Подробнее о SQL SECURITY.

Значение по умолчанию — DEFINER.

default_max_bytes_in_join

Максимальный размер правой таблицы в соединении, если требуется ограничение, но max_bytes_in_join не задан.

default_normal_view_sql_security

Позволяет устанавливать значение по умолчанию для параметра SQL SECURITY при создании обычного представления. Подробнее о SQL SECURITY.

Значение по умолчанию — INVOKER.

default_table_engine

Движок таблицы по умолчанию, используемый, если ENGINE не указан в операторе CREATE.

Возможные значения:

строка с любым допустимым именем движка таблицы

Значение по умолчанию в Cloud: SharedMergeTree.

Пример

Запрос:

SET default_table_engine = 'Log';

SELECT name, value, changed FROM system.settings WHERE name = 'default_table_engine';

Результат:

┌─name─────────────────┬─value─┬─changed─┐
│ default_table_engine │ Log   │       1 │
└──────────────────────┴───────┴─────────┘

В этом примере любая новая таблица, для которой не указан движок таблицы (Engine), будет использовать движок таблицы Log:

Запрос:

CREATE TABLE my_table (
    x UInt32,
    y UInt32
);

SHOW CREATE TABLE my_table;

Результат:

┌─statement────────────────────────────────────────────────────────────────┐
│ CREATE TABLE default.my_table
(
    `x` UInt32,
    `y` UInt32
)
ENGINE = Log
└──────────────────────────────────────────────────────────────────────────┘

default_temporary_table_engine

То же, что и default_table_engine, но для временных таблиц.

В этом примере любая новая временная таблица, для которой не указан параметр Engine, будет использовать движок таблицы Log:

Запрос:

SET default_temporary_table_engine = 'Log';

CREATE TEMPORARY TABLE my_table (
    x UInt32,
    y UInt32
);

SHOW CREATE TEMPORARY TABLE my_table;

Результат:

┌─statement────────────────────────────────────────────────────────────────┐
│ CREATE TEMPORARY TABLE default.my_table
(
    `x` UInt32,
    `y` UInt32
)
ENGINE = Log
└──────────────────────────────────────────────────────────────────────────┘

default_view_definer

Позволяет установить значение по умолчанию для параметра DEFINER при создании представления. Подробнее о безопасности SQL.

Значение по умолчанию — CURRENT_USER.

delta_lake_enable_engine_predicate

Включает внутреннюю фильтрацию данных в delta-kernel.

delta_lake_enable_expression_visitor_logging

Включает логирование уровня Test для визитора выражений DeltaLake. Такое логирование может быть слишком подробным даже для тестовых целей.

delta_lake_insert_max_bytes_in_data_file

Определяет ограничение в байтах на размер одного вставляемого файла данных в Delta Lake.

delta_lake_insert_max_rows_in_data_file

Задаёт максимальное количество строк в одном файле данных при вставке в Delta Lake.

delta_lake_log_metadata

Включает логирование файлов метаданных Delta Lake в системную таблицу.

delta_lake_snapshot_version

Версия снимка Delta Lake, который следует читать. Значение -1 означает чтение последней версии (значение 0 — допустимая версия снимка).

delta_lake_throw_on_engine_predicate_error

Включает выбрасывание исключения, если при анализе предиката сканирования в delta-kernel произошла ошибка.

describe_compact_output

Если включено, в результат запроса DESCRIBE включаются только имена столбцов и их типы

describe_include_subcolumns

Включает вывод подстолбцов в запросе DESCRIBE. Например, элементов типа Tuple или подстолбцов типов Map, Nullable или Array.

Возможные значения:

0 — Подстолбцы не включаются в результаты запросов DESCRIBE.
1 — Подстолбцы включаются в результаты запросов DESCRIBE.

Пример

См. пример для оператора DESCRIBE.

describe_include_virtual_columns

Если параметр включён, виртуальные столбцы таблицы будут включены в результат запроса DESCRIBE.

dialect

Диалект, который будет использоваться для разбора запроса

dictionary_validate_primary_key_type

Проверяет тип первичного ключа для словарей. По умолчанию тип id для простых макетов неявно приводится к UInt64.

distinct_overflow_mode

Определяет, что происходит, когда объём данных превышает один из лимитов.

Возможные значения:

throw: вызывает исключение (по умолчанию).
break: останавливает выполнение запроса и возвращает частичный результат, как если бы исходные данные исчерпались.

distributed_aggregation_memory_efficient

Включен режим экономичного использования памяти для распределённой агрегации.

distributed_background_insert_batch

Псевдонимы: distributed_directory_monitor_batch_inserts

Включает или отключает отправку вставляемых данных пакетами.

Когда пакетная отправка включена, движок таблицы Distributed пытается отправлять несколько файлов с вставленными данными в одной операции, а не по отдельности. Пакетная отправка повышает производительность кластера за счёт более эффективного использования ресурсов сервера и сети.

Возможные значения:

1 — Включено.
0 — Отключено.

distributed_background_insert_max_sleep_time_ms

Псевдонимы: distributed_directory_monitor_max_sleep_time_ms

Максимальный интервал отправки данных движком таблицы Distributed. Ограничивает экспоненциальный рост интервала, заданного настройкой distributed_background_insert_sleep_time_ms.

Возможные значения:

Положительное целое число миллисекунд.

distributed_background_insert_sleep_time_ms

Псевдонимы: distributed_directory_monitor_sleep_time_ms

Базовый интервал, с которым движок таблиц Distributed отправляет данные. При ошибках фактический интервал увеличивается экспоненциально.

Возможные значения:

Положительное целое количество миллисекунд.

distributed_background_insert_split_batch_on_failure

Псевдонимы: distributed_directory_monitor_split_batch_on_failure

Включает/отключает разбиение пакетов при сбоях.

Иногда отправка конкретного пакета на удалённый шард может завершиться неудачей из‑за сложного последующего конвейера обработки (например, MATERIALIZED VIEW с GROUP BY) по причине ошибок вроде Memory limit exceeded или аналогичных. В этом случае повторная попытка не поможет (что приведёт к блокировке распределённых отправок для таблицы), но отправка файлов из этого пакета по одному может завершиться успешным выполнением INSERT.

Значение 1 для этого параметра отключит пакетную вставку для таких пакетов (то есть временно отключит distributed_background_insert_batch для неудачных пакетов).

Возможные значения:

1 — Включено.
0 — Отключено.

Примечание

Этот параметр также влияет на повреждённые пакеты (которые могут возникать из‑за ненормального завершения работы сервера (машины) и отсутствия fsync_after_insert/fsync_directories для движка таблиц Distributed).

Примечание

Не следует полагаться на автоматическое разбиение пакетов, так как это может ухудшить производительность.

distributed_background_insert_timeout

Псевдонимы: insert_distributed_timeout

Тайм-аут для запроса INSERT в таблицу типа Distributed. Настройка действует только при включённом параметре insert_distributed_sync. Нулевое значение означает отсутствие тайм-аута.

distributed_cache_alignment

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Параметр предназначен для тестирования, не изменяйте его.

distributed_cache_bypass_connection_pool

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Позволяет обойти пул соединений распределённого кэша.

distributed_cache_connect_backoff_max_ms

ClickHouse Cloud only

Применяется только в ClickHouse Cloud. Максимальное значение задержки (backoff, в миллисекундах) при создании соединения с распределённым кэшем.

distributed_cache_connect_backoff_min_ms

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Минимальная задержка (в миллисекундах) перед созданием соединения распределённого кэша.

distributed_cache_connect_max_tries

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Количество попыток подключения к распределённому кэшу при неудачном подключении.

distributed_cache_connect_timeout_ms

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Таймаут подключения к серверу распределённого кэша.

distributed_cache_credentials_refresh_period_seconds

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Период обновления учетных данных.

distributed_cache_data_packet_ack_window

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Окно для отправки ACK для последовательности DataPacket в рамках одного запроса на чтение из распределённого кэша.

distributed_cache_discard_connection_if_unread_data

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Разрывает соединение, если какие‑то данные остаются непрочитанными.

distributed_cache_fetch_metrics_only_from_current_az

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Получать метрики в таблицах system.distributed_cache_metrics и system.distributed_cache_events только из текущей зоны доступности.

distributed_cache_log_mode

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Режим записи в таблицу system.distributed_cache_log.

distributed_cache_max_unacked_inflight_packets

ClickHouse Cloud only

Применяется только в ClickHouse Cloud. Максимальное число неподтверждённых пакетов, находящихся «в полёте», в одном запросе чтения из распределённого кэша.

distributed_cache_min_bytes_for_seek

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Минимальный объём данных (в байтах) для выполнения операции seek в распределённом кэше.

distributed_cache_pool_behaviour_on_limit

ClickHouse Cloud only

Применяется только в ClickHouse Cloud. Определяет поведение подключения к распределённому кэшу при достижении лимита пула.

distributed_cache_prefer_bigger_buffer_size

ClickHouse Cloud only

Применяется только в ClickHouse Cloud. Аналогична filesystem_cache_prefer_bigger_buffer_size, но для распределённого кэша.

distributed_cache_read_only_from_current_az

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Позволяет читать данные только из текущей зоны доступности. Если параметр отключён, чтение будет выполняться со всех серверов кэша во всех зонах доступности.

distributed_cache_read_request_max_tries

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Количество попыток повторного выполнения запроса к распределённому кэшу при неудаче.

distributed_cache_receive_response_wait_milliseconds

ClickHouse Cloud only

Применяется только в ClickHouse Cloud. Время ожидания в миллисекундах для получения данных по запросу из распределённого кэша

distributed_cache_receive_timeout_milliseconds

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Время ожидания в миллисекундах для получения любого ответа от распределённого кэша.

distributed_cache_receive_timeout_ms

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Таймаут ожидания данных от сервера распределённого кэша, в миллисекундах. Если в течение этого интервала не было получено ни одного байта, будет сгенерировано исключение.

distributed_cache_send_timeout_ms

ClickHouse Cloud only

Применяется только в ClickHouse Cloud. Таймаут отправки данных на сервер распределённого кеша, в миллисекундах. Если клиенту требуется отправить данные, но он не может передать ни одного байта в течение этого интервала, выбрасывается исключение.

distributed_cache_tcp_keep_alive_timeout_ms

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Время в миллисекундах, в течение которого соединение с сервером распределённого кэша должно бездействовать, прежде чем TCP начнёт отправлять keepalive-пакеты.

distributed_cache_throw_on_error

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Повторно выбрасывает исключение, возникшее при взаимодействии с распределённым кэшем, или исключение, полученное от распределённого кэша. В противном случае происходит переход к пропуску распределённого кэша при ошибке.

distributed_cache_wait_connection_from_pool_milliseconds

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Время ожидания в миллисекундах получения соединения из пула соединений, если для distributed_cache_pool_behaviour_on_limit задано значение wait.

distributed_connections_pool_size

Максимальное количество одновременных подключений к удалённым серверам для распределённой обработки всех запросов к одной таблице типа Distributed. Рекомендуется указывать значение не меньше, чем количество серверов в кластере.

distributed_ddl_entry_format_version

Версия формата для совместимости распределённых DDL‑запросов (ON CLUSTER)

distributed_ddl_output_mode

Задает формат результата распределенного DDL-запроса.

Возможные значения:

throw — Возвращает результирующий набор со статусом выполнения запроса для всех хостов, где запрос завершен. Если запрос завершился с ошибкой на некоторых хостах, то повторно генерируется первое исключение. Если запрос еще не завершен на некоторых хостах и время distributed_ddl_task_timeout превышено, то генерируется исключение TIMEOUT_EXCEEDED.
none — Аналогично throw, но распределенный DDL-запрос не возвращает результирующий набор.
null_status_on_timeout — Возвращает NULL в качестве статуса выполнения в некоторых строках результирующего набора вместо генерации TIMEOUT_EXCEEDED, если запрос не завершен на соответствующих хостах.
never_throw — Не генерирует TIMEOUT_EXCEEDED и не пробрасывает исключения повторно, даже если запрос завершился с ошибкой на некоторых хостах.
none_only_active — Аналогично none, но не дожидается неактивных реплик базы данных Replicated. Примечание: в этом режиме невозможно определить, что запрос не был выполнен на какой‑либо реплике и будет выполнен в фоновом режиме.
null_status_on_timeout_only_active — Аналогично null_status_on_timeout, но не дожидается неактивных реплик базы данных Replicated.
throw_only_active — Аналогично throw, но не дожидается неактивных реплик базы данных Replicated.

Значение по умолчанию в ClickHouse Cloud: throw.

distributed_ddl_task_timeout

Устанавливает таймаут ожидания ответов на DDL‑запросы от всех хостов в кластере. Если DDL‑запрос не был выполнен на всех хостах, в ответе будет ошибка таймаута, и дальнейшее выполнение запроса продолжится в асинхронном режиме. Отрицательное значение означает бесконечное ожидание.

Возможные значения:

Положительное целое число.
0 — асинхронный режим.
Отрицательное целое число — бесконечный таймаут.

distributed_foreground_insert

Псевдонимы: insert_distributed_sync

Включает или отключает синхронную вставку данных в таблицу Distributed.

По умолчанию при вставке данных в таблицу Distributed сервер ClickHouse отправляет данные на узлы кластера в фоновом режиме. Если distributed_foreground_insert=1, данные обрабатываются синхронно, и операция INSERT считается успешной только после того, как все данные будут сохранены на всех шардах (как минимум на одной реплике для каждого шарда, если internal_replication равно true).

Возможные значения:

0 — данные вставляются в фоновом режиме.
1 — данные вставляются в синхронном режиме.

Значение по умолчанию в ClickHouse Cloud: 0.

См. также

distributed_group_by_no_merge

Не объединять состояния агрегации с разных серверов при распределённой обработке запроса. Можно использовать в случае, когда точно известно, что на разных шардах разные ключи.

Возможные значения:

0 — Отключено (окончательная обработка запроса выполняется на инициирующем узле).
1 — Не объединять состояния агрегации с разных серверов при распределённой обработке запроса (запрос полностью обрабатывается на шарде, инициатор только проксирует данные). Может использоваться, когда точно известно, что на разных шардах разные ключи.
2 — То же, что и 1, но на инициаторе дополнительно применяются ORDER BY и LIMIT (что невозможно, когда запрос полностью обрабатывается на удалённом узле, как при distributed_group_by_no_merge=1). Может использоваться для запросов с ORDER BY и/или LIMIT.

Пример

SELECT *
FROM remote('127.0.0.{2,3}', system.one)
GROUP BY dummy
LIMIT 1
SETTINGS distributed_group_by_no_merge = 1
FORMAT PrettyCompactMonoBlock

┌─dummy─┐
│     0 │
│     0 │
└───────┘

SELECT *
FROM remote('127.0.0.{2,3}', system.one)
GROUP BY dummy
LIMIT 1
SETTINGS distributed_group_by_no_merge = 2
FORMAT PrettyCompactMonoBlock

┌─dummy─┐
│     0 │
└───────┘

distributed_insert_skip_read_only_replicas

Позволяет пропускать реплики только для чтения при выполнении запросов INSERT в таблицы с движком Distributed.

Возможные значения:

0 — INSERT выполняется как обычно; если запрос направляется на реплику только для чтения, он завершится с ошибкой
1 — Инициатор будет пропускать реплики только для чтения при отправке данных на шарды.

distributed_plan_default_reader_bucket_count

Experimental feature. Learn more.

Количество задач по умолчанию для параллельного чтения в распределённом запросе. Задачи распределяются по репликам.

distributed_plan_default_shuffle_join_bucket_count

Experimental feature. Learn more.

Количество бакетов по умолчанию для распределённого shuffle-hash-join.

distributed_plan_execute_locally

Experimental feature. Learn more.

Выполняет все задачи распределённого плана запроса локально. Полезно для тестирования и отладки.

distributed_plan_force_exchange_kind

Experimental feature. Learn more.

Принудительно задаёт указанный тип операторов Exchange между стадиями распределённого запроса.

Возможные значения:

'' — не принуждать использование какого-либо типа операторов Exchange, предоставить выбор оптимизатору,
'Persisted' — использовать временные файлы в объектном хранилище,
'Streaming' — передавать данные обмена по сети в потоковом режиме.

distributed_plan_force_shuffle_aggregation

Experimental feature. Learn more.

Использует стратегию Shuffle-агрегации вместо PartialAggregation + Merge в распределённом плане запроса.

distributed_plan_max_rows_to_broadcast

Experimental feature. Learn more.

Максимальное число строк, при котором в распределённом плане запроса используется broadcast join вместо shuffle join.

distributed_plan_optimize_exchanges

Удаляет лишние обмены в распределённом плане запроса. Отключайте для отладки.

distributed_product_mode

Изменяет поведение распределённых подзапросов.

ClickHouse применяет этот параметр, когда запрос содержит декартово произведение распределённых таблиц, то есть когда запрос к распределённой таблице содержит подзапрос к распределённой таблице без ключевого слова GLOBAL.

Ограничения:

Применяется только для подзапросов IN и JOIN.
Только если в секции FROM используется распределённая таблица, содержащая более одного шарда.
Только если подзапрос относится к распределённой таблице, содержащей более одного шарда.
Не используется для табличной функции remote.

Возможные значения:

deny — значение по умолчанию. Запрещает использование таких типов подзапросов (выбрасывается исключение Double-distributed IN/JOIN subqueries is denied).
local — заменяет базу данных и таблицу в подзапросе на локальные для целевого сервера (шарда), при этом обычные IN/JOIN сохраняются без изменений.
global — заменяет запрос IN/JOIN на GLOBAL IN/GLOBAL JOIN.
allow — разрешает использование таких типов подзапросов.

distributed_push_down_limit

Включает или отключает применение LIMIT отдельно на каждом шарде.

Это позволяет избежать:

Отправки лишних строк по сети;
Обработки строк сверх лимита на сервере-инициаторе.

Начиная с версии 21.9, получить неточные результаты больше невозможно, так как distributed_push_down_limit изменяет выполнение запроса только если выполняется как минимум одно из условий:

distributed_group_by_no_merge > 0.
В запросе нет GROUP BY/DISTINCT/LIMIT BY, но есть ORDER BY/LIMIT.
В запросе есть GROUP BY/DISTINCT/LIMIT BY с ORDER BY/LIMIT, и при этом:
- optimize_skip_unused_shards включен.
- optimize_distributed_group_by_sharding_key включен.

Возможные значения:

0 — Отключено.
1 — Включено.

См. также:

distributed_group_by_no_merge
optimize_skip_unused_shards
optimize_distributed_group_by_sharding_key

distributed_replica_error_cap

Тип: беззнаковое целое число
Значение по умолчанию: 1000

Счетчик ошибок каждой реплики ограничивается этим значением, что предотвращает накопление одной репликой слишком большого количества ошибок.

См. также:

load_balancing
Движок таблиц Distributed
distributed_replica_error_half_life
distributed_replica_max_ignored_errors

distributed_replica_error_half_life

Тип: секунды
Значение по умолчанию: 60 секунд

Определяет, с какой скоростью обнуляются ошибки в распределённых таблицах. Если реплика была недоступна некоторое время, накопила 5 ошибок, а параметр distributed_replica_error_half_life равен 1 секунде, то реплика считается нормальной через 3 секунды после последней ошибки.

См. также:

load_balancing
Движок таблиц Distributed
distributed_replica_error_cap
distributed_replica_max_ignored_errors

distributed_replica_max_ignored_errors

Тип: беззнаковое целое число
Значение по умолчанию: 0

Количество ошибок, которые будут игнорироваться при выборе реплик (в соответствии с алгоритмом load_balancing).

См. также:

load_balancing
Движок таблиц Distributed
distributed_replica_error_cap
distributed_replica_error_half_life

do_not_merge_across_partitions_select_final

Объединять части только в пределах одного раздела при выполнении SELECT FINAL

empty_result_for_aggregation_by_constant_keys_on_empty_set

Возвращать пустой результат при агрегации по константным ключам для пустого набора данных.

empty_result_for_aggregation_by_empty_set

Возвращать пустой результат при агрегации без ключей над пустым набором данных.

enable_adaptive_memory_spill_scheduler

Experimental feature. Learn more.

Запускает обработчик, который адаптивно выгружает данные из памяти во внешнее хранилище. В настоящее время поддерживаются соединения типа grace join.

enable_add_distinct_to_in_subqueries

Включает использование DISTINCT в подзапросах IN. Это настройка-компромисс: её включение может значительно уменьшить размер временных таблиц, передаваемых для распределённых подзапросов IN, и существенно ускорить передачу данных между шардами за счёт отправки только уникальных значений. Однако включение этой настройки добавляет дополнительные накладные расходы на слияние на каждом узле, так как необходимо выполнять дедупликацию (DISTINCT). Используйте эту настройку, когда узким местом является передача данных по сети и дополнительные накладные расходы на слияние приемлемы.

enable_blob_storage_log

Записывать информацию об операциях блоб-хранилища в таблицу system.blob_storage_log

enable_deflate_qpl_codec

При включении кодек DEFLATE_QPL может использоваться для сжатия столбцов.

enable_early_constant_folding

Включает оптимизацию запросов, при которой анализируются результаты функций и подзапросов и запрос переписывается, если в них присутствуют константы

enable_extended_results_for_datetime_functions

Включает или отключает возврат результатов типа Date32 с расширенным диапазоном значений (по сравнению с типом Date) или DateTime64 с расширенным диапазоном значений (по сравнению с типом DateTime).

Возможные значения:

0 — Функции возвращают Date или DateTime для всех типов аргументов.
1 — Функции возвращают Date32 или DateTime64 для аргументов типа Date32 или DateTime64 и Date или DateTime в остальных случаях.

В таблице ниже показано поведение этой настройки для различных функций работы с датой и временем.

Функция	`enable_extended_results_for_datetime_functions = 0`	`enable_extended_results_for_datetime_functions = 1`
`toStartOfYear`	Возвращает `Date` или `DateTime`	Возвращает `Date`/`DateTime` для аргумента типа `Date`/`DateTime` Возвращает `Date32`/`DateTime64` для аргумента типа `Date32`/`DateTime64`
`toStartOfISOYear`	Возвращает значение типа `Date` или `DateTime`	Возвращает `Date`/`DateTime` для аргументов типа `Date`/`DateTime` Возвращает `Date32`/`DateTime64` для аргументов типа `Date32`/`DateTime64`
`toStartOfQuarter`	Возвращает `Date` или `DateTime`	Возвращает `Date`/`DateTime` для аргументов типа `Date`/`DateTime` Возвращает `Date32`/`DateTime64` для аргументов типа `Date32`/`DateTime64`
`toStartOfMonth`	Возвращает `Date` или `DateTime`	Возвращает `Date`/`DateTime` для аргумента типа `Date`/`DateTime` Возвращает `Date32`/`DateTime64` для аргумента типа `Date32`/`DateTime64`
`toStartOfWeek`	Возвращает `Date` или `DateTime`.	Возвращает `Date`/`DateTime` для входных значений `Date`/`DateTime` Возвращает `Date32`/`DateTime64` для входных значений `Date32`/`DateTime64`
`toLastDayOfWeek`	Возвращает `Date` или `DateTime`	Возвращает `Date`/`DateTime` для аргументов типа `Date`/`DateTime` Возвращает `Date32`/`DateTime64` для аргументов типа `Date32`/`DateTime64`
`toLastDayOfMonth`	Возвращает значение типа `Date` или `DateTime`	Возвращает `Date`/`DateTime` для аргумента типа `Date`/`DateTime` Возвращает `Date32`/`DateTime64` для аргумента типа `Date32`/`DateTime64`
`toMonday`	Возвращает значение типа `Date` или `DateTime`	Возвращает `Date`/`DateTime` для входных аргументов `Date`/`DateTime` Возвращает `Date32`/`DateTime64` для входных аргументов `Date32`/`DateTime64`
`toStartOfDay`	Возвращает `DateTime` Примечание: возможны некорректные результаты для значений вне диапазона 1970–2149	Возвращает `DateTime` для аргумента типа `Date`/`DateTime` Возвращает `DateTime64` для аргумента типа `Date32`/`DateTime64`
`toStartOfHour`	Возвращает `DateTime` Примечание: может возвращать некорректные результаты для значений вне диапазона 1970–2149 годов	Возвращает `DateTime` для аргументов типа `Date`/`DateTime` Возвращает `DateTime64` для аргументов типа `Date32`/`DateTime64`
`toStartOfFifteenMinutes`	Возвращает `DateTime` Примечание: возможны некорректные результаты для значений вне диапазона 1970–2149	Возвращает `DateTime` для аргументов типа `Date`/`DateTime` Возвращает `DateTime64` для аргументов типа `Date32`/`DateTime64`
`toStartOfTenMinutes`	Возвращает значение типа `DateTime` Примечание: результаты могут быть неверными для значений вне диапазона 1970–2149 годов	Возвращает `DateTime` для аргументов типов `Date`/`DateTime` Возвращает `DateTime64` для аргументов типов `Date32`/`DateTime64`
`toStartOfFiveMinutes`	Возвращает `DateTime` Примечание: Некорректные результаты для значений за пределами диапазона 1970–2149 годов	Возвращает `DateTime` для аргументов типа `Date`/`DateTime` Возвращает `DateTime64` для аргументов типа `Date32`/`DateTime64`
`toStartOfMinute`	Возвращает `DateTime` Примечание: возможны некорректные результаты для значений вне диапазона 1970–2149	Возвращает `DateTime` для аргументов типа `Date`/`DateTime` Возвращает `DateTime64` для аргументов типа `Date32`/`DateTime64`
`timeSlot`	Возвращает `DateTime` Примечание: может возвращать неверные результаты для значений вне диапазона 1970–2149	Возвращает `DateTime` для аргументов типа `Date`/`DateTime` Возвращает `DateTime64` для аргументов типа `Date32`/`DateTime64`

enable_filesystem_cache

Использовать кэш для удалённой файловой системы. Эта настройка не включает и не отключает кэш для дисков (это необходимо делать через конфигурацию диска), но позволяет при необходимости обходить кэш для отдельных запросов.

enable_filesystem_cache_log

Включает ведение журнала кэширования файловой системы для каждого запроса

enable_filesystem_cache_on_write_operations

Включает или отключает кэш write-through. Если установлено значение false, кэш write-through отключен для операций записи. Если установлено значение true, кэш write-through включён при условии, что параметр cache_on_write_operations включён в разделе конфигурации диска кэша в конфигурации сервера. См. раздел «Использование локального кэша» для получения дополнительной информации.

enable_filesystem_read_prefetches_log

Ведёт журнал в system.filesystem prefetch_log во время выполнения запроса. Должен использоваться только для тестирования или отладки, не рекомендуется включать по умолчанию.

enable_global_with_statement

Распространяет выражения WITH на запросы UNION и все подзапросы

enable_hdfs_pread

Включает или отключает pread для файлов HDFS. По умолчанию используется hdfsPread. Если параметр отключен, для чтения файлов HDFS будут использоваться функции hdfsRead и hdfsSeek.

enable_http_compression

Включает или отключает сжатие данных в ответе на HTTP‑запрос.

Дополнительную информацию см. в описании HTTP-интерфейса.

Возможные значения:

0 — Отключено.
1 — Включено.

enable_job_stack_trace

Выводит трассировку стека создателя задания, если задание приводит к исключению. По умолчанию отключена, чтобы избежать накладных расходов по производительности.

enable_join_runtime_filters

Experimental feature. Learn more.

Фильтрует левую таблицу по набору ключей JOIN, собранных из правой таблицы во время выполнения.

enable_lazy_columns_replication

Включает ленивую репликацию столбцов в JOIN и ARRAY JOIN, что позволяет избежать многократного копирования одних и тех же строк в памяти.

enable_lightweight_delete

Псевдонимы: allow_experimental_lightweight_delete

Включает легковесные мутации DELETE для таблиц MergeTree.

enable_lightweight_update

Beta feature. Learn more.

Псевдонимы: allow_experimental_lightweight_update

Разрешает использование облегчённых обновлений.

enable_memory_bound_merging_of_aggregation_results

Включает стратегию слияния результатов агрегации, ограниченную объёмом памяти.

enable_multiple_prewhere_read_steps

Перемещает больше условий из WHERE в PREWHERE и выполняет чтение с диска и фильтрацию в несколько этапов, если есть несколько условий, объединённых оператором AND

enable_named_columns_in_function_tuple

Генерирует именованные кортежи в функции tuple(), если все имена уникальны и могут рассматриваться как идентификаторы без кавычек.

enable_optimize_predicate_expression

Включает проталкивание предикатов (predicate pushdown) в запросах SELECT.

Проталкивание предикатов может значительно сократить сетевой трафик для распределённых запросов.

Возможные значения:

0 — Выключено.
1 — Включено.

Использование

Рассмотрим следующие запросы:

SELECT count() FROM test_table WHERE date = '2018-10-10'
SELECT count() FROM (SELECT * FROM test_table) WHERE date = '2018-10-10'

Если enable_optimize_predicate_expression = 1, то время выполнения этих запросов одинаково, потому что ClickHouse применяет WHERE к подзапросу при его выполнении.

Если enable_optimize_predicate_expression = 0, то время выполнения второго запроса значительно больше, потому что выражение WHERE применяется ко всем данным только после завершения подзапроса.

enable_optimize_predicate_expression_to_final_subquery

Разрешает проталкивание предиката в подзапрос с FINAL.

enable_order_by_all

Включает или отключает сортировку с использованием синтаксиса ORDER BY ALL, см. ORDER BY.

Возможные значения:

0 — Отключить ORDER BY ALL.
1 — Включить ORDER BY ALL.

Пример

Запрос:

CREATE TABLE TAB(C1 Int, C2 Int, ALL Int) ENGINE=Memory();

INSERT INTO TAB VALUES (10, 20, 30), (20, 20, 10), (30, 10, 20);

SELECT * FROM TAB ORDER BY ALL; -- возвращает ошибку, что ALL неоднозначно

SELECT * FROM TAB ORDER BY ALL SETTINGS enable_order_by_all = 0;

Результат:

┌─C1─┬─C2─┬─ALL─┐
│ 20 │ 20 │  10 │
│ 30 │ 10 │  20 │
│ 10 │ 20 │  30 │
└────┴────┴─────┘

enable_parallel_blocks_marshalling

Влияет только на распределённые запросы. Если настройка включена, блоки будут (де)сериализоваться и (де)сжиматься в потоках конвейера (то есть с более высокой степенью параллелизма, чем используется по умолчанию) до отправки инициатору и после неё.

enable_parsing_to_custom_serialization

Если параметр включён, данные могут парситься напрямую в столбцы с пользовательской сериализацией (например, Sparse) в соответствии с подсказками по сериализации, полученными из таблицы.

enable_positional_arguments

Включает или отключает поддержку позиционных аргументов для операторов GROUP BY, LIMIT BY, ORDER BY.

Возможные значения:

0 — позиционные аргументы не поддерживаются.
1 — позиционные аргументы поддерживаются: вместо имён столбцов можно использовать номера столбцов.

Пример

Запрос:

CREATE TABLE positional_arguments(one Int, two Int, three Int) ENGINE=Memory();

INSERT INTO positional_arguments VALUES (10, 20, 30), (20, 20, 10), (30, 10, 20);

SELECT * FROM positional_arguments ORDER BY 2,3;

Результат:

┌─one─┬─two─┬─three─┐
│  30 │  10 │   20  │
│  20 │  20 │   10  │
│  10 │  20 │   30  │
└─────┴─────┴───────┘

enable_producing_buckets_out_of_order_in_aggregation

Позволяет память-эффективной агрегации (см. distributed_aggregation_memory_efficient) выдавать бакеты в непоследовательном порядке. Это может улучшить производительность, когда размеры бакетов агрегации сильно неравномерны, позволяя реплике отправлять инициатору бакеты с более высокими ID, пока он всё ещё обрабатывает тяжёлые бакеты с более низкими ID. Недостатком является потенциально большее потребление памяти.

enable_reads_from_query_cache

Если настройка включена, результаты запросов SELECT извлекаются из кэша запросов.

Возможные значения:

0 — отключено
1 — включено

enable_s3_requests_logging

Включает очень подробное логирование запросов к S3. Имеет смысл использовать только для отладки.

enable_scalar_subquery_optimization

Если установлено в значение true, предотвращает (де)сериализацию больших скалярных значений в скалярных подзапросах и, возможно, позволяет избежать повторного выполнения одного и того же подзапроса.

enable_scopes_for_with_statement

Если параметр отключен, объявления в родительских предложениях WITH будут вести себя так же, как если бы они были объявлены в текущей области видимости.

Обратите внимание, что это параметр совместимости для нового анализатора, позволяющий выполнять некоторые некорректные запросы, которые мог выполнять старый анализатор.

enable_shared_storage_snapshot_in_query

Если параметр включён, все подзапросы внутри одного запроса будут использовать общий StorageSnapshot для каждой таблицы. Это обеспечивает согласованное представление данных во всём запросе, даже если к одной и той же таблице обращаются несколько раз.

Это необходимо для запросов, в которых важна внутренняя согласованность фрагментов данных. Пример:

SELECT
    count()
FROM events
WHERE (_part, _part_offset) IN (
    SELECT _part, _part_offset
    FROM events
    WHERE user_id = 42
)

Без этого параметра внешние и внутренние запросы могут работать с разными снимками данных, что приводит к некорректным результатам.

Примечание

Включение этого параметра отключает оптимизацию, которая удаляет ненужные части данных из снимков после завершения этапа планирования запроса. В результате долго выполняющиеся запросы могут удерживать устаревшие части на протяжении всего своего выполнения, задерживая очистку частей и увеличивая нагрузку на хранилище данных.

В настоящий момент этот параметр применяется только к таблицам семейства MergeTree.

Возможные значения:

0 — Отключено
1 — Включено

enable_sharing_sets_for_mutations

Разрешает совместное использование объектов множеств, создаваемых для подзапросов с оператором IN, между разными задачами одной и той же мутации. Это снижает потребление памяти и нагрузку на процессор.

enable_software_prefetch_in_aggregation

Включает использование программной предвыборки данных при агрегации.

enable_unaligned_array_join

Разрешает ARRAY JOIN с несколькими массивами разного размера. Когда этот параметр включён, массивы будут приведены к длине самого длинного массива.

enable_url_encoding

Позволяет включить или отключить декодирование/кодирование пути в URI в таблицах с движком URL.

По умолчанию отключено.

enable_vertical_final

Если включено, при выполнении FINAL дублирующиеся строки удаляются за счёт пометки их как удалённых с последующей фильтрацией, вместо слияния строк.

enable_writes_to_query_cache

Если параметр включён, результаты запросов SELECT сохраняются в кэше запросов.

Возможные значения:

0 — отключено
1 — включено

enable_zstd_qat_codec

Если параметр включён, кодек ZSTD_QAT может использоваться для сжатия столбцов.

enforce_strict_identifier_format

Если настройка включена, допускаются только идентификаторы, содержащие буквенно-цифровые символы и символ подчёркивания.

engine_file_allow_create_multiple_files

Включает или отключает создание нового файла при каждой вставке в таблицы движка File, если формат имеет суффикс (JSON, ORC, Parquet и т.д.). Если параметр включён, при каждом запросе INSERT будет создаваться новый файл с именем по следующему шаблону:

data.Parquet -> data.1.Parquet -> data.2.Parquet и т.д.

Возможные значения:

0 — запрос INSERT добавляет новые данные в конец файла.
1 — запрос INSERT создаёт новый файл.

engine_file_empty_if_not_exists

Позволяет выполнять выборку данных из таблицы с движком File при отсутствии файла.

Возможные значения:

0 — SELECT порождает исключение.
1 — SELECT возвращает пустой результат.

engine_file_skip_empty_files

Включает или отключает пропуск пустых файлов в таблицах с движком File.

Возможные значения:

0 — SELECT выбрасывает исключение, если пустой файл не совместим с запрошенным форматом.
1 — SELECT возвращает пустой результат для пустого файла.

engine_file_truncate_on_insert

Включает или отключает усечение файла перед выполнением вставки в таблицы движка File.

Возможные значения:

0 — запрос INSERT дописывает новые данные в конец файла.
1 — запрос INSERT перезаписывает содержимое файла новыми данными.

engine_url_skip_empty_files

Включает или отключает пропуск пустых файлов в таблицах движка таблиц URL.

Возможные значения:

0 — SELECT вызывает исключение, если пустой файл не совместим с запрошенным форматом.
1 — SELECT возвращает пустой результат для пустого файла.

except_default_mode

Устанавливает режим по умолчанию в запросе EXCEPT. Возможные значения: пустая строка, 'ALL', 'DISTINCT'. Если значение пустое, запрос без указанного режима вызовет исключение.

exclude_materialize_skip_indexes_on_insert

Исключает указанные пропускающие индексы из построения и сохранения во время вставок (INSERT). Исключённые пропускающие индексы всё равно будут построены и сохранены во время слияний или с помощью явного запроса MATERIALIZE INDEX.

Не оказывает никакого эффекта, если materialize_skip_indexes_on_insert имеет значение false.

Пример:

CREATE TABLE tab
(
    a UInt64,
    b UInt64,
    INDEX idx_a a TYPE minmax,
    INDEX idx_b b TYPE set(3)
)
ENGINE = MergeTree ORDER BY tuple();

SET exclude_materialize_skip_indexes_on_insert='idx_a'; -- idx_a не будет обновлён при вставке
--SET exclude_materialize_skip_indexes_on_insert='idx_a, idx_b'; -- ни один из индексов не будет обновлён при вставке

INSERT INTO tab SELECT number, number / 50 FROM numbers(100); -- обновляется только idx_b

-- поскольку это настройка сеанса, её можно задать на уровне отдельного запроса
INSERT INTO tab SELECT number, number / 50 FROM numbers(100, 100) SETTINGS exclude_materialize_skip_indexes_on_insert='idx_b';

ALTER TABLE tab MATERIALIZE INDEX idx_a; -- этот запрос можно использовать для явной материализации индекса

SET exclude_materialize_skip_indexes_on_insert = DEFAULT; -- сброс настройки на значение по умолчанию

execute_exists_as_scalar_subquery

Выполнять некоррелированные подзапросы EXISTS как скалярные подзапросы. Как и для скалярных подзапросов, используется кэш, а к результату применяется свёртка констант.

external_storage_connect_timeout_sec

Таймаут подключения в секундах. Сейчас поддерживается только для MySQL.

external_storage_max_read_bytes

Ограничивает максимальное количество байт при сбросе исторических данных таблицей с внешним движком. В настоящее время поддерживается только для движка таблицы MySQL, движка базы данных и словаря. Если значение равно 0, эта настройка отключена.

external_storage_max_read_rows

Ограничивает максимальное количество строк при сбросе исторических данных таблицей с внешним движком. В настоящее время поддерживается только для таблиц, баз данных и словарей с движком MySQL. Если равно 0, этот параметр отключен.

external_storage_rw_timeout_sec

Таймаут чтения/записи в секундах. Сейчас поддерживается только для MySQL.

external_table_functions_use_nulls

Определяет, как табличные функции mysql, postgresql и odbc используют столбцы с типом Nullable.

Возможные значения:

0 — табличная функция явно использует столбцы Nullable.
1 — табличная функция неявно использует столбцы Nullable.

Использование

Если параметр установлен в 0, табличная функция не помечает столбцы как Nullable и вставляет значения по умолчанию вместо NULL. Это также применяется к значениям NULL внутри массивов.

external_table_strict_query

Если установлено значение true, преобразование выражения в локальный фильтр запрещено для запросов к внешним таблицам.

extract_key_value_pairs_max_pairs_per_row

Aliases: extract_kvp_max_pairs_per_row

Максимальное количество пар, которое может быть сформировано функцией extractKeyValuePairs. Используется как защита от чрезмерного потребления памяти.

extremes

Определяет, нужно ли учитывать экстремальные значения (минимальные и максимальные значения в столбцах результата запроса). Принимает 0 или 1. По умолчанию — 0 (отключено). Дополнительную информацию см. в разделе «Экстремальные значения».

fallback_to_stale_replicas_for_distributed_queries

Принудительно направляет запрос на устаревшую реплику, если обновлённые данные недоступны. См. раздел Replication.

ClickHouse выбирает наиболее подходящую из устаревших реплик таблицы.

Используется при выполнении SELECT из распределённой таблицы, которая ссылается на реплицируемые таблицы.

По умолчанию — 1 (включено).

filesystem_cache_allow_background_download

Разрешает файловому кэшу ставить в очередь фоновые загрузки данных, читаемых из удалённого хранилища. Отключите, чтобы выполнять загрузки в переднем плане для текущего запроса или сеанса.

filesystem_cache_boundary_alignment

Выравнивание границ файлового кэша. Этот параметр применяется только при чтении не с диска (например, для кэша удалённых движков таблиц и табличных функций, но не для конфигурации хранилища таблиц MergeTree). Значение 0 означает отсутствие выравнивания.

filesystem_cache_enable_background_download_during_fetch

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Время ожидания при захвате блокировки кэша для резервирования места в файловом кэше

filesystem_cache_enable_background_download_for_metadata_files_in_packed_storage

ClickHouse Cloud only

Применяется только в ClickHouse Cloud. Время ожидания блокировки кэша при резервировании места в файловом кэше

filesystem_cache_max_download_size

Максимальный размер кэша удалённой файловой системы, который может быть загружен одним запросом

filesystem_cache_name

Имя файлового кэша для движков таблиц без состояния или дата-лейков

filesystem_cache_prefer_bigger_buffer_size

Использовать больший размер буфера, если включён файловый кэш, чтобы избежать записи небольших сегментов файлов, ухудшающих производительность кэша. Однако включение этого параметра может увеличить потребление памяти.

filesystem_cache_reserve_space_wait_lock_timeout_milliseconds

Таймаут ожидания захвата блокировки кэша при резервировании пространства в файловом кэше

filesystem_cache_segments_batch_size

Ограничение на размер одного пакета файловых сегментов, которые буфер чтения может запросить из кэша. Слишком маленькое значение приведёт к избыточному числу запросов к кэшу, слишком большое может замедлить вытеснение данных из кэша.

filesystem_cache_skip_download_if_exceeds_per_query_cache_write_limit

Псевдонимы: skip_download_if_exceeds_query_cache

Пропускать загрузку из удалённой файловой системы, если превышен размер кэша запроса

filesystem_prefetch_max_memory_usage

Максимальный объём памяти, используемой для предварительного чтения.

filesystem_prefetch_step_bytes

Шаг предварительной выборки в байтах. Значение 0 означает auto — примерно оптимальный шаг предварительной выборки будет выбран автоматически, но может быть не на 100% лучшим. Фактическое значение может отличаться из‑за настройки filesystem_prefetch_min_bytes_for_single_read_task.

filesystem_prefetch_step_marks

Шаг предварительной выборки в метках. Ноль означает auto — приблизительно оптимальный шаг предварительной выборки будет определён автоматически, но он может быть не на 100% лучшим. Фактическое значение может отличаться из-за настройки filesystem_prefetch_min_bytes_for_single_read_task.

filesystem_prefetches_limit

Максимальное количество предварительных чтений. Значение 0 означает отсутствие ограничений. Для ограничения количества предварительных чтений предпочтительнее использовать настройку filesystem_prefetches_max_memory_usage.

final

Автоматически применяет модификатор FINAL ко всем таблицам в запросе, для которых FINAL применим, включая соединённые таблицы, таблицы в подзапросах и распределённые таблицы.

Возможные значения:

0 - отключено
1 - включено

Пример:

CREATE TABLE test
(
    key Int64,
    some String
)
ENGINE = ReplacingMergeTree
ORDER BY key;

INSERT INTO test FORMAT Values (1, 'first');
INSERT INTO test FORMAT Values (1, 'second');

SELECT * FROM test;
┌─key─┬─some───┐
│   1 │ second │
└─────┴────────┘
┌─key─┬─some──┐
│   1 │ first │
└─────┴───────┘

SELECT * FROM test SETTINGS final = 1;
┌─key─┬─some───┐
│   1 │ second │
└─────┴────────┘

SET final = 1;
SELECT * FROM test;
┌─key─┬─some───┐
│   1 │ second │
└─────┴────────┘

flatten_nested

Задает формат данных столбцов типа Nested.

Возможные значения:

1 — столбец Nested разворачивается в отдельные массивы.
0 — столбец Nested остается одним массивом кортежей.

Использование

Если параметр установлен в 0, можно использовать произвольный уровень вложенности.

Примеры

Запрос:

SET flatten_nested = 1;
CREATE TABLE t_nest (`n` Nested(a UInt32, b UInt32)) ENGINE = MergeTree ORDER BY tuple();

SHOW CREATE TABLE t_nest;

Результат:

┌─statement───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ CREATE TABLE default.t_nest
(
    `n.a` Array(UInt32),
    `n.b` Array(UInt32)
)
ENGINE = MergeTree
ORDER BY tuple()
SETTINGS index_granularity = 8192 │
└─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

Запрос:

SET flatten_nested = 0;

CREATE TABLE t_nest (`n` Nested(a UInt32, b UInt32)) ENGINE = MergeTree ORDER BY tuple();

SHOW CREATE TABLE t_nest;

Результат:

┌─statement──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ CREATE TABLE default.t_nest
(
    `n` Nested(a UInt32, b UInt32)
)
ENGINE = MergeTree
ORDER BY tuple()
SETTINGS index_granularity = 8192 │
└────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

force_aggregate_partitions_independently

Принудительно использовать оптимизацию, когда она применима, даже если эвристические алгоритмы решили её не использовать

force_aggregation_in_order

Этот параметр используется сервером для обработки распределённых запросов. Не изменяйте его вручную, так как это может нарушить нормальную работу. (Принудительное выполнение агрегации в порядке следования данных на удалённых узлах при распределённой агрегации).

force_data_skipping_indices

Отключает выполнение запроса, если указанные индексы пропуска данных не были использованы.

Рассмотрим следующий пример:

CREATE TABLE data
(
    key Int,
    d1 Int,
    d1_null Nullable(Int),
    INDEX d1_idx d1 TYPE minmax GRANULARITY 1,
    INDEX d1_null_idx assumeNotNull(d1_null) TYPE minmax GRANULARITY 1
)
Engine=MergeTree()
ORDER BY key;

SELECT * FROM data_01515;
SELECT * FROM data_01515 SETTINGS force_data_skipping_indices=''; -- запрос вызовет ошибку CANNOT_PARSE_TEXT.
SELECT * FROM data_01515 SETTINGS force_data_skipping_indices='d1_idx'; -- запрос вызовет ошибку INDEX_NOT_USED.
SELECT * FROM data_01515 WHERE d1 = 0 SETTINGS force_data_skipping_indices='d1_idx'; -- Ок.
SELECT * FROM data_01515 WHERE d1 = 0 SETTINGS force_data_skipping_indices='`d1_idx`'; -- Ок (пример полнофункционального парсера).
SELECT * FROM data_01515 WHERE d1 = 0 SETTINGS force_data_skipping_indices='`d1_idx`, d1_null_idx'; -- запрос вызовет ошибку INDEX_NOT_USED, так как индекс d1_null_idx не используется.
SELECT * FROM data_01515 WHERE d1 = 0 AND assumeNotNull(d1_null) = 0 SETTINGS force_data_skipping_indices='`d1_idx`, d1_null_idx'; -- Ок.

force_grouping_standard_compatibility

Заставляет функцию GROUPING возвращать 1, если аргумент не используется в качестве ключа агрегации

force_index_by_date

Отключает выполнение запроса, если индекс по дате не может быть использован.

Работает с таблицами семейства MergeTree.

Если force_index_by_date=1, ClickHouse проверяет, содержит ли запрос условие по ключу даты, которое может быть использовано для ограничения диапазонов данных. Если подходящего условия нет, выбрасывается исключение. Однако настройка не проверяет, уменьшает ли условие объем данных для чтения. Например, условие Date != ' 2000-01-01 ' считается допустимым, даже если ему соответствуют все данные в таблице (то есть для выполнения запроса требуется полное сканирование таблицы). Дополнительную информацию о диапазонах данных в таблицах MergeTree см. в разделе MergeTree.

force_optimize_projection

Включает или отключает обязательное использование проекций в запросах SELECT, когда включена оптимизация с использованием проекций (см. настройку optimize_use_projections).

Возможные значения:

0 — Оптимизация с использованием проекций не является обязательной.
1 — Оптимизация с использованием проекций является обязательной.

force_optimize_projection_name

Если параметру задано непустое строковое значение, выполняется проверка, что эта проекция используется в запросе хотя бы один раз.

Возможные значения:

string: имя проекции, используемой в запросе

force_optimize_skip_unused_shards

Включает или отключает выполнение запроса, если optimize_skip_unused_shards включен, но пропуск неиспользуемых шардов невозможен. Если пропуск невозможен и настройка включена, будет сгенерировано исключение.

Возможные значения:

0 — Отключено. ClickHouse не генерирует исключение.
1 — Включено. Выполнение запроса запрещается только в том случае, если у таблицы есть ключ шардирования.
2 — Включено. Выполнение запроса запрещается независимо от того, определён ли для таблицы ключ шардирования.

force_optimize_skip_unused_shards_nesting

Регулирует работу параметра force_optimize_skip_unused_shards (и, следовательно, по‑прежнему требует включённого force_optimize_skip_unused_shards) в зависимости от уровня вложенности распределённого запроса (когда таблица Distributed обращается к другой таблице Distributed).

Возможные значения:

0 — Отключено: force_optimize_skip_unused_shards применяется на всех уровнях вложенности.
1 — Включает force_optimize_skip_unused_shards только для первого уровня вложенности.
2 — Включает force_optimize_skip_unused_shards до второго уровня вложенности.

force_primary_key

Запрещает выполнение запроса, если использование индекса по первичному ключу невозможно.

Применяется к таблицам семейства MergeTree.

Если force_primary_key=1, ClickHouse проверяет, содержит ли запрос условие по первичному ключу, которое может быть использовано для ограничения диапазонов данных. Если подходящего условия нет, генерируется исключение. При этом не проверяется, уменьшает ли это условие объём данных для чтения. Дополнительную информацию о диапазонах данных в таблицах MergeTree см. в разделе MergeTree.

force_remove_data_recursively_on_drop

Рекурсивно удаляет данные при выполнении запроса DROP. Позволяет избежать ошибки «Directory not empty», но может незаметно удалить отсоединённые данные

formatdatetime_e_with_space_padding

Форматтер '%e' в функции 'formatDateTime' выводит однозначные значения дней месяца с начальным пробелом, например ' 2' вместо '2'.

formatdatetime_f_prints_scale_number_of_digits

Форматтер '%f' в функции formatDateTime выводит для DateTime64 только количество цифр, соответствующее масштабу, вместо фиксированных 6 цифр.

formatdatetime_f_prints_single_zero

Спецификатор формата '%f' в функции 'formatDateTime' выводит один ноль вместо шести, если значение времени не содержит дробной части секунды.

formatdatetime_format_without_leading_zeros

Спецификаторы формата '%c', '%l' и '%k' в функции 'formatDateTime' выводят месяцы и часы без ведущих нулей.

formatdatetime_parsedatetime_m_is_month_name

Спецификатор формата %M в функциях formatDateTime и parseDateTime выводит/разбирает название месяца вместо минут.

fsync_metadata

Включает или отключает fsync при записи файлов .sql. По умолчанию включено.

Имеет смысл отключить этот параметр, если на сервере миллионы небольших таблиц, которые постоянно создаются и удаляются.

function_date_trunc_return_type_behavior

Позволяет изменить поведение возвращаемого типа функции dateTrunc.

Возможные значения:

0 — когда второй аргумент имеет тип DateTime64/Date32, тип возвращаемого значения будет DateTime64/Date32 независимо от временной единицы в первом аргументе.
1 — для Date32 результат всегда имеет тип Date. Для DateTime64 результат имеет тип DateTime для временных единиц second и более крупных.

function_implementation

Выберите реализацию функции для конкретного target или варианта (экспериментально). Если параметр не задан, включаются все реализации.

function_json_value_return_type_allow_complex

Определяет, разрешено ли функции json_value возвращать сложные типы (например, struct, array, map).

SELECT JSON_VALUE('{"hello":{"world":"!"}}', '$.hello') settings function_json_value_return_type_allow_complex=true

┌─JSON_VALUE('{"hello":{"world":"!"}}', '$.hello')─┐
│ {"world":"!"}                                    │
└──────────────────────────────────────────────────┘

Получена 1 строка. Прошло: 0.001 сек.

Возможные значения:

true — разрешить.
false — запретить.

function_json_value_return_type_allow_nullable

Определяет, можно ли возвращать NULL, если запрошенное значение для функции JSON_VALUE отсутствует.

SELECT JSON_VALUE('{"hello":"world"}', '$.b') settings function_json_value_return_type_allow_nullable=true;

┌─JSON_VALUE('{"hello":"world"}', '$.b')─┐
│ ᴺᵁᴸᴸ                                   │
└────────────────────────────────────────┘

Получена 1 строка. Прошло: 0.001 сек.

Возможные значения:

true — разрешить.
false — запретить.

function_locate_has_mysql_compatible_argument_order

Определяет порядок аргументов в функции locate.

Возможные значения:

0 — функция locate принимает аргументы (haystack, needle[, start_pos]).
1 — функция locate принимает аргументы (needle, haystack, [, start_pos]) (поведение, совместимое с MySQL).

function_range_max_elements_in_block

Устанавливает защитный порог для объёма данных, генерируемых функцией range. Определяет максимальное количество значений, генерируемых функцией для блока данных (сумма размеров массивов для каждой строки в блоке).

Возможные значения:

Положительное целое число.

См. также

max_block_size
min_insert_block_size_rows

function_sleep_max_microseconds_per_block

Максимальное количество микросекунд, в течение которых функция sleep может приостанавливать выполнение для каждого блока. Если указано большее значение, выбрасывается исключение. Это защитный порог.

function_visible_width_behavior

Вариант поведения функции visibleWidth. 0 — подсчитывать только количество кодовых точек; 1 — корректно учитывать символы нулевой ширины и комбинируемые символы, считать полноширинные символы за два, оценивать ширину табуляции, учитывать символы удаления.

geo_distance_returns_float64_on_float64_arguments

Если все четыре аргумента функций geoDistance, greatCircleDistance, greatCircleAngle имеют тип Float64, то возвращается Float64, а для внутренних вычислений используется двойная точность. В предыдущих версиях ClickHouse эти функции всегда возвращали Float32.

geotoh3_argument_order

Beta feature. Learn more.

Функция 'geoToH3' принимает (lon, lat), если установлено 'lon_lat', и (lat, lon), если установлено 'lat_lon'.

glob_expansion_max_elements

Максимальное количество допустимых адресов (для внешних хранилищ, табличных функций и т. д.).

grace_hash_join_initial_buckets

Experimental feature. Learn more.

Начальное количество бакетов grace hash join

grace_hash_join_max_buckets

Experimental feature. Learn more.

Ограничение на количество бакетов для grace hash join

group_by_overflow_mode

Определяет, что происходит, когда количество уникальных ключей для агрегации превышает заданный предел:

throw: сгенерировать исключение
break: остановить выполнение запроса и вернуть частичный результат
any: продолжать агрегацию для ключей, уже попавших в множество, но не добавлять в множество новые ключи.

Использование значения any позволяет выполнять приближённый вариант GROUP BY. Качество этого приближения зависит от статистических свойств данных.

group_by_two_level_threshold

При каком количестве ключей начинается двухуровневая агрегация. 0 — порог не установлен.

group_by_two_level_threshold_bytes

Минимальный размер агрегатного состояния в байтах, при котором начинает применяться двухуровневая агрегация. 0 — порог не установлен. Двухуровневая агрегация используется, когда срабатывает хотя бы один из порогов.

group_by_use_nulls

Изменяет способ, которым предложение GROUP BY обрабатывает типы ключей агрегации. Когда используются спецификаторы ROLLUP, CUBE или GROUPING SETS, некоторые ключи агрегации могут не использоваться при формировании отдельных строк результата. Столбцы для этих ключей в соответствующих строках заполняются либо значением по умолчанию, либо NULL в зависимости от этой настройки.

Возможные значения:

0 — Для отсутствующих значений используется значение по умолчанию для типа ключа агрегации.
1 — ClickHouse выполняет GROUP BY так же, как это определено стандартом SQL. Типы ключей агрегации преобразуются в Nullable. Столбцы для соответствующих ключей агрегации заполняются значением NULL для строк, в которых они не использовались.

См. также:

Предложение GROUP BY

h3togeo_lon_lat_result_order

Функция h3ToGeo возвращает (долгота, широта), если true, иначе (широта, долгота).

handshake_timeout_ms

Таймаут в миллисекундах ожидания пакета Hello от реплик при установлении соединения.

hdfs_create_new_file_on_insert

Включает или отключает создание нового файла при каждом INSERT в таблицы с движком HDFS. Если включено, при каждом выполнении запроса INSERT будет создаваться новый HDFS-файл с именем по шаблону, похожему на следующий:

изначально data.Parquet.gz -> data.1.Parquet.gz -> data.2.Parquet.gz и т.д.

Возможные значения:

0 — запрос INSERT дописывает новые данные в конец файла.
1 — запрос INSERT создает новый файл.

hdfs_ignore_file_doesnt_exist

Игнорировать отсутствие файла при чтении определённых ключей, если запрошенный файл отсутствует.

Возможные значения:

1 — SELECT возвращает пустой результат.
0 — SELECT выбрасывает исключение.

hdfs_replication

Фактическое количество реплик может быть указано при создании файла HDFS.

hdfs_skip_empty_files

Включает или отключает пропуск пустых файлов в таблицах движка HDFS.

Возможные значения:

0 — SELECT выдает исключение, если пустой файл не совместим с запрошенным форматом.
1 — SELECT возвращает пустой результат для пустого файла.

hdfs_throw_on_zero_files_match

Вызывает ошибку, если по правилам раскрытия шаблонов glob не найдено ни одного файла.

Возможные значения:

1 — SELECT генерирует исключение.
0 — SELECT возвращает пустой результат.

hdfs_truncate_on_insert

Включает или отключает усечение файла перед вставкой в таблицы движка HDFS. Если параметр отключён, при попытке вставки будет возбуждено исключение, если файл в HDFS уже существует.

Возможные значения:

0 — запрос INSERT дописывает новые данные в конец файла.
1 — запрос INSERT заменяет существующее содержимое файла новыми данными.

hedged_connection_timeout_ms

Таймаут установки соединения с репликой для хеджированных (hedged) запросов

hnsw_candidate_list_size_for_search

Размер динамического списка кандидатов при поиске по индексу векторного подобия; этот параметр также известен как ef_search.

hsts_max_age

Период действия HSTS. Значение 0 отключает HSTS.

http_connection_timeout

Таймаут HTTP-соединения (в секундах).

Возможные значения:

Любое положительное целое число.
0 — отключено (бесконечный таймаут).

http_headers_progress_interval_ms

Не отправляйте HTTP-заголовки X-ClickHouse-Progress чаще, чем один раз за указанный интервал.

http_make_head_request

Настройка http_make_head_request позволяет выполнять запрос HEAD при чтении данных по протоколу HTTP, чтобы получить информацию о считываемом файле, например о его размере. Поскольку она включена по умолчанию, в случаях, когда сервер не поддерживает запросы HEAD, может потребоваться отключить эту настройку.

http_max_field_name_size

Максимальная длина имени поля в заголовке HTTP

http_max_field_value_size

Максимальная длина значения поля заголовка HTTP

http_max_fields

Максимальное количество полей в HTTP-заголовке

http_max_multipart_form_data_size

Ограничение по размеру содержимого multipart/form-data. Этот параметр не может быть задан через параметры URL и должен указываться в пользовательском профиле. Обратите внимание, что содержимое разбирается, а внешние таблицы создаются в памяти до начала выполнения запроса. И это единственный лимит, который действует на этом этапе (ограничения на максимальное использование памяти и максимальное время выполнения не влияют на чтение данных формы HTTP).

http_max_request_param_data_size

Ограничение на размер данных запроса, используемых в качестве параметра в предопределённых HTTP-запросах.

http_max_tries

Максимальное число попыток чтения через HTTP.

http_max_uri_size

Устанавливает максимальную длину URI в HTTP‑запросе.

Возможные значения:

Положительное целое число.

http_native_compression_disable_checksumming_on_decompress

Включает или отключает проверку контрольной суммы при декомпрессии данных HTTP POST‑запроса от клиента. Используется только для собственного формата сжатия ClickHouse (не используется с gzip или deflate).

Дополнительные сведения см. в описании HTTP-интерфейса.

Возможные значения:

0 — Отключено.
1 — Включено.

http_receive_timeout

Таймаут ожидания приёма HTTP‑данных (в секундах).

Возможные значения:

Любое положительное целое число.
0 — отключено (бесконечный таймаут).

http_response_buffer_size

Количество байт, буферизуемых в памяти сервера перед отправкой HTTP‑ответа клиенту или записью на диск (когда включён http_wait_end_of_query).

http_response_headers

Позволяет добавлять или переопределять HTTP-заголовки, которые сервер вернёт в ответе при успешном выполнении запроса. Это влияет только на HTTP-интерфейс.

Если заголовок уже установлен по умолчанию, предоставленное значение его переопределит. Если заголовок не был установлен по умолчанию, он будет добавлен в список заголовков. Заголовки, которые сервер устанавливает по умолчанию и которые не переопределены этим параметром, останутся без изменений.

Параметр позволяет установить заголовок в фиксированное значение. В настоящее время нет способа задать заголовок как динамически вычисляемое значение.

Ни имена, ни значения не могут содержать управляющие символы ASCII.

Если вы реализуете UI-приложение, которое позволяет пользователям изменять настройки, но при этом принимает решения на основе возвращаемых заголовков, рекомендуется ограничить этот параметр режимом только для чтения (readonly).

Пример: SET http_response_headers = '{"Content-Type": "image/png"}'

http_retry_initial_backoff_ms

Минимальное значение задержки (backoff) в миллисекундах при повторной попытке чтения по HTTP

http_retry_max_backoff_ms

Максимальное значение задержки (backoff) в миллисекундах при повторной попытке чтения по HTTP

http_send_timeout

Таймаут отправки HTTP-запросов (в секундах).

Возможные значения:

Любое положительное целое число.
0 — отключено (бесконечный таймаут).

Примечание

Применимо только к профилю по умолчанию. Для вступления изменений в силу требуется перезапуск сервера.

http_skip_not_found_url_for_globs

Пропускать URL, соответствующие glob-шаблонам, для которых получена ошибка HTTP_NOT_FOUND

http_wait_end_of_query

Включает буферизацию HTTP-ответов на стороне сервера.

http_write_exception_in_output_format

Выводить информацию об исключении в выходном формате, чтобы формировать корректный вывод. Работает с форматами JSON и XML.

http_zlib_compression_level

Устанавливает уровень сжатия данных в ответе на HTTP-запрос, если enable_http_compression = 1.

Возможные значения: числа от 1 до 9.

iceberg_delete_data_on_drop

Определяет, нужно ли удалять все файлы Iceberg при выполнении операции DROP.

iceberg_insert_max_bytes_in_data_file

Максимальный размер в байтах Parquet-файла данных Iceberg при выполнении операции вставки.

iceberg_insert_max_partitions

Максимально допустимое количество партиций в одной операции вставки в таблицу движка Iceberg.

iceberg_insert_max_rows_in_data_file

Максимальное количество строк в Parquet-файле данных Iceberg при выполнении операции вставки.

iceberg_metadata_compression_method

Experimental feature. Learn more.

Метод, используемый для сжатия файла .metadata.json.

iceberg_metadata_log_level

Определяет уровень логирования метаданных для таблиц Iceberg в системную таблицу system.iceberg_metadata_log. Обычно эту настройку изменяют в целях отладки.

Возможные значения:

none — без журнала метаданных.
metadata — корневой файл metadata.json.
manifest_list_metadata — всё выше + метаданные из списка манифестов Avro (avro manifest list), соответствующего снимку (snapshot).
manifest_list_entry — всё выше + записи списка манифестов Avro.
manifest_file_metadata — всё выше + метаданные из просматриваемых файлов манифестов Avro.
manifest_file_entry — всё выше + записи из просматриваемых файлов манифестов Avro.

iceberg_snapshot_id

Выполняет запрос к таблице Iceberg по указанному идентификатору снимка.

iceberg_timestamp_ms

Выполняет запрос к таблице Iceberg, используя снимок, актуальный на указанный момент времени.

idle_connection_timeout

Таймаут для закрытия неактивных TCP-подключений по истечении заданного количества секунд.

Возможные значения:

Положительное целое число (0 — закрыть немедленно, через 0 секунд).

ignore_cold_parts_seconds

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Исключает новые части данных из запросов SELECT до тех пор, пока они либо не будут предварительно прогреты (см. cache_populated_by_fetch), либо не станут старше указанного числа секунд. Применяется только к Replicated-/SharedMergeTree.

ignore_data_skipping_indices

Игнорирует указанные индексы пропуска данных, если они используются в запросе.

Рассмотрим следующий пример:

CREATE TABLE data
(
    key Int,
    x Int,
    y Int,
    INDEX x_idx x TYPE minmax GRANULARITY 1,
    INDEX y_idx y TYPE minmax GRANULARITY 1,
    INDEX xy_idx (x,y) TYPE minmax GRANULARITY 1
)
Engine=MergeTree()
ORDER BY key;

INSERT INTO data VALUES (1, 2, 3);

SELECT * FROM data;
SELECT * FROM data SETTINGS ignore_data_skipping_indices=''; -- запрос приведет к ошибке CANNOT_PARSE_TEXT.
SELECT * FROM data SETTINGS ignore_data_skipping_indices='x_idx'; -- Ок.
SELECT * FROM data SETTINGS ignore_data_skipping_indices='na_idx'; -- Ок.

SELECT * FROM data WHERE x = 1 AND y = 1 SETTINGS ignore_data_skipping_indices='xy_idx',force_data_skipping_indices='xy_idx' ; -- запрос приведет к ошибке INDEX_NOT_USED, так как xy_idx явно игнорируется.
SELECT * FROM data WHERE x = 1 AND y = 2 SETTINGS ignore_data_skipping_indices='xy_idx';

Запрос с использованием всех индексов:

EXPLAIN indexes = 1 SELECT * FROM data WHERE x = 1 AND y = 2;

Expression ((Projection + Before ORDER BY))
  Filter (WHERE)
    ReadFromMergeTree (default.data)
    Indexes:
      PrimaryKey
        Condition: true
        Parts: 1/1
        Granules: 1/1
      Skip
        Name: x_idx
        Description: minmax GRANULARITY 1
        Parts: 0/1
        Granules: 0/1
      Skip
        Name: y_idx
        Description: minmax GRANULARITY 1
        Parts: 0/0
        Granules: 0/0
      Skip
        Name: xy_idx
        Description: minmax GRANULARITY 1
        Parts: 0/0
        Granules: 0/0

Игнорируем индекс xy_idx:

EXPLAIN indexes = 1 SELECT * FROM data WHERE x = 1 AND y = 2 SETTINGS ignore_data_skipping_indices='xy_idx';

Expression ((Projection + Before ORDER BY))
  Filter (WHERE)
    ReadFromMergeTree (default.data)
    Indexes:
      PrimaryKey
        Condition: true
        Parts: 1/1
        Granules: 1/1
      Skip
        Name: x_idx
        Description: minmax GRANULARITY 1
        Parts: 0/1
        Granules: 0/1
      Skip
        Name: y_idx
        Description: minmax GRANULARITY 1
        Parts: 0/0
        Granules: 0/0

Работает с таблицами семейства MergeTree.

ignore_drop_queries_probability

При включении настройка заставляет сервер с указанной вероятностью игнорировать все запросы DROP TABLE (для движков Memory и JOIN оператор DROP будет заменён на TRUNCATE). Используется в целях тестирования.

ignore_materialized_views_with_dropped_target_table

Игнорировать материализованные представления с удалённой целевой таблицей при отправке данных в представления

ignore_on_cluster_for_replicated_access_entities_queries

Игнорировать предложение ON CLUSTER для запросов управления реплицируемыми сущностями управления доступом.

ignore_on_cluster_for_replicated_named_collections_queries

Игнорирует предложение ON CLUSTER для запросов управления реплицируемыми именованными коллекциями.

ignore_on_cluster_for_replicated_udf_queries

Игнорирует клаузу ON CLUSTER для запросов управления реплицируемыми UDF.

implicit_select

Позволяет выполнять простые запросы без начального ключевого слова SELECT, что упрощает использование в режиме калькулятора: например, 1 + 2 становится корректным запросом.

В clickhouse-local этот параметр включён по умолчанию, но его можно явно отключить.

implicit_table_at_top_level

Если настройка не пуста, запросы без FROM на верхнем уровне будут считывать данные из этой таблицы вместо system.one.

Эта настройка используется в clickhouse-local для обработки входных данных. Параметр может быть явно задан пользователем, но не предназначен для такого варианта использования.

Подзапросы не затрагиваются этой настройкой (ни скалярные, ни подзапросы в предложениях FROM или IN). Операторы SELECT на верхнем уровне цепочек UNION, INTERSECT, EXCEPT обрабатываются единообразно и затрагиваются этой настройкой независимо от их группировки в скобках. То, как эта настройка влияет на представления (views) и распределённые запросы, не определено.

Настройка принимает имя таблицы (в этом случае таблица определяется в контексте текущей базы данных) или квалифицированное имя в форме 'database.table'. И имена баз данных, и имена таблиц должны быть без кавычек — допускаются только простые идентификаторы.

implicit_transaction

Experimental feature. Learn more.

Если параметр включён и запрос ещё не выполняется в рамках транзакции, оборачивает запрос в полноценную транзакцию (BEGIN + COMMIT или ROLLBACK).

inject_random_order_for_select_without_order_by

Если настройка включена, добавляет ORDER BY rand() в запросы SELECT без предложения ORDER BY. Применяется только при глубине подзапроса 0. Подзапросы и INSERT INTO ... SELECT не затрагиваются. Если на верхнем уровне используется конструкция UNION, ORDER BY rand() добавляется независимо во все дочерние части. Полезно только для тестирования и разработки (отсутствие ORDER BY является источником недетерминированных результатов запроса).

input_format_parallel_parsing

Включает или отключает параллельный разбор форматов данных с сохранением порядка. Поддерживается только для форматов TabSeparated (TSV), TSKV, CSV и JSONEachRow.

Возможные значения:

1 — Включено.
0 — Отключено.

insert_allow_materialized_columns

Если настройка включена, разрешает использовать материализованные столбцы в операторе INSERT.

insert_deduplicate

Включает или отключает дедупликацию блоков при INSERT (для реплицируемых таблиц серии Replicated*).

Возможные значения:

0 — Выключено.
1 — Включено.

По умолчанию блоки, вставляемые в реплицируемые таблицы оператором INSERT, дедуплицируются (см. Репликация данных). Для реплицируемых таблиц по умолчанию дедуплицируются только 100 последних блоков для каждого раздела (см. replicated_deduplication_window, replicated_deduplication_window_seconds). Для нереплицируемых таблиц см. non_replicated_deduplication_window.

insert_deduplication_token

Этот параметр позволяет пользователю задать собственную семантику дедупликации в MergeTree/ReplicatedMergeTree. Например, указывая уникальное значение этого параметра в каждом операторе INSERT, пользователь может избежать дедупликации одних и тех же вставленных данных.

Возможные значения:

Любая строка

insert_deduplication_token используется для дедупликации только если он непустой.

Для реплицируемых таблиц по умолчанию дедуплицируются только 100 самых недавних вставок для каждой партиции (см. replicated_deduplication_window, replicated_deduplication_window_seconds). Для нереплицируемых таблиц см. non_replicated_deduplication_window.

Примечание

insert_deduplication_token работает на уровне партиции (так же, как и контрольная сумма insert_deduplication). Несколько партиций могут иметь одинаковый insert_deduplication_token.

Пример:

CREATE TABLE test_table
( A Int64 )
ENGINE = MergeTree
ORDER BY A
SETTINGS non_replicated_deduplication_window = 100;

INSERT INTO test_table SETTINGS insert_deduplication_token = 'test' VALUES (1);

-- следующая вставка не будет дедуплицирована, так как insert_deduplication_token отличается
INSERT INTO test_table SETTINGS insert_deduplication_token = 'test1' VALUES (1);

-- следующая вставка будет дедуплицирована, так как insert_deduplication_token
-- совпадает с одним из предыдущих
INSERT INTO test_table SETTINGS insert_deduplication_token = 'test' VALUES (2);

SELECT * FROM test_table

┌─A─┐
│ 1 │
└───┘
┌─A─┐
│ 1 │
└───┘

insert_keeper_fault_injection_probability

Приблизительная вероятность отказа запроса к keeper при вставке. Допустимые значения: от 0.0f до 1.0f.

insert_keeper_fault_injection_seed

0 — случайное начальное значение генератора, иначе — значение настройки

insert_keeper_max_retries

Этот параметр задаёт максимальное количество повторных попыток запросов к ClickHouse Keeper (или ZooKeeper) при вставке в реплицированные таблицы MergeTree. Для повторных попыток учитываются только те запросы к Keeper, которые завершились с ошибкой из‑за сетевой ошибки, тайм‑аута сессии Keeper или тайм‑аута запроса.

Возможные значения:

Положительное целое число.
0 — повторные попытки отключены.

Значение по умолчанию в ClickHouse Cloud: 20.

Повторные попытки запросов к Keeper выполняются после некоторой задержки. Эта задержка контролируется следующими настройками: insert_keeper_retry_initial_backoff_ms, insert_keeper_retry_max_backoff_ms. Первая повторная попытка выполняется после интервала insert_keeper_retry_initial_backoff_ms. Последующие интервалы будут вычисляться следующим образом:

timeout = min(insert_keeper_retry_max_backoff_ms, latest_timeout * 2)

Например, если insert_keeper_retry_initial_backoff_ms=100, insert_keeper_retry_max_backoff_ms=10000 и insert_keeper_max_retries=8, то таймауты будут равны 100, 200, 400, 800, 1600, 3200, 6400, 10000.

Помимо отказоустойчивости, повторные попытки призваны улучшить пользовательский опыт — они позволяют избежать возврата ошибки при выполнении INSERT, если Keeper был перезапущен, например, из-за обновления.

insert_keeper_retry_initial_backoff_ms

Начальная задержка (в миллисекундах) перед повторной попыткой неудавшегося запроса к Keeper при выполнении запроса INSERT.

Возможные значения:

Положительное целое число.
0 — без задержки.

insert_keeper_retry_max_backoff_ms

Максимальное время ожидания (в миллисекундах) при повторной попытке выполнения неуспешного запроса к Keeper во время выполнения запроса INSERT.

Возможные значения:

Положительное целое число.
0 — максимальное время ожидания не ограничено.

insert_null_as_default

Включает или отключает вставку значений по умолчанию вместо NULL в столбцы с типом данных, не являющимся Nullable. Если тип столбца не Nullable и эта настройка отключена, то вставка NULL вызывает исключение. Если тип столбца Nullable, значения NULL вставляются как есть, независимо от этой настройки.

Эта настройка применима к запросам INSERT ... SELECT. Обратите внимание, что подзапросы SELECT могут быть объединены с помощью предложения UNION ALL.

Возможные значения:

0 — Вставка NULL в не Nullable столбец вызывает исключение.
1 — Вместо NULL вставляется значение столбца по умолчанию.

insert_quorum

Примечание

Этот параметр не применяется к SharedMergeTree, для получения дополнительной информации см. раздел Согласованность SharedMergeTree.

Включает кворумную запись.

Если insert_quorum < 2, кворумная запись отключена.
Если insert_quorum >= 2, кворумная запись включена.
Если insert_quorum = 'auto', используется большинство (number_of_replicas / 2 + 1) в качестве числа кворума.

Кворумная запись

INSERT считается успешным только в том случае, если ClickHouse удаётся корректно записать данные на insert_quorum реплик в течение insert_quorum_timeout. Если по какой-либо причине число реплик с успешной записью не достигает значения insert_quorum, запись считается неуспешной, и ClickHouse удалит вставленный блок со всех реплик, на которые данные уже были записаны.

Когда insert_quorum_parallel отключён, все реплики в кворуме согласованы, то есть содержат данные всех предыдущих запросов INSERT (последовательность операций INSERT линеаризована). При чтении данных, записанных с использованием insert_quorum, и отключённом insert_quorum_parallel вы можете включить последовательную согласованность для запросов SELECT, используя select_sequential_consistency.

ClickHouse генерирует исключение:

Если число доступных реплик на момент выполнения запроса меньше значения insert_quorum.
Когда insert_quorum_parallel отключён и выполняется попытка записи данных, в то время как предыдущий блок ещё не был вставлен на insert_quorum реплик. Эта ситуация может возникнуть, если пользователь пытается выполнить другой запрос INSERT к той же таблице до завершения предыдущего запроса с insert_quorum.

См. также:

insert_quorum_timeout
insert_quorum_parallel
select_sequential_consistency

insert_quorum_parallel

Примечание

Этот параметр не применяется к SharedMergeTree, подробности см. в разделе SharedMergeTree consistency.

Включает или отключает параллельную обработку кворумных запросов INSERT. Если включено, можно отправлять дополнительные запросы INSERT, пока предыдущие ещё не завершены. Если отключено, дополнительные записи в ту же таблицу будут отклонены.

Возможные значения:

0 — Отключено.
1 — Включено.

См. также:

insert_quorum
insert_quorum_timeout
select_sequential_consistency

insert_quorum_timeout

Таймаут ожидания записи в кворум в миллисекундах. Если таймаут истёк и запись ещё не была выполнена, ClickHouse сгенерирует исключение, и клиент должен повторить запрос, чтобы записать тот же блок на ту же или любую другую реплику.

См. также:

insert_quorum
insert_quorum_parallel
select_sequential_consistency

insert_shard_id

Если значение не равно 0, задаёт шард таблицы Distributed, в который данные будут вставляться синхронно.

Если значение insert_shard_id указано неверно, сервер выбросит исключение.

Чтобы узнать количество шардов на requested_cluster, можно проверить конфигурацию сервера или выполнить следующий запрос:

SELECT uniq(shard_num) FROM system.clusters WHERE cluster = 'requested_cluster';

Возможные значения:

0 — отключено.
Любое число от 1 до shards_num соответствующей таблицы типа Distributed.

Пример

Запрос:

CREATE TABLE x AS system.numbers ENGINE = MergeTree ORDER BY number;
CREATE TABLE x_dist AS x ENGINE = Distributed('test_cluster_two_shards_localhost', currentDatabase(), x);
INSERT INTO x_dist SELECT * FROM numbers(5) SETTINGS insert_shard_id = 1;
SELECT * FROM x_dist ORDER BY number ASC;

Результат:

┌─number─┐
│      0 │
│      0 │
│      1 │
│      1 │
│      2 │
│      2 │
│      3 │
│      3 │
│      4 │
│      4 │
└────────┘

interactive_delay

Интервал в микросекундах для проверки отмены выполнения запроса и отправки информации о ходе его выполнения.

intersect_default_mode

Устанавливает режим по умолчанию для запроса INTERSECT. Возможные значения: пустая строка, 'ALL', 'DISTINCT'. Если значение пустое, запрос без указанного режима вызовет исключение.

jemalloc_collect_profile_samples_in_trace_log

Собирать выборки операций выделения и освобождения памяти jemalloc в trace-лог.

jemalloc_enable_profiler

Включает профилировщик jemalloc для запроса. Jemalloc будет выборочно отслеживать операции выделения памяти и все операции освобождения для выделений, попавших в выборку. Профили можно выгружать с помощью SYSTEM JEMALLOC FLUSH PROFILE, что можно использовать для анализа выделений памяти. Выборки профиля также могут сохраняться в system.trace_log с помощью конфигурационного параметра jemalloc_collect_global_profile_samples_in_trace_log или параметра запроса jemalloc_collect_profile_samples_in_trace_log. См. Allocation Profiling

join_algorithm

Задаёт, какой алгоритм JOIN используется.

Можно указать несколько алгоритмов, и для конкретного запроса будет выбран доступный алгоритм на основе типа/строгости и движка таблицы.

Возможные значения:

grace_hash

Используется Grace hash join. Grace hash предоставляет вариант алгоритма, который обеспечивает эффективное выполнение сложных JOIN при ограниченном использовании памяти.

На первой фазе алгоритм grace join читает правую таблицу и разбивает её на N корзин в зависимости от хэш-значения ключевых столбцов (изначально N — это grace_hash_join_initial_buckets). Это делается таким образом, чтобы каждая корзина могла обрабатываться независимо. Строки из первой корзины добавляются во внутреннюю хэш-таблицу, а остальные сохраняются на диск. Если хэш-таблица вырастает сверх лимита памяти (например, заданного параметром max_bytes_in_join), увеличивается количество корзин и переназначается корзина для каждой строки. Любые строки, которые не относятся к текущей корзине, сбрасываются и переназначаются.

Поддерживаются INNER/LEFT/RIGHT/FULL ALL/ANY JOIN.

hash

Используется алгоритм hash join. Наиболее универсальная реализация, которая поддерживает все комбинации типа и строгости и несколько ключей соединения, объединённых оператором OR в секции JOIN ON.

При использовании алгоритма hash правая часть JOIN загружается в оперативную память.

parallel_hash

Вариант hash join, который разбивает данные на корзины и строит несколько хэш-таблиц вместо одной параллельно, чтобы ускорить этот процесс.

При использовании алгоритма parallel_hash правая часть JOIN загружается в оперативную память.

partial_merge

Вариант алгоритма sort-merge, при котором полностью сортируется только правая таблица.

RIGHT JOIN и FULL JOIN поддерживаются только со строгостью ALL (SEMI, ANTI, ANY и ASOF не поддерживаются).

При использовании алгоритма partial_merge ClickHouse сортирует данные и сбрасывает их на диск. Алгоритм partial_merge в ClickHouse немного отличается от классической реализации. Сначала ClickHouse сортирует правую таблицу по ключам соединения блоками и создаёт min-max-индекс для отсортированных блоков. Затем он сортирует части левой таблицы по join key и выполняет соединение с правой таблицей. Min-max-индекс также используется для пропуска ненужных блоков правой таблицы.

direct

Этот алгоритм может применяться, когда хранилище для правой таблицы поддерживает запросы вида ключ-значение.

Алгоритм direct выполняет поиск в правой таблице, используя строки из левой таблицы как ключи. Он поддерживается только специальными хранилищами, такими как Dictionary или EmbeddedRocksDB, и только для LEFT и INNER JOIN.

auto

Если установлено значение auto, сначала пробуется hash join, а при превышении лимита памяти алгоритм динамически переключается на другой.

full_sorting_merge

Алгоритм sort-merge с полной сортировкой соединяемых таблиц перед выполнением JOIN.

prefer_partial_merge

ClickHouse всегда пытается использовать partial_merge join, если это возможно, в противном случае используется hash. Устарел, то же самое, что partial_merge,hash.

default (устарел)

Унаследованное значение, больше не следует использовать. То же, что direct,hash, то есть попытаться использовать соединения direct и hash (в таком порядке).

join_any_take_last_row

Изменяет поведение операций соединения со строгостью ANY.

Примечание

Этот параметр применяется только к операциям JOIN с таблицами табличного движка Join.

Возможные значения:

0 — если в правой таблице больше одной подходящей строки, соединяется только первая найденная.
1 — если в правой таблице больше одной подходящей строки, соединяется только последняя найденная.

См. также:

join_default_strictness

Устанавливает строгость по умолчанию для предложений JOIN.

Возможные значения:

ALL — Если в правой таблице есть несколько совпадающих строк, ClickHouse создаёт декартово произведение из совпадающих строк. Это обычное поведение JOIN в стандартном SQL.
ANY — Если в правой таблице есть несколько совпадающих строк, присоединяется только первая найденная. Если в правой таблице только одна совпадающая строка, результаты ANY и ALL совпадают.
ASOF — Для соединения последовательностей с неопределённым соответствием.
Empty string — Если в запросе не указано ALL или ANY, ClickHouse генерирует исключение.

join_on_disk_max_files_to_merge

Ограничивает количество файлов, допускаемых для параллельной сортировки в операциях MergeJoin, выполняемых на диске.

Чем больше значение настройки, тем больше используется RAM и тем меньше требуется дисковых операций ввода-вывода.

Возможные значения:

Любое положительное целое число, начиная с 2.

join_output_by_rowlist_perkey_rows_threshold

Нижняя граница среднего числа строк на ключ в правой таблице, при которой в хэш-соединении используется вывод в виде списка строк.

join_overflow_mode

Определяет, какое действие выполняет ClickHouse при достижении одного из следующих ограничений для JOIN:

Возможные значения:

THROW — ClickHouse выбрасывает исключение и прерывает операцию.
BREAK — ClickHouse прерывает операцию и не выбрасывает исключение.

Значение по умолчанию: THROW.

См. также

join_runtime_bloom_filter_bytes

Experimental feature. Learn more.

Размер в байтах фильтра Блума, используемого в качестве фильтра во время выполнения операции JOIN (см. настройку enable_join_runtime_filters).

join_runtime_bloom_filter_hash_functions

Experimental feature. Learn more.

Количество хеш-функций в фильтре Блума, используемом в качестве фильтра времени выполнения JOIN (см. настройку enable_join_runtime_filters).

join_runtime_filter_exact_values_limit

Experimental feature. Learn more.

Максимальное количество элементов в runtime-фильтре, которые хранятся в множестве в исходном виде; при превышении этого порога фильтр переключается на фильтр Блума.

join_to_sort_maximum_table_rows

Experimental feature. Learn more.

Максимальное количество строк в правой таблице для принятия решения, нужно ли пересортировывать правую таблицу по ключу при левом или внутреннем соединении.

join_to_sort_minimum_perkey_rows

Experimental feature. Learn more.

Нижняя граница среднего числа строк на один ключ в правой таблице, используемая для определения, требуется ли пересортировать правую таблицу по ключу при выполнении LEFT или INNER JOIN. Этот параметр гарантирует, что оптимизация не применяется для таблиц с разреженными ключами

join_use_nulls

Устанавливает тип поведения операции JOIN. При объединении таблиц могут появляться пустые ячейки. ClickHouse заполняет их по-разному в зависимости от этой настройки.

Возможные значения:

0 — пустые ячейки заполняются значением по умолчанию для соответствующего типа поля.
1 — JOIN ведёт себя так же, как в стандартном SQL. Тип соответствующего поля преобразуется в Nullable, а пустые ячейки заполняются значением NULL.

joined_block_split_single_row

Позволяет разбивать результат хеш-соединения на чанки по строкам, соответствующим одной строке из левой таблицы. Это может уменьшить использование памяти в случае строки с большим количеством совпадений в правой таблице, но может увеличить загрузку CPU. Обратите внимание, что обязательным условием для работы этой настройки является max_joined_block_size_rows != 0. Параметр max_joined_block_size_bytes в сочетании с этой настройкой полезен для предотвращения чрезмерного использования памяти в случае перекошенных данных, когда некоторые большие строки имеют много совпадений в правой таблице.

joined_subquery_requires_alias

Требует, чтобы присоединённые подзапросы и табличные функции имели псевдонимы для корректной квалификации имён.

kafka_disable_num_consumers_limit

Отключает ограничение на kafka_num_consumers, которое зависит от количества доступных ядер CPU.

kafka_max_wait_ms

Время ожидания в миллисекундах при чтении сообщений из Kafka перед повторной попыткой.

Возможные значения:

Положительное целое число.
0 — бесконечный таймаут.

См. также:

Apache Kafka

keeper_map_strict_mode

Включает дополнительные проверки при операциях с KeeperMap. Например, вызывает исключение при попытке вставить уже существующий ключ.

keeper_max_retries

Максимальное количество повторных попыток для общих операций Keeper

keeper_retry_initial_backoff_ms

Начальная задержка перед повторной попыткой для общих операций Keeper

keeper_retry_max_backoff_ms

Максимальный интервал ожидания (backoff) для общих операций Keeper

least_greatest_legacy_null_behavior

При включении этого параметра функции 'least' и 'greatest' возвращают NULL, если один из их аргументов равен NULL.

legacy_column_name_of_tuple_literal

Выводит все имена элементов больших литералов кортежей в именах соответствующих столбцов вместо хеша. Этот параметр существует только по причинам совместимости. Имеет смысл установить значение 'true' при поэтапном обновлении кластера с версии ниже 21.7 до более высокой.

lightweight_delete_mode

Режим внутреннего запроса обновления, который выполняется как часть легковесного удаления.

Возможные значения:

alter_update — выполнить запрос ALTER UPDATE, который создаёт тяжёлую мутацию.
lightweight_update — выполнить легковесное обновление, если возможно, в противном случае выполнить ALTER UPDATE.
lightweight_update_force — выполнить легковесное обновление, если возможно, в противном случае выбросить исключение.

lightweight_deletes_sync

То же, что и mutations_sync, но управляет только выполнением легковесных удалений (lightweight deletes).

Возможные значения:

Value	Description
`0`	Мутации выполняются асинхронно.
`1`	Запрос ожидает завершения легковесных удалений на текущем сервере.
`2`	Запрос ожидает завершения легковесных удалений на всех репликах (если они существуют).
`3`	Запрос ожидает завершения легковесных удалений только на активных репликах. Поддерживается только для `SharedMergeTree`. Для `ReplicatedMergeTree` ведёт себя так же, как `mutations_sync = 2`.

См. также

limit

Устанавливает максимальное количество строк, получаемых в результате выполнения запроса. Корректирует значение, заданное оператором LIMIT, таким образом, что лимит, указанный в запросе, не может превышать лимит, заданный этой настройкой.

Возможные значения:

0 — количество строк не ограничено.
Положительное целое число.

load_balancing

Определяет алгоритм выбора реплик, используемый при распределённой обработке запросов.

ClickHouse поддерживает следующие алгоритмы выбора реплик:

Случайный (по умолчанию)
Ближайшее имя хоста
Расстояние Левенштейна для имени хоста
По порядку
Первая или случайная
Циклический (round-robin)

См. также:

distributed_replica_max_ignored_errors

Случайный (по умолчанию)

load_balancing = random

Количество ошибок отслеживается для каждой реплики. Запрос отправляется на реплику с наименьшим числом ошибок, а если таких несколько — на любую из них. Недостатки: близость сервера не учитывается; если на репликах разные данные, вы также получите разные данные.

Имя ближайшего хоста

load_balancing = nearest_hostname

Количество ошибок подсчитывается для каждой реплики. Каждые 5 минут количество ошибок целочисленно делится на 2. Таким образом, число ошибок за последнее время вычисляется с использованием экспоненциального сглаживания. Если есть одна реплика с минимальным числом ошибок (т. е. ошибки недавно происходили на других репликах), запрос отправляется на неё. Если есть несколько реплик с одинаковым минимальным числом ошибок, запрос отправляется на реплику с именем хоста, которое наиболее похоже на имя хоста сервера в конфигурационном файле (по количеству отличающихся символов в одинаковых позициях, до минимальной длины обоих имён хостов).

Например, example01-01-1 и example01-01-2 отличаются в одной позиции, тогда как example01-01-1 и example01-02-2 различаются в двух местах. Этот метод может показаться примитивным, но он не требует внешних данных о сетевой топологии и не сравнивает IP-адреса, что было бы затруднительно для наших IPv6-адресов.

Таким образом, если есть эквивалентные реплики, предпочтение отдаётся ближайшей по имени. Также можно предположить, что при отправке запросов на один и тот же сервер, при отсутствии сбоев, распределённый запрос также будет попадать на те же серверы. Поэтому даже если на репликах размещены разные данные, запрос в большинстве случаев будет возвращать одинаковые результаты.

Расстояние Левенштейна между именами хостов

load_balancing = hostname_levenshtein_distance

Аналогична nearest_hostname, но сравнивает имя хоста по расстоянию Левенштейна. Например:

example-clickhouse-0-0 ample-clickhouse-0-0
1

example-clickhouse-0-0 example-clickhouse-1-10
2

example-clickhouse-0-0 example-clickhouse-12-0
3

По порядку

load_balancing = in_order

К репликам с одинаковым количеством ошибок обращаются в том же порядке, в котором они указаны в конфигурации. Этот метод подходит, когда вы точно знаете, какая реплика является предпочтительной.

Первый или случайный

load_balancing = first_or_random

Этот алгоритм выбирает первую реплику в наборе или случайную, если первая недоступна. Он эффективен в топологиях с перекрёстной репликацией, но практически бесполезен в других конфигурациях.

Алгоритм first_or_random решает проблему алгоритма in_order. При использовании in_order, если одна реплика выходит из строя, следующая получает двойную нагрузку, в то время как остальные реплики обрабатывают обычный объём трафика. При использовании алгоритма first_or_random нагрузка равномерно распределяется между оставшимися доступными репликами.

Можно явно задать, какая реплика считается первой, с помощью настройки load_balancing_first_offset. Это даёт больше контроля над перераспределением нагрузки запросов между репликами.

Раунд-робин

load_balancing = round_robin

Этот алгоритм использует политику round-robin между репликами с одинаковым количеством ошибок (при этом учитываются только запросы с политикой round_robin).

load_balancing_first_offset

Реплика, на которую предпочтительнее отправлять запрос при использовании стратегии балансировки нагрузки FIRST_OR_RANDOM.

load_marks_asynchronously

Асинхронная загрузка отметок MergeTree

local_filesystem_read_method

Метод чтения данных из локальной файловой системы. Возможные значения: read, pread, mmap, io_uring, pread_threadpool.

Метод io_uring является экспериментальным и не работает для таблиц Log, TinyLog, StripeLog, File, Set и Join, а также других таблиц с файлами, поддерживающими добавление данных, при одновременных операциях чтения и записи. Если вы читали различные статьи об io_uring в Интернете, не поддавайтесь впечатлению от них. Это не лучший метод чтения файлов, за исключением случаев большого количества мелких IO‑запросов, что не характерно для ClickHouse. Нет причин включать io_uring.

local_filesystem_read_prefetch

Включает предварительную выборку при чтении данных из локальной файловой системы.

lock_acquire_timeout

Определяет, сколько секунд запрос на блокировку ожидает до того, как завершится с ошибкой.

Таймаут блокировки используется для предотвращения взаимных блокировок при выполнении операций чтения/записи с таблицами. Когда таймаут истекает и запрос на блокировку завершается с ошибкой, сервер ClickHouse выбрасывает исключение "Locking attempt timed out! Possible deadlock avoided. Client should retry." с кодом ошибки DEADLOCK_AVOIDED.

Возможные значения:

Положительное целое число (в секундах).
0 — таймаут блокировки отключен.

log_comment

Задает значение для поля log_comment таблицы system.query_log и текст комментария в журнале сервера.

Может использоваться для улучшения читаемости журналов сервера. Кроме того, позволяет выбрать запросы, относящиеся к тесту, из system.query_log после выполнения clickhouse-test.

Возможные значения:

Любая строка длиной не более max_query_size. Если max_query_size превышен, сервер выбрасывает исключение.

Пример

Запрос:

SET log_comment = 'log_comment test', log_queries = 1;
SELECT 1;
SYSTEM FLUSH LOGS;
SELECT type, query FROM system.query_log WHERE log_comment = 'log_comment test' AND event_date >= yesterday() ORDER BY event_time DESC LIMIT 2;

Результат:

┌─type────────┬─query─────┐
│ QueryStart  │ SELECT 1; │
│ QueryFinish │ SELECT 1; │
└─────────────┴───────────┘

log_formatted_queries

Включает запись форматированных запросов в системную таблицу system.query_log (заполняет столбец formatted_query в system.query_log).

Возможные значения:

0 — Форматированные запросы не записываются в системную таблицу.
1 — Форматированные запросы записываются в системную таблицу.

log_processors_profiles

Записывает время, которое процессор затратил на выполнение или ожидание данных, в таблицу system.processors_profile_log.

См. также:

log_profile_events

Записывать статистику производительности запросов в журналы query_log, query_thread_log и query_views_log.

log_queries

Настройка логирования запросов.

Запросы, отправленные в ClickHouse при включённой этой настройке, записываются в лог в соответствии с правилами параметра конфигурации сервера query_log.

Пример:

log_queries=1

log_queries_cut_to_length

Если длина запроса превышает заданный порог (в байтах), запрос усекается при записи в журнал запросов. Также ограничивается длина выводимого текста запроса в обычном текстовом логе.

log_queries_min_query_duration_ms

Если настройка имеет ненулевое значение, запросы, которые выполняются быстрее указанного порога, не будут записываться в лог (можно рассматривать это как аналог long_query_time для MySQL Slow Query Log). Это означает, что вы не найдёте такие запросы в следующих таблицах:

system.query_log
system.query_thread_log

Только запросы со следующими типами попадут в лог:

QUERY_FINISH
EXCEPTION_WHILE_PROCESSING
Тип: миллисекунды
Значение по умолчанию: 0 (любой запрос)

log_queries_min_type

Минимальный тип записей в query_log.

Возможные значения:

QUERY_START (=1)
QUERY_FINISH (=2)
EXCEPTION_BEFORE_START (=3)
EXCEPTION_WHILE_PROCESSING (=4)

Может использоваться для ограничения того, какие записи будут попадать в query_log. Например, если вас интересуют только ошибки, можно использовать EXCEPTION_WHILE_PROCESSING:

log_queries_min_type='EXCEPTION_WHILE_PROCESSING'

log_queries_probability

Позволяет записывать в системные таблицы query_log, query_thread_log и query_views_log только часть запросов, выбранных случайным образом с указанной вероятностью. Это помогает снизить нагрузку при большом количестве запросов в секунду.

Возможные значения:

0 — Запросы не записываются в системные таблицы.
Положительное число с плавающей запятой в диапазоне [0..1]. Например, если значение настройки равно 0.5, примерно половина запросов записывается в системные таблицы.
1 — Все запросы записываются в системные таблицы.

log_query_settings

Записывает параметры запроса в query_log и лог спанов OpenTelemetry.

log_query_threads

Настройка логирования потоков запросов.

Потоки запросов записываются в таблицу system.query_thread_log. Этот параметр действует только, если log_queries имеет значение true. Потоки запросов, выполняемых ClickHouse при такой настройке, записываются в лог в соответствии с правилами серверного параметра конфигурации query_thread_log.

Возможные значения:

0 — Отключено.
1 — Включено.

Пример

log_query_threads=1

log_query_views

Настройка логирования представлений запросов.

Когда запрос, выполняемый ClickHouse при включённой этой настройке, имеет связанные представления (материализованные или live-представления), они записываются в журнал, задаваемый параметром конфигурации сервера query_views_log.

Пример:

log_query_views=1

low_cardinality_allow_in_native_format

Разрешает или запрещает использование типа данных LowCardinality с форматом Native.

Если использование LowCardinality ограничено, сервер ClickHouse преобразует столбцы типа LowCardinality в обычные для запросов SELECT и преобразует обычные столбцы в столбцы типа LowCardinality для запросов INSERT.

Эта настройка требуется в основном для сторонних клиентов, которые не поддерживают тип данных LowCardinality.

Возможные значения:

1 — использование LowCardinality не ограничено.
0 — использование LowCardinality ограничено.

low_cardinality_max_dictionary_size

Устанавливает максимальный размер (в строках) общего глобального словаря для типа данных LowCardinality, который может быть записан в файловую систему хранилища. Этот параметр предотвращает проблемы с ОЗУ в случае неограниченного роста словаря. Все данные, которые не удаётся закодировать из‑за ограничения на максимальный размер словаря, ClickHouse записывает обычным способом.

Возможные значения:

Любое положительное целое число.

low_cardinality_use_single_dictionary_for_part

Включает или отключает использование одного словаря для части данных.

По умолчанию сервер ClickHouse отслеживает размеры словарей, и если словарь переполняется, сервер начинает записывать следующий. Чтобы запретить создание нескольких словарей, установите low_cardinality_use_single_dictionary_for_part = 1.

Возможные значения:

1 — Создание нескольких словарей для части данных запрещено.
0 — Создание нескольких словарей для части данных не запрещено.

low_priority_query_wait_time_ms

Beta feature. Learn more.

Когда используется механизм приоритизации запросов (см. настройку priority), низкоприоритетные запросы ожидают завершения запросов с более высоким приоритетом. Этот параметр определяет время ожидания.

make_distributed_plan

Experimental feature. Learn more.

Создаёт распределённый план выполнения запроса.

materialize_skip_indexes_on_insert

Определяет, создаются и сохраняются ли пропускающие индексы при выполнении запросов INSERT. Если параметр отключен, пропускающие индексы будут создаваться и сохраняться только во время слияний или при явном вызове MATERIALIZE INDEX.

См. также exclude_materialize_skip_indexes_on_insert.

materialize_statistics_on_insert

Если включено, операции INSERT вычисляют и материализуют статистику. Если отключено, статистика будет вычисляться и сохраняться во время слияний или по явной команде MATERIALIZE STATISTICS.

materialize_ttl_after_modify

Применять TTL к старым данным после выполнения запроса ALTER MODIFY TTL

materialized_views_ignore_errors

Позволяет игнорировать ошибки в MATERIALIZED VIEW и передавать исходный блок в таблицу независимо от материализованных представлений

materialized_views_squash_parallel_inserts

Объединяет вставки из одного запроса INSERT в таблицу назначения материализованного представления, выполняемые параллельно, чтобы уменьшить количество создаваемых частей. Если установлено в значение false и включена настройка parallel_view_processing, запрос INSERT будет создавать отдельную часть в таблице назначения для каждого max_insert_thread.

max_analyze_depth

Максимальное количество операций анализа, выполняемых интерпретатором.

max_ast_depth

Максимальная глубина вложенности синтаксического дерева запроса. При превышении этого значения выбрасывается исключение.

Примечание

В данный момент это ограничение не проверяется во время разбора (парсинга), а только после разбора запроса. Это означает, что слишком глубокое синтаксическое дерево может быть создано при разборе, но запрос завершится с ошибкой.

max_ast_elements

Максимальное количество элементов в синтаксическом дереве запроса. При превышении выбрасывается исключение.

Примечание

На данный момент это не проверяется в процессе разбора, а только после него. Это означает, что в процессе разбора может быть построено слишком глубокое синтаксическое дерево, но выполнение запроса завершится ошибкой.

max_autoincrement_series

Ограничение на количество последовательностей, создаваемых функцией generateSerialID.

Поскольку каждая последовательность представляет собой узел в Keeper, рекомендуется иметь не более пары миллионов таких узлов.

max_backup_bandwidth

Максимальная скорость чтения данных для конкретной резервной копии на сервере, в байтах в секунду. Значение 0 означает отсутствие ограничений.

max_block_size

В ClickHouse данные обрабатываются блоками, которые представляют собой наборы частей столбцов. Внутренние циклы обработки для одного блока эффективны, но при обработке каждого блока возникают заметные накладные расходы.

Параметр max_block_size указывает рекомендуемое максимальное количество строк, включаемых в один блок при загрузке данных из таблиц. Блоки размера max_block_size загружаются из таблицы не всегда: если ClickHouse считает, что нужно извлечь меньше данных, обрабатывается блок меньшего размера.

Размер блока не должен быть слишком маленьким, чтобы избежать заметных накладных расходов при обработке каждого блока. Он также не должен быть слишком большим, чтобы запросы с оператором LIMIT выполнялись быстро уже после обработки первого блока. При установке max_block_size следует стремиться к тому, чтобы не расходовать слишком много памяти при извлечении большого числа столбцов в нескольких потоках и при этом сохранять хотя бы некоторую локальность кэша.

max_bytes_before_external_group_by

Значение по умолчанию в Cloud: половина объёма памяти на реплику.

Включает или отключает выполнение GROUP BY во внешней памяти. (См. GROUP BY во внешней памяти)

Возможные значения:

Максимальный объём ОЗУ (в байтах), который может быть использован одной операцией GROUP BY.
0 — GROUP BY во внешней памяти отключён.

Примечание

Если использование памяти при операциях GROUP BY превышает этот порог в байтах, активируется режим «внешней агрегации» (выгрузка данных на диск).

Рекомендуемое значение — половина доступной системной памяти.

max_bytes_before_external_sort

Значение по умолчанию в облаке: половина объёма памяти на реплику.

Включает или отключает выполнение ORDER BY с использованием внешней памяти. См. ORDER BY — детали реализации. Если использование памяти во время операции ORDER BY превышает этот порог в байтах, активируется режим «внешней сортировки» (сброс данных на диск).

Возможные значения:

Максимальный объём ОЗУ (в байтах), который может быть использован одной операцией ORDER BY. Рекомендуемое значение — половина доступной системной памяти.
0 — ORDER BY с использованием внешней памяти отключён.

max_bytes_before_remerge_sort

В случае использования ORDER BY с LIMIT, когда потребление памяти превышает заданный порог, выполняются дополнительные этапы слияния блоков перед финальным слиянием, чтобы сохранить только первые LIMIT строк.

max_bytes_in_distinct

Максимальный объём состояния в памяти (в несжатых байтах), который используется хеш-таблицей при использовании DISTINCT.

max_bytes_in_join

Максимальный размер в байтах хеш-таблицы, используемой при объединении таблиц.

Этот параметр применяется к операциям SELECT ... JOIN и к движку таблиц Join.

Если запрос содержит оператор JOIN, ClickHouse проверяет эту настройку для каждого промежуточного результата.

Когда достигается лимит, ClickHouse может выполнить различные действия. Используйте настройку join_overflow_mode, чтобы выбрать действие.

Возможные значения:

Положительное целое число.
0 — контроль памяти отключен.

max_bytes_in_set

Максимальное количество байт (несжатых данных), используемых множеством в операторе IN, сформированным подзапросом.

max_bytes_ratio_before_external_group_by

Доля доступной памяти, разрешённая для операций GROUP BY. После достижения этого порога для агрегации используется внешняя память.

Например, если задать 0.6, GROUP BY сможет использовать 60% доступной памяти (для сервера/пользователя/слияний) в начале выполнения, после чего начнёт использовать внешнюю агрегацию.

max_bytes_ratio_before_external_sort

Доля доступной памяти, которую оператор ORDER BY может использовать. После достижения этого порога применяется внешняя сортировка.

Например, если установить 0.6, ORDER BY сможет использовать 60% доступной памяти (для сервера/пользователя/слияний) в начале выполнения, после чего будет использоваться внешняя сортировка.

Обратите внимание, что max_bytes_before_external_sort по‑прежнему учитывается: сброс на диск будет выполняться только если блок сортировки превышает max_bytes_before_external_sort.

max_bytes_to_read

Максимальное количество байт несжатых данных, которое можно прочитать из таблицы при выполнении запроса. Ограничение проверяется для каждого обрабатываемого фрагмента данных, применяется только к самому глубокому табличному выражению и при чтении с удалённого сервера проверяется только на этом удалённом сервере.

max_bytes_to_read_leaf

Максимальное количество байт (несжатых данных), которое может быть прочитано из локальной таблицы на листовом узле при выполнении распределённого запроса. Хотя распределённые запросы могут отправлять несколько подзапросов к каждому шарду (листу), этот лимит будет проверяться только на этапе чтения на листовых узлах и будет игнорироваться на этапе слияния результатов на корневом узле.

Например, кластер состоит из 2 шардов, и каждый шард содержит таблицу со 100 байтами данных. Распределённый запрос, который должен прочитать все данные из обеих таблиц с настройкой max_bytes_to_read=150, завершится с ошибкой, так как в сумме будет 200 байт. Запрос с max_bytes_to_read_leaf=150 будет выполнен успешно, поскольку листовые узлы прочитают максимум по 100 байт.

Ограничение проверяется для каждого обрабатываемого блока данных.

Примечание

Этот параметр работает нестабильно при prefer_localhost_replica=1.

max_bytes_to_sort

Максимальное количество байт перед сортировкой. Если для операции ORDER BY требуется обработать объём несжатых данных, превышающий указанное значение, поведение будет определяться параметром sort_overflow_mode, который по умолчанию имеет значение throw.

max_bytes_to_transfer

Максимальное количество байт (несжатых данных), которое может быть передано на удалённый сервер или сохранено во временной таблице при выполнении оператора GLOBAL IN/JOIN.

max_columns_to_read

Максимальное количество столбцов, которое можно прочитать из таблицы в одном запросе. Если запросу требуется прочитать больше столбцов, чем указано, будет выброшено исключение.

Совет

Этот параметр полезен для предотвращения чрезмерно сложных запросов.

Значение 0 означает отсутствие ограничений.

max_compress_block_size

Максимальный размер блоков несжатых данных перед сжатием при записи в таблицу. По умолчанию — 1 048 576 (1 MiB). Указание меньшего размера блока, как правило, приводит к незначительному снижению коэффициента сжатия, небольшому увеличению скорости сжатия и распаковки за счёт локальности кэша, а также к уменьшению потребления памяти.

Примечание

Это параметр для опытных пользователей, и вам не следует изменять его, если вы только начинаете работать с ClickHouse.

Не путайте блоки для сжатия (фрагмент памяти, состоящий из байтов) с блоками для обработки запросов (набор строк из таблицы).

max_concurrent_queries_for_all_users

Генерирует исключение, если значение этой настройки меньше либо равно текущему количеству одновременно обрабатываемых запросов.

Пример: max_concurrent_queries_for_all_users можно установить равным 99 для всех пользователей, а администратор базы данных может установить его равным 100 для себя, чтобы запускать запросы для расследования даже при перегрузке сервера.

Изменение настройки для одного запроса или пользователя не влияет на другие запросы.

Возможные значения:

Положительное целое число.
0 — без ограничения.

Пример

<max_concurrent_queries_for_all_users>99</max_concurrent_queries_for_all_users>

См. также

max_concurrent_queries

max_concurrent_queries_for_user

Максимальное количество одновременно обрабатываемых запросов для одного пользователя.

Возможные значения:

Положительное целое число.
0 — без ограничений.

Пример

<max_concurrent_queries_for_user>5</max_concurrent_queries_for_user>

max_distributed_connections

Максимальное количество одновременных соединений с удалёнными серверами для распределённой обработки одного запроса к одной таблице движка Distributed. Рекомендуем задавать значение не меньше числа серверов в кластере.

Следующие параметры используются только при создании таблиц движка Distributed (и при запуске сервера), поэтому нет смысла изменять их в процессе работы.

max_distributed_depth

Ограничивает максимальную глубину рекурсивных запросов для таблиц Distributed.

При превышении этого значения сервер генерирует исключение.

Возможные значения:

Положительное целое число.
0 — Неограниченная глубина.

max_download_buffer_size

Максимальный размер буфера для параллельной загрузки (например, для URL-движка) для каждого потока.

max_download_threads

Максимальное количество потоков для скачивания данных (например, для URL-движка).

max_estimated_execution_time

Максимальное оценочное время выполнения запроса в секундах. Проверяется для каждого блока данных, когда истекает timeout_before_checking_execution_speed.

max_execution_speed

Максимальное количество строк, обрабатываемых в секунду. Проверка выполняется для каждого блока данных после истечения timeout_before_checking_execution_speed. Если скорость выполнения слишком высока, она будет снижена.

max_execution_speed_bytes

Максимальное количество байт, обрабатываемых в секунду. Проверяется на каждом блоке данных, когда timeout_before_checking_execution_speed истекает. Если скорость выполнения слишком высока, она будет ограничена.

max_execution_time

Максимальное время выполнения запроса в секундах.

Параметр max_execution_time может быть немного сложен для понимания. Он работает на основе интерполяции относительно текущей скорости выполнения запроса (это поведение контролируется настройкой timeout_before_checking_execution_speed).

ClickHouse прерывает запрос, если прогнозируемое время выполнения превышает указанное значение max_execution_time. По умолчанию параметр timeout_before_checking_execution_speed равен 10 секундам. Это означает, что после 10 секунд выполнения запроса ClickHouse начинает оценивать общее время выполнения. Если, например, max_execution_time установлен на 3600 секунд (1 час), ClickHouse завершит запрос, если оценочное время превысит этот лимит в 3600 секунд. Если установить timeout_before_checking_execution_speed в 0, ClickHouse будет использовать время по системным часам как основу для max_execution_time.

Если время выполнения запроса превышает указанное количество секунд, поведение будет определяться значением параметра timeout_overflow_mode, который по умолчанию установлен в throw.

Примечание

Тайм-аут проверяется, и запрос может быть остановлен только в специально отведённых местах во время обработки данных. В настоящее время он не может быть остановлен во время слияния состояний агрегации или во время анализа запроса, и фактическое время выполнения будет больше значения этой настройки.

max_execution_time_leaf

Семантически аналогичен max_execution_time, но применяется только к листовым узлам для распределённых или удалённых запросов.

Например, если мы хотим ограничить время выполнения на листовом узле до 10s, но не ограничивать время на начальном узле, вместо использования max_execution_time в настройках вложенного подзапроса:

SELECT count()
FROM cluster(cluster, view(SELECT * FROM t SETTINGS max_execution_time = 10));

Мы можем использовать max_execution_time_leaf как настройку запроса:

SELECT count()
FROM cluster(cluster, view(SELECT * FROM t)) SETTINGS max_execution_time_leaf = 10;

max_expanded_ast_elements

Максимальный размер синтаксического дерева запроса в узлах после раскрытия псевдонимов и звёздочки.

max_fetch_partition_retries_count

Число повторных попыток при получении раздела с другого хоста.

max_final_threads

Устанавливает максимальное количество параллельных потоков для фазы чтения данных запроса SELECT с модификатором FINAL.

Возможные значения:

Положительное целое число.
0 или 1 — отключено. Запросы SELECT выполняются в одном потоке.

max_http_get_redirects

Максимальное допустимое число перенаправлений (hops) для HTTP GET. Обеспечивает дополнительные меры безопасности, не позволяя вредоносному серверу перенаправлять ваши запросы на непредвиденные сервисы.\n\nТакая ситуация возможна, когда внешний сервер перенаправляет на другой адрес, но этот адрес выглядит как внутренний для инфраструктуры компании. В этом случае, отправляя HTTP-запрос на внутренний сервер, вы можете обратиться к внутреннему API из внутренней сети, обходя аутентификацию, или даже выполнять запросы к другим сервисам, таким как Redis или Memcached. Если у вас нет внутренней инфраструктуры (включая что-либо, запущенное на вашем localhost), или вы доверяете серверу, перенаправления можно безопасно разрешить. Имейте в виду, что если URL использует HTTP вместо HTTPS, вам придется доверять не только удаленному серверу, но и вашему провайдеру (ISP), а также всем сетям по пути следования трафика.

max_hyperscan_regexp_length

Определяет максимальную длину каждого регулярного выражения в функциях многократного сопоставления hyperscan.

Возможные значения:

Положительное целое число.
0 — длина не ограничена.

Пример

Запрос:

SELECT multiMatchAny('abcd', ['ab','bcd','c','d']) SETTINGS max_hyperscan_regexp_length = 3;

Результат:

┌─multiMatchAny('abcd', ['ab', 'bcd', 'c', 'd'])─┐
│                                              1 │
└────────────────────────────────────────────────┘

Запрос:

SELECT multiMatchAny('abcd', ['ab','bcd','c','d']) SETTINGS max_hyperscan_regexp_length = 2;

Результат:

Исключение: Длина регулярного выражения слишком велика.

См. также

max_hyperscan_regexp_total_length

max_hyperscan_regexp_total_length

Устанавливает максимальную суммарную длину всех регулярных выражений в каждой функции Hyperscan множественного сопоставления.

Возможные значения:

Положительное целое число.
0 — длина не ограничена.

Пример

Запрос:

SELECT multiMatchAny('abcd', ['a','b','c','d']) SETTINGS max_hyperscan_regexp_total_length = 5;

Результат:

┌─multiMatchAny('abcd', ['a', 'b', 'c', 'd'])─┐
│                                           1 │
└─────────────────────────────────────────────┘

Запрос:

SELECT multiMatchAny('abcd', ['ab','bc','c','d']) SETTINGS max_hyperscan_regexp_total_length = 5;

Результат:

Исключение: Общая длина регулярных выражений слишком велика.

См. также

max_hyperscan_regexp_length

max_insert_block_size

Размер блоков (по числу строк), которые формируются для вставки в таблицу. Этот параметр применяется только в случаях, когда блоки формирует сервер. Например, при выполнении INSERT через HTTP-интерфейс сервер разбирает формат данных и формирует блоки указанного размера. Но при использовании clickhouse-client клиент разбирает данные сам, и настройка max_insert_block_size на сервере не влияет на размер вставляемых блоков. Настройка также не применяется при использовании INSERT SELECT, поскольку данные вставляются теми же блоками, которые формируются после SELECT.

Значение по умолчанию немного больше, чем max_block_size. Причина в том, что некоторые движки таблиц (*MergeTree) формируют часть данных (data part) на диске для каждого вставленного блока, и эта часть является достаточно крупной сущностью. Аналогично, таблицы *MergeTree сортируют данные при вставке, и достаточно большой размер блока позволяет отсортировать больше данных в оперативной памяти.

max_insert_delayed_streams_for_parallel_write

Максимальное количество потоков (столбцов), для которых откладывается финальная запись части. По умолчанию — автоматически (100, если используемое хранилище поддерживает параллельную запись, например S3, и отключено в противном случае).

max_insert_threads

Максимальное количество потоков для выполнения запроса INSERT SELECT.

Возможные значения:

0 (или 1) — выполнение INSERT SELECT без параллелизма.
Положительное целое число, больше 1.

Значение по умолчанию в ClickHouse Cloud:

1 для узлов с 8 GiB памяти
2 для узлов с 16 GiB памяти
4 для более крупных узлов

Параллельный INSERT SELECT имеет эффект только в том случае, если часть SELECT выполняется параллельно, см. настройку max_threads. Более высокие значения приводят к большему потреблению памяти.

max_joined_block_size_bytes

Максимальный размер блока в байтах для результата операции JOIN (если алгоритм объединения поддерживает его). Значение 0 означает отсутствие ограничения.

max_joined_block_size_rows

Максимальный размер блока для результата JOIN (если алгоритм JOIN поддерживает это). 0 означает отсутствие ограничений.

max_limit_for_vector_search_queries

Запросы SELECT с LIMIT, превышающим значение этой настройки, не могут использовать индексы векторного сходства. Это помогает предотвратить переполнение памяти в индексах векторного сходства.

max_local_read_bandwidth

Максимальная скорость локального чтения в байтах в секунду.

max_local_write_bandwidth

Максимальная скорость локальной записи в байтах в секунду.

max_memory_usage

Значение по умолчанию в Cloud: зависит от объёма ОЗУ на реплике.

Максимальное количество ОЗУ, используемое для выполнения запроса на одном сервере. Значение 0 означает отсутствие ограничения.

Этот параметр не учитывает объём доступной памяти или общий объём памяти на машине. Ограничение применяется к одному запросу на одном сервере.

Вы можете использовать SHOW PROCESSLIST, чтобы увидеть текущее использование памяти для каждого запроса. Пиковое потребление памяти отслеживается для каждого запроса и записывается в лог.

Использование памяти отслеживается не полностью для состояний следующих агрегатных функций с аргументами типов String и Array:

min
max
any
anyLast
argMin
argMax

Потребление памяти также ограничивается параметрами max_memory_usage_for_user и max_server_memory_usage.

max_memory_usage_for_user

Максимальный объем оперативной памяти, используемой для выполнения запросов пользователя на одном сервере. Ноль означает отсутствие ограничений.

По умолчанию объем не ограничен (max_memory_usage_for_user = 0).

Также см. описание max_memory_usage.

Например, если вы хотите установить max_memory_usage_for_user в 1000 байт для пользователя с именем clickhouse_read, вы можете использовать следующий оператор

ALTER USER clickhouse_read SETTINGS max_memory_usage_for_user = 1000;

Вы можете убедиться, что всё работает корректно, выйдя из клиента, снова войдя в него, а затем вызвав функцию getSetting:

SELECT getSetting('max_memory_usage_for_user');

max_network_bandwidth

Ограничивает скорость обмена данными по сети в байтах в секунду. Этот параметр применяется ко всем запросам.

Возможные значения:

Положительное целое число.
0 — ограничение пропускной способности отключено.

max_network_bandwidth_for_all_users

Ограничивает скорость передачи данных по сети в байтах в секунду. Этот параметр применяется ко всем одновременно выполняемым запросам на сервере.

Возможные значения:

Положительное целое число.
0 — управление скоростью передачи данных отключено.

max_network_bandwidth_for_user

Ограничивает скорость обмена данными по сети в байтах в секунду. Этот параметр применяется ко всем одновременно выполняющимся запросам данного пользователя.

Возможные значения:

Положительное целое число.
0 — контроль скорости передачи данных отключен.

max_network_bytes

Ограничивает объем данных (в байтах), принимаемых или передаваемых по сети при выполнении запроса. Этот параметр применяется к каждому отдельному запросу.

Возможные значения:

Положительное целое число.
0 — ограничение на объем данных отключено.

max_number_of_partitions_for_independent_aggregation

Максимальное количество партиций таблицы, к которым применяется оптимизация

max_os_cpu_wait_time_ratio_to_throw

Максимальное соотношение между временем ожидания CPU в ОС (метрика OSCPUWaitMicroseconds) и временем занятости CPU (метрика OSCPUVirtualTimeMicroseconds), при превышении которого запросы могут отклоняться. Для вычисления вероятности используется линейная интерполяция между минимальным и максимальным значениями этого соотношения; при максимальном значении вероятность равна 1.

max_parallel_replicas

Максимальное количество реплик для каждого шарда при выполнении запроса.

Возможные значения:

Положительное целое число.

Дополнительная информация

Этот параметр может давать разные результаты в зависимости от используемых настроек.

Примечание

Эта настройка приведет к некорректным результатам, если задействованы JOIN или подзапросы и не все таблицы удовлетворяют определенным требованиям. Дополнительные сведения см. в разделе Distributed Subqueries and max_parallel_replicas.

Параллельная обработка с использованием ключа выборки `SAMPLE`

Запрос может выполняться быстрее, если его выполнять параллельно на нескольких серверах. Однако производительность запроса может ухудшиться в следующих случаях:

Положение ключа выборки в ключе партиционирования не позволяет эффективно выполнять сканирование диапазонов.
Добавление ключа выборки в таблицу делает фильтрацию по другим столбцам менее эффективной.
Ключ выборки представляет собой выражение, вычисление которого требует значительных ресурсов.
Распределение задержек в кластере имеет «длинный хвост», поэтому опрос большего числа серверов увеличивает суммарную задержку выполнения запроса.

Параллельная обработка с использованием parallel_replicas_custom_key

Эта настройка полезна для любой реплицируемой таблицы.

max_parser_backtracks

Максимальное число возвратов парсера (сколько раз он пробует разные варианты при рекурсивном нисходящем разборе).

max_parser_depth

Ограничивает максимальную глубину рекурсии в рекурсивном нисходящем парсере. Позволяет управлять размером стека.

Возможные значения:

Положительное целое число.
0 — глубина рекурсии не ограничена.

max_parsing_threads

Максимальное количество потоков для парсинга данных во входных форматах, которые поддерживают параллельный парсинг. По умолчанию значение определяется автоматически.

max_partition_size_to_drop

Ограничение на размер партиций, которые можно удалять во время выполнения запроса. Значение 0 означает, что вы можете удалять партиции без каких-либо ограничений.

Значение по умолчанию в облаке: 1 ТБ.

Примечание

Эта настройка запроса переопределяет эквивалентную серверную настройку, см. max_partition_size_to_drop

max_partitions_per_insert_block

Ограничивает максимальное количество партиций в одном вставляемом блоке; если блок содержит слишком много партиций, будет выброшено исключение.

Положительное целое число.
0 — неограниченное количество партиций.

Подробнее

При вставке данных ClickHouse вычисляет количество партиций во вставляемом блоке. Если количество партиций превышает max_partitions_per_insert_block, ClickHouse либо записывает предупреждение в журнал, либо выбрасывает исключение в зависимости от значения throw_on_max_partitions_per_insert_block. Текст исключения:

"Too many partitions for a single INSERT block (partitions_count partitions, limit is " + toString(max_partitions) + "). The limit is controlled by the 'max_partitions_per_insert_block' setting. A large number of partitions is a common misconception. It will lead to severe negative performance impact, including slow server startup, slow INSERT queries and slow SELECT queries. Recommended total number of partitions for a table is under 1000..10000. Please note, that partitioning is not intended to speed up SELECT queries (ORDER BY key is sufficient to make range queries fast). Partitions are intended for data manipulation (DROP PARTITION, etc)."

Примечание

Этот параметр является защитным порогом, поскольку использование большого количества партиций — распространённое заблуждение.

max_partitions_to_read

Ограничивает максимальное число партиций, к которым можно получить доступ в одном запросе.

Значение настройки, заданное при создании таблицы, может быть переопределено настройкой на уровне запроса.

Возможные значения:

Положительное целое число
-1 — без ограничений (по умолчанию)

Примечание

Вы также можете указать настройку MergeTree max_partitions_to_read в настройках таблицы.

max_parts_to_move

Ограничивает количество частей, которые можно переместить в одном запросе. Значение 0 — без ограничений.

max_projection_rows_to_use_projection_index

Если количество строк, которое нужно прочитать из индекса проекции, меньше или равно этому пороговому значению, ClickHouse попытается применить индекс проекции во время выполнения запроса.

max_query_size

Максимальное число байт в строке запроса, которую анализирует SQL-парсер. Данные в клаузе VALUES операторов INSERT обрабатываются отдельным потоковым парсером (который использует O(1) ОЗУ) и не подпадают под это ограничение.

Примечание

max_query_size нельзя задать внутри SQL-запроса (например, SELECT now() SETTINGS max_query_size=10000), потому что ClickHouse необходимо выделить буфер для разбора запроса, и размер этого буфера определяется настройкой max_query_size, которая должна быть настроена до выполнения запроса.

max_read_buffer_size

Максимальный размер буфера при чтении из файловой системы.

max_read_buffer_size_local_fs

Максимальный размер буфера для чтения из локальной файловой системы. Если установлено значение 0, будет использоваться max_read_buffer_size.

max_read_buffer_size_remote_fs

Максимальный размер буфера для чтения из удалённой файловой системы. Если установлено значение 0, будет использоваться max_read_buffer_size.

max_recursive_cte_evaluation_depth

Максимальная глубина вычисления рекурсивных CTE

max_remote_read_network_bandwidth

Максимальная скорость сетевого обмена данными при чтении, в байтах в секунду.

max_remote_write_network_bandwidth

Максимальная скорость обмена данными по сети в байтах в секунду при записи.

max_replica_delay_for_distributed_queries

Исключает отстающие реплики из выполнения распределённых запросов. См. Репликация.

Задаёт время в секундах. Если отставание реплики больше либо равно заданному значению, эта реплика не используется.

Возможные значения:

Положительное целое число.
0 — отставание реплик не проверяется.

Чтобы предотвратить использование любой реплики с ненулевым отставанием, установите этот параметр в 1.

Используется при выполнении SELECT из распределённой таблицы, которая ссылается на реплицируемые таблицы.

max_result_bytes

Ограничивает размер результата в байтах (несжатый). Запрос будет остановлен после обработки блока данных, если порог достигнут, но последний блок результата обрезан не будет, поэтому размер результата может быть больше порога.

Особенности

При вычислении этого порога учитывается размер результата в памяти. Даже если размер результата небольшой, он может ссылаться на более крупные структуры данных в памяти, представляющие словари столбцов LowCardinality и арены столбцов AggregateFunction, поэтому порог может быть превышен, несмотря на небольшой размер результата.

Примечание

Настройка достаточно низкоуровневая и должна использоваться с осторожностью

max_result_rows

Значение по умолчанию в облаке: 0.

Ограничивает количество строк в результате. Ограничение также проверяется для подзапросов и на удалённых серверах при выполнении фрагментов распределённого запроса. Если значение равно 0, ограничение не применяется.

Запрос будет остановлен после обработки блока данных при достижении порогового значения, но последний блок результата не будет усечён, поэтому размер результата может быть больше порога.

max_reverse_dictionary_lookup_cache_size_bytes

Максимальный размер в байтах для кэша обратного поиска по словарю для каждого запроса, используемого функцией dictGetKeys. Кэш хранит сериализованные кортежи ключей для каждого значения атрибута, чтобы избежать повторного сканирования словаря в рамках одного и того же запроса. При достижении лимита элементы вытесняются по принципу LRU. Установите значение 0, чтобы отключить кэширование.

max_rows_in_distinct

Максимальное количество уникальных строк при использовании DISTINCT.

max_rows_in_join

Ограничивает количество строк в хеш-таблице, которая используется при соединении таблиц.

Эта настройка применяется к операциям SELECT ... JOIN и к движку таблиц Join.

Если запрос содержит несколько соединений, ClickHouse проверяет эту настройку для каждого промежуточного результата.

При достижении лимита ClickHouse может выполнять различные действия. Используйте настройку join_overflow_mode, чтобы выбрать нужное действие.

Возможные значения:

Положительное целое число.
0 — неограниченное количество строк.

max_rows_in_set

Максимальное количество строк в наборе значений для выражения IN, сформированном подзапросом.

max_rows_in_set_to_optimize_join

Максимальный размер множества, используемого для предварительной фильтрации присоединяемых таблиц по наборам строк друг друга перед выполнением соединения.

Возможные значения:

0 — отключить.
Любое положительное целое число.

max_rows_to_group_by

Максимальное количество уникальных ключей, полученных при агрегации. Этот параметр позволяет ограничить потребление памяти при агрегации.

Если при выполнении GROUP BY получается больше строк (уникальных ключей GROUP BY), чем указано в этой настройке, поведение будет определяться настройкой group_by_overflow_mode, которая по умолчанию имеет значение throw, но также может быть переключена в режим приблизительного GROUP BY.

max_rows_to_read

Максимальное количество строк, которые могут быть прочитаны из таблицы при выполнении запроса. Ограничение проверяется для каждого обрабатываемого блока данных, применяется только к самому вложенному табличному выражению и, при чтении с удалённого сервера, проверяется только на удалённом сервере.

max_rows_to_read_leaf

Максимальное количество строк, которое может быть прочитано из локальной таблицы на листовом узле при выполнении распределённого запроса. Хотя распределённые запросы могут выполнять несколько подзапросов к каждому шарду (листу), этот лимит проверяется только на стадии чтения на листовых узлах и игнорируется на стадии объединения результатов на корневом узле.

Например, кластер состоит из 2 шардов, и каждый шард содержит таблицу со 100 строками. Распределённый запрос, который должен прочитать все данные из обеих таблиц с параметром max_rows_to_read=150, завершится с ошибкой, поскольку в сумме будет 200 строк. Запрос с max_rows_to_read_leaf=150 выполнится успешно, так как листовые узлы прочитают максимум по 100 строк.

Ограничение проверяется для каждого обрабатываемого блока данных.

Примечание

Эта настройка нестабильна при prefer_localhost_replica=1.

max_rows_to_sort

Максимальное число строк, участвующих в сортировке. Это позволяет ограничить потребление памяти при сортировке. Если для операции ORDER BY требуется обработать больше записей, чем указано, поведение будет определяться параметром sort_overflow_mode, который по умолчанию установлен в throw.

max_rows_to_transfer

Максимальное количество строк, которое может быть передано на удалённый сервер или сохранено во временной таблице при выполнении оператора GLOBAL IN/JOIN.

max_sessions_for_user

Максимальное количество одновременных сеансов для одного аутентифицированного пользователя сервера ClickHouse.

Пример:

<profiles>
    <single_session_profile>
        <max_sessions_for_user>1</max_sessions_for_user>
    </single_session_profile>
    <two_sessions_profile>
        <max_sessions_for_user>2</max_sessions_for_user>
    </two_sessions_profile>
    <unlimited_sessions_profile>
        <max_sessions_for_user>0</max_sessions_for_user>
    </unlimited_sessions_profile>
</profiles>
<users>
    <!-- Пользователь Alice может подключиться к серверу ClickHouse не более одного раза одновременно. -->
    <Alice>
        <profile>single_session_user</profile>
    </Alice>
    <!-- Пользователь Bob может использовать 2 одновременных сессии. -->
    <Bob>
        <profile>two_sessions_profile</profile>
    </Bob>
    <!-- Пользователь Charles может использовать неограниченное количество одновременных сессий. -->
    <Charles>
        <profile>unlimited_sessions_profile</profile>
    </Charles>
</users>

Возможные значения:

Положительное целое число
0 — неограниченное количество одновременных сеансов (по умолчанию)

max_size_to_preallocate_for_aggregation

Максимальное суммарное количество элементов, под которые разрешено предварительно выделять память во всех хеш-таблицах перед агрегацией.

max_size_to_preallocate_for_joins

Для какого количества элементов разрешено предварительно выделять память во всех хеш-таблицах суммарно перед выполнением операций JOIN.

max_streams_for_merge_tree_reading

Если значение не равно нулю, ограничивает количество потоков чтения для таблицы MergeTree.

max_streams_multiplier_for_merge_tables

Запрашивает больше потоков при чтении из таблицы Merge. Потоки будут распределены между таблицами, входящими в таблицу Merge. Это обеспечивает более равномерное распределение работы между потоками и особенно полезно, когда эти таблицы заметно различаются по размеру.

max_streams_to_max_threads_ratio

Позволяет задействовать больше источников, чем количество потоков, чтобы более равномерно распределять работу между потоками. Предполагается, что это временное решение, поскольку в будущем станет возможным сделать число источников равным числу потоков, при этом каждый источник сможет динамически выбирать доступную ему работу.

max_subquery_depth

Если запрос содержит больше вложенных подзапросов, чем указано, генерируется исключение.

Совет

Это позволяет выполнять проверку корректности и защититься от того, чтобы пользователи вашего кластера писали чрезмерно сложные запросы.

max_table_size_to_drop

Ограничение на размер таблиц, которые можно удалять в запросе. Значение 0 означает, что можно удалять любые таблицы без ограничений.

Значение по умолчанию в ClickHouse Cloud: 1 ТБ.

Примечание

Этот параметр запроса переопределяет одноимённый параметр сервера, см. max_table_size_to_drop

max_temporary_columns

Максимальное количество временных столбцов, которые должны одновременно храниться в оперативной памяти при выполнении запроса, включая константные столбцы. Если запрос генерирует в памяти больше указанного количества временных столбцов в результате промежуточных вычислений, то выдается исключение.

Совет

Этот параметр полезен для предотвращения чрезмерно сложных запросов.

Значение 0 означает отсутствие ограничения.

max_temporary_data_on_disk_size_for_query

Максимальный объём данных во временных файлах на диске в байтах для всех одновременно выполняемых запросов.

Возможные значения:

Положительное целое число.
0 — без ограничений (значение по умолчанию)

max_temporary_data_on_disk_size_for_user

Максимальный объём данных, потребляемых временными файлами на диске, в байтах для всех одновременно выполняемых пользовательских запросов.

Возможные значения:

Положительное целое число.
0 — без ограничений (по умолчанию)

max_temporary_non_const_columns

Аналогично max_temporary_columns, задаёт максимальное количество временных столбцов, которые должны одновременно храниться в оперативной памяти при выполнении запроса, но без учёта константных столбцов.

Примечание

Константные столбцы формируются достаточно часто при выполнении запроса, но сами по себе практически не требуют вычислительных ресурсов.

max_threads

Максимальное количество потоков обработки запроса, исключая потоки для получения данных с удалённых серверов (см. параметр max_distributed_connections).

Этот параметр применяется к потокам, которые параллельно выполняют одни и те же стадии конвейера обработки запроса. Например, при чтении из таблицы, если возможно параллельно вычислять выражения с функциями, фильтровать по WHERE и выполнять предварительную агрегацию для GROUP BY с использованием не менее чем max_threads потоков, то используются max_threads потоков.

Для запросов, которые завершаются быстро из-за оператора LIMIT, имеет смысл задать меньшее значение max_threads. Например, если нужное количество записей находится в каждом блоке и max_threads = 8, будет прочитано 8 блоков, хотя было бы достаточно прочитать только один.

Чем меньше значение max_threads, тем меньше потребление памяти.

Значение по умолчанию в ClickHouse Cloud: auto(3)

max_threads_for_indexes

Максимальное число потоков, обрабатывающих индексы.

max_untracked_memory

Мелкие операции выделения и освобождения памяти группируются в переменной, локальной для потока, и отслеживаются или профилируются только тогда, когда объём (по абсолютному значению) становится больше указанного значения. Если это значение больше, чем memory_profiler_step, оно будет автоматически уменьшено до memory_profiler_step.

memory_overcommit_ratio_denominator

Задает мягкий лимит памяти на глобальном уровне при достижении жесткого лимита. Это значение используется для вычисления коэффициента оверкоммита памяти (overcommit ratio) для запроса. Нулевое значение означает, что запрос будет пропущен. Подробнее см. раздел memory overcommit.

memory_overcommit_ratio_denominator_for_user

Он задаёт мягкий лимит памяти, применяемый после достижения жёсткого лимита на уровне пользователя. Это значение используется для вычисления коэффициента оверкоммита памяти для запроса. Значение 0 означает, что запрос будет пропущен. Подробнее об оверкоммите памяти.

memory_profiler_sample_max_allocation_size

Собирать случайные операции выделения памяти размера, меньшего либо равного указанному значению, с вероятностью, равной memory_profiler_sample_probability. 0 означает, что сбор отключен. Рекомендуется установить max_untracked_memory в 0, чтобы этот порог работал как ожидается.

memory_profiler_sample_min_allocation_size

Собирает случайные выделения памяти размером больше или равным указанному значению с вероятностью memory_profiler_sample_probability. 0 означает, что функция отключена. Возможно, вам потребуется установить max_untracked_memory в 0, чтобы этот порог работал как ожидается.

memory_profiler_sample_probability

Собирать случайные операции выделения и освобождения памяти и записывать их в system.trace_log со значением trace_type = 'MemorySample'. Вероятность применяется к каждому alloc/free независимо от размера выделения (можно изменить с помощью memory_profiler_sample_min_allocation_size и memory_profiler_sample_max_allocation_size). Обратите внимание, что выборка выполняется только тогда, когда объем неотслеживаемой памяти превышает значение 'max_untracked_memory'. Для более детализированного профилирования можно установить 'max_untracked_memory' равным 0.

memory_profiler_step

Задает шаг профилировщика памяти. Каждый раз, когда потребление памяти запросом превышает очередное значение шага (в байтах), профилировщик памяти собирает стек вызовов выделения и записывает его в trace_log.

Возможные значения:

Положительное целое число байт.
0 — отключить профилировщик памяти.

memory_tracker_fault_probability

Для тестирования устойчивости к исключениям (exception safety) — выбрасывать исключение при каждом выделении памяти с указанной вероятностью.

memory_usage_overcommit_max_wait_microseconds

Максимальное время, в течение которого поток будет ожидать освобождения памяти в случае оверкоммита памяти (memory overcommit) на уровне пользователя. Если время ожидания истекает и память не освобождена, выбрасывается исключение. Подробнее о перерасходе памяти.

merge_table_max_tables_to_look_for_schema_inference

При создании таблицы Merge без явной схемы или при использовании табличной функции merge схема определяется как объединение не более чем указанного количества соответствующих таблиц. Если таблиц больше, схема будет определена на основе первых таблиц в количестве, указанном в настройке.

merge_tree_coarse_index_granularity

При поиске данных ClickHouse проверяет метки данных в файле индекса. Если ClickHouse обнаруживает, что нужные ключи лежат в некотором диапазоне, он делит этот диапазон на merge_tree_coarse_index_granularity поддиапазонов и рекурсивно ищет там требуемые ключи.

Возможные значения:

Любое положительное чётное целое число.

merge_tree_compact_parts_min_granules_to_multibuffer_read

ClickHouse Cloud only

Влияет только на ClickHouse Cloud. Количество гранул в полосе компактной части таблиц MergeTree, при котором используется multibuffer reader, поддерживающий параллельное чтение и опережающую выборку (prefetch). При чтении из удалённой файловой системы использование multibuffer reader увеличивает количество запросов на чтение.

merge_tree_determine_task_size_by_prewhere_columns

Определяет, следует ли при определении размера задачи чтения учитывать только размер столбцов PREWHERE.

merge_tree_max_bytes_to_use_cache

Если ClickHouse должен прочитать более merge_tree_max_bytes_to_use_cache байт в одном запросе, он не использует кэш несжатых блоков.

Кэш несжатых блоков хранит данные, извлечённые для запросов. ClickHouse использует этот кэш для ускорения ответов на повторяющиеся небольшие запросы. Этот параметр защищает кэш от засорения из‑за запросов, которые читают большой объём данных. Серверный параметр uncompressed_cache_size определяет размер кэша несжатых блоков.

Возможные значения:

Любое положительное целое число.

merge_tree_max_rows_to_use_cache

Если при выполнении одного запроса ClickHouse должен прочитать более merge_tree_max_rows_to_use_cache строк, кэш несжатых блоков не используется.

Кэш несжатых блоков хранит данные, извлечённые для запросов. ClickHouse использует этот кэш для ускорения ответов на повторные небольшие запросы. Этот параметр защищает кэш от засорения запросами, которые читают большой объём данных. Параметр сервера uncompressed_cache_size задаёт размер кэша несжатых блоков.

Возможные значения:

Любое положительное целое число.

merge_tree_min_bytes_for_concurrent_read

Если количество байт, которое нужно прочитать из одного файла таблицы движка MergeTree, превышает merge_tree_min_bytes_for_concurrent_read, то ClickHouse пытается читать этот файл параллельно в нескольких потоках.

Возможное значение:

Положительное целое число.

merge_tree_min_bytes_for_concurrent_read_for_remote_filesystem

Минимальное количество байт, которое нужно прочитать из одного файла, прежде чем движок MergeTree сможет распараллелить чтение при работе с удалённой файловой системой. Мы не рекомендуем использовать этот параметр.

Возможные значения:

Положительное целое число.

merge_tree_min_bytes_for_seek

Если расстояние между двумя блоками данных, которые нужно прочитать из одного файла, меньше merge_tree_min_bytes_for_seek байт, ClickHouse последовательно считывает участок файла, содержащий оба блока, избегая дополнительного позиционирования.

Возможные значения:

Любое положительное целое число.

merge_tree_min_bytes_per_task_for_remote_reading

Псевдонимы: filesystem_prefetch_min_bytes_for_single_read_task

Минимальный объем данных (в байтах), считываемый в одной задаче.

merge_tree_min_read_task_size

Строгое минимальное ограничение на размер задачи (даже если количество гранул невелико и число доступных потоков велико, задачи меньшего размера не создаются)

merge_tree_min_rows_for_concurrent_read

Если количество строк, которые нужно прочитать из файла таблицы MergeTree, превышает merge_tree_min_rows_for_concurrent_read, то ClickHouse пытается читать этот файл параллельно в нескольких потоках.

Возможные значения:

Положительное целое число.

merge_tree_min_rows_for_concurrent_read_for_remote_filesystem

Минимальное количество строк, считываемых из одного файла, прежде чем движок MergeTree сможет распараллелить чтение при работе с удалённой файловой системой. Мы не рекомендуем использовать эту настройку.

Возможные значения:

Положительное целое число.

merge_tree_min_rows_for_seek

Если расстояние между двумя блоками данных, которые должны быть прочитаны из одного файла, меньше merge_tree_min_rows_for_seek строк, ClickHouse не выполняет произвольное позиционирование по файлу, а считывает данные последовательно.

Возможные значения:

Любое положительное целое число.

merge_tree_read_split_ranges_into_intersecting_and_non_intersecting_injection_probability

Для тестирования PartsSplitter — с указанной вероятностью при каждом чтении из MergeTree разбивайте диапазоны чтения на пересекающиеся и непересекающиеся.

merge_tree_storage_snapshot_sleep_ms

Добавляет искусственную задержку (в миллисекундах) при создании снимка хранилища для таблиц MergeTree. Используется только для тестирования и отладки.

Возможные значения:

0 — без задержки (по умолчанию)
N — задержка в миллисекундах

merge_tree_use_const_size_tasks_for_remote_reading

Определяет, использовать ли задачи фиксированного размера для чтения из удалённой таблицы.

merge_tree_use_deserialization_prefixes_cache

Включает кэширование метаданных столбцов из префиксов файлов при чтении с удалённых дисков в MergeTree.

merge_tree_use_prefixes_deserialization_thread_pool

Включает использование пула потоков для параллельной десериализации префиксов при чтении широких (Wide) частей в MergeTree. Размер этого пула потоков задаётся серверной настройкой max_prefixes_deserialization_thread_pool_size.

merge_tree_use_v1_object_and_dynamic_serialization

При включении этого параметра в MergeTree для типов JSON и Dynamic будет использоваться версия сериализации V1 вместо V2. Изменение этого параметра вступает в силу только после перезапуска сервера.

metrics_perf_events_enabled

Если параметр включён, во время выполнения запросов будут измеряться некоторые perf-события.

metrics_perf_events_list

Разделённый запятыми список perf‑метрик, которые будут измеряться во время выполнения запросов. Пустое значение означает, что будут измеряться все события. См. PerfEventInfo в исходном коде для списка доступных событий.

min_bytes_to_use_direct_io

Минимальный объём данных, необходимый для использования прямого ввода-вывода (direct I/O) к диску хранения.

ClickHouse использует этот параметр при чтении данных из таблиц. Если общий объём всех данных, подлежащих чтению, превышает min_bytes_to_use_direct_io байт, то ClickHouse читает данные с диска хранения с опцией O_DIRECT.

Возможные значения:

0 — прямой ввод-вывод отключён.
Положительное целое число.

min_bytes_to_use_mmap_io

Это экспериментальная настройка. Задаёт минимальный объём памяти для чтения больших файлов без копирования данных из ядра в пользовательское пространство. Рекомендуемый порог — около 64 МБ, поскольку mmap/munmap работает медленно. Имеет смысл только для больших файлов и помогает лишь в том случае, если данные находятся в кэше страниц (page cache).

Возможные значения:

Положительное целое число.
0 — большие файлы читаются только с копированием данных из ядра в пользовательское пространство.

min_chunk_bytes_for_parallel_parsing

Тип: беззнаковое целое число (unsigned int)
Значение по умолчанию: 1 MiB

Минимальный размер блока в байтах, который будет обрабатываться каждым потоком параллельно.

min_compress_block_size

Для таблиц MergeTree. Чтобы уменьшить задержку при обработке запросов, блок сжимается при записи следующей метки, если его размер не меньше min_compress_block_size. По умолчанию — 65 536.

Фактический размер блока, если объём несжатых данных меньше max_compress_block_size, не меньше этого значения и не меньше объёма данных для одной метки.

Рассмотрим пример. Предположим, что при создании таблицы параметр index_granularity был установлен в 8192.

Мы записываем столбец типа UInt32 (4 байта на значение). При записи 8192 строк суммарный объём составит 32 КБ данных. Поскольку min_compress_block_size = 65 536, сжатый блок будет формироваться на каждые две метки.

Мы записываем столбец URL типа String (средний размер 60 байт на значение). При записи 8192 строк средний объём будет немного меньше 500 КБ данных. Поскольку это больше 65 536, сжатый блок будет формироваться для каждой метки. В этом случае при чтении данных с диска в диапазоне одной метки лишние данные не будут распакованы.

Примечание

Это настройка для экспертов, и вам не следует изменять её, если вы только начинаете работать с ClickHouse.

min_count_to_compile_aggregate_expression

Минимальное количество идентичных агрегатных выражений для начала JIT-компиляции. Работает только при включённой настройке compile_aggregate_expressions.

Возможные значения:

Положительное целое число.
0 — идентичные агрегатные выражения всегда JIT-компилируются.

min_count_to_compile_expression

Минимальное количество выполнений одного и того же выражения, прежде чем оно будет скомпилировано.

min_count_to_compile_sort_description

Число одинаковых описаний сортировки, после которого они будут скомпилированы JIT

min_execution_speed

Минимальная скорость выполнения в строках в секунду. Проверяется на каждом блоке данных, когда истекает timeout_before_checking_execution_speed. Если скорость выполнения ниже, выбрасывается исключение.

min_execution_speed_bytes

Минимальное количество байт, обрабатываемых в секунду. Проверяется на каждом блоке данных по истечении значения настройки timeout_before_checking_execution_speed. Если скорость выполнения ниже этого значения, выбрасывается исключение.

min_external_table_block_size_bytes

Объединяет блоки, передаваемые во внешнюю таблицу, до указанного размера в байтах, если их размер меньше заданного.

min_external_table_block_size_rows

Объединяет блоки, передаваемые во внешнюю таблицу, до указанного размера по числу строк, если их размер меньше указанного.

min_free_disk_bytes_to_perform_insert

Минимальный объём свободного дискового пространства (в байтах), необходимый для выполнения операции вставки.

min_free_disk_ratio_to_perform_insert

Минимальная доля свободного дискового пространства, необходимая для выполнения вставки.

min_free_disk_space_for_temporary_data

Минимальный объем дискового пространства, который необходимо оставлять свободным при записи временных данных, используемых во внешней сортировке и агрегации.

min_hit_rate_to_use_consecutive_keys_optimization

Минимальный коэффициент попаданий в кэш, используемого для оптимизации последовательных ключей при агрегации, при котором эта оптимизация остаётся включенной

min_insert_block_size_bytes

Устанавливает минимальный размер блока в байтах, который может быть вставлен в таблицу запросом INSERT. Блоки меньшего размера объединяются в более крупные.

Возможные значения:

Положительное целое число.
0 — объединение отключено.

min_insert_block_size_bytes_for_materialized_views

Задает минимальный размер блока в байтах, который может быть вставлен в таблицу запросом INSERT. Блоки меньшего размера объединяются в более крупные блоки. Этот параметр применяется только к блокам, вставляемым в материализованное представление. Настраивая этот параметр, вы управляете объединением блоков при вставке в материализованное представление и избегаете избыточного потребления памяти.

Возможные значения:

Любое положительное целое число.
0 — объединение отключено.

См. также

min_insert_block_size_bytes

min_insert_block_size_rows

Задаёт минимальное количество строк в блоке, который может быть вставлен в таблицу с помощью запроса INSERT. Блоки меньшего размера объединяются в более крупные.

Возможные значения:

Положительное целое число.
0 — объединение отключено.

min_insert_block_size_rows_for_materialized_views

Определяет минимальное количество строк в блоке, который может быть вставлен в таблицу запросом INSERT. Блоки меньшего размера объединяются в более крупные. Этот параметр применяется только к блокам, вставляемым в материализованное представление. Настраивая этот параметр, вы управляете объединением блоков при записи в материализованное представление и позволяете избежать избыточного использования памяти.

Возможные значения:

Любое положительное целое число.
0 — объединение отключено.

См. также

min_insert_block_size_rows

min_joined_block_size_bytes

Минимальный размер блока (в байтах) для входных и выходных блоков JOIN (если используемый алгоритм JOIN это поддерживает). Маленькие блоки будут объединены. Значение 0 означает отсутствие ограничений по размеру.

min_joined_block_size_rows

Минимальный размер блока в строках для входных и выходных блоков JOIN (если используемый алгоритм JOIN это поддерживает). Мелкие блоки будут объединены. Значение 0 означает отсутствие ограничения.

min_os_cpu_wait_time_ratio_to_throw

Минимальное отношение между временем ожидания CPU в ОС (метрика OSCPUWaitMicroseconds) и временем занятости (метрика OSCPUVirtualTimeMicroseconds), при котором сервер начинает рассматривать возможность отклонения запросов. Для вычисления вероятности используется линейная интерполяция между минимальным и максимальным отношением, при этом в этой точке вероятность равна 0.

min_outstreams_per_resize_after_split

Задает минимальное количество выходных потоков процессора Resize или StrictResize после выполнения операции разделения при генерации конвейера. Если итоговое число потоков меньше этого значения, операция разделения не будет выполнена.

Что такое узел Resize

Узел Resize — это процессор в конвейере запросов, который регулирует количество потоков данных, проходящих через конвейер. Он может как увеличивать, так и уменьшать число потоков, чтобы сбалансировать нагрузку между несколькими потоками выполнения или процессорами. Например, если запросу требуется больше параллелизма, узел Resize может разделить один поток на несколько потоков. Напротив, он может объединить несколько потоков в меньшее их число для консолидации обработки данных.

Узел Resize обеспечивает равномерное распределение данных по потокам, сохраняя структуру блоков данных. Это помогает оптимизировать использование ресурсов и повысить производительность запросов.

Почему узел Resize необходимо разделить

Во время выполнения конвейера мьютекс ExecutingGraph::Node::status_mutex центрального узла‑хаба Resize испытывает сильную конкуренцию за захват, особенно в средах с большим количеством ядер, и это приводит к следующему:

Увеличению задержки при ExecutingGraph::updateNode, что напрямую влияет на производительность запросов.
Чрезмерному расходу циклов CPU из‑за конкуренции за спинлок (native_queued_spin_lock_slowpath), что ухудшает эффективность.
Снижению загрузки CPU, что ограничивает параллелизм и пропускную способность.

Как выполняется разбиение узла Resize

Проверяется количество выходных потоков, чтобы убедиться, что разбиение возможно: выходные потоки каждого узла после разбиения достигают или превышают порог min_outstreams_per_resize_after_split.
Узел Resize разбивается на несколько меньших узлов Resize с одинаковым количеством портов, каждый из которых обрабатывает подмножество входных и выходных потоков.
Каждая группа обрабатывается независимо, что снижает конкуренцию за блокировки.

Разбиение узла Resize с произвольными входами/выходами

В некоторых случаях, когда количество входов/выходов не делится нацело на число узлов Resize, на которые выполняется разбиение, часть входов подключается к NullSource, а часть выходов — к NullSink. Это позволяет выполнить разбиение, не влияя на общий поток данных.

Назначение настройки

Настройка min_outstreams_per_resize_after_split гарантирует, что разбиение узлов Resize действительно имеет смысл и предотвращает создание слишком малого количества потоков, что могло бы привести к неэффективной параллельной обработке. Задавая минимальное число выходных потоков, эта настройка помогает поддерживать баланс между параллелизмом и накладными расходами, оптимизируя выполнение запросов в сценариях, связанных с разбиением и слиянием потоков.

Отключение настройки

Чтобы отключить разбиение узлов Resize, установите эту настройку в 0. Это предотвратит разбиение узлов Resize при генерации пайплайна, позволяя им сохранять свою исходную структуру без деления на более мелкие узлы.

min_table_rows_to_use_projection_index

Если оценочное число строк, которые нужно прочитать из таблицы, больше или равно этому порогу, ClickHouse попытается использовать индекс проекции при выполнении запроса.

mongodb_throw_on_unsupported_query

Если настройка включена, таблицы MongoDB будут возвращать ошибку, когда не удаётся построить запрос MongoDB. В противном случае ClickHouse считывает всю таблицу и обрабатывает её локально. Эта настройка не применяется, если allow_experimental_analyzer=0.

move_all_conditions_to_prewhere

Перемещать все возможные условия из WHERE в PREWHERE

move_primary_key_columns_to_end_of_prewhere

Перемещать условия PREWHERE, содержащие столбцы первичного ключа, в конец цепочки условий AND. Скорее всего, эти условия учитываются при анализе первичного ключа и, следовательно, вносят незначительный вклад в фильтрацию на этапе PREWHERE.

multiple_joins_try_to_keep_original_names

Не добавлять псевдонимы в список выражений верхнего уровня при переписывании запросов с несколькими JOIN

mutations_execute_nondeterministic_on_initiator

Если установлено значение true, константные недетерминированные функции (например, функция now()) выполняются на инициаторе и заменяются на литералы в запросах UPDATE и DELETE. Это помогает поддерживать согласованность данных на репликах при выполнении мутаций с константными недетерминированными функциями. Значение по умолчанию: false.

mutations_execute_subqueries_on_initiator

Если значение true, скалярные подзапросы выполняются на сервере-инициаторе, а их результаты подставляются как литералы в запросах UPDATE и DELETE. Значение по умолчанию: false.

mutations_max_literal_size_to_replace

Максимальный размер в байтах сериализованного литерала, который может быть заменён в запросах UPDATE и DELETE. Параметр действует только в том случае, если включён хотя бы один из двух параметров выше. Значение по умолчанию: 16384 (16 КиБ).

mutations_sync

Возможные значения:

Value	Description
`0`	Мутации выполняются асинхронно.
`1`	Запрос ожидает завершения всех мутаций на текущем сервере.
`2`	Запрос ожидает завершения всех мутаций на всех репликах (если они есть).
`3`	Запрос ожидает завершения мутаций только на активных репликах. Поддерживается только для `SharedMergeTree`. Для `ReplicatedMergeTree` ведёт себя так же, как `mutations_sync = 2`.

mysql_datatypes_support_level

Определяет, как типы MySQL преобразуются в соответствующие типы ClickHouse. Представляет собой список, разделённый запятыми, с любым сочетанием значений decimal, datetime64, date2Date32 или date2String.

decimal: преобразовывать типы NUMERIC и DECIMAL в Decimal, если это позволяет точность.
datetime64: преобразовывать типы DATETIME и TIMESTAMP в DateTime64 вместо DateTime, когда точность не равна 0.
date2Date32: преобразовывать DATE в Date32 вместо Date. Имеет приоритет над date2String.
date2String: преобразовывать DATE в String вместо Date. Переопределяется параметром datetime64.

mysql_map_fixed_string_to_text_in_show_columns

При включении тип данных ClickHouse FixedString будет отображаться как TEXT в SHOW COLUMNS.

Действует только при подключении по протоколу MySQL wire.

0 - Использовать BLOB.
1 - Использовать TEXT.

mysql_map_string_to_text_in_show_columns

При включении тип данных ClickHouse String будет отображаться как TEXT в SHOW COLUMNS.

Влияет только на подключения, выполняемые через протокол MySQL wire.

0 — использовать BLOB.
1 — использовать TEXT.

mysql_max_rows_to_insert

Максимальное число строк в пакетной операции вставки для движка MySQL

network_compression_method

Кодек сжатия данных при взаимодействии «клиент–сервер» и «сервер–сервер».

Возможные значения:

NONE — без сжатия.
LZ4 — использовать кодек LZ4.
LZ4HC — использовать кодек LZ4HC.
ZSTD — использовать кодек ZSTD.

См. также

network_zstd_compression_level

network_zstd_compression_level

Настраивает уровень сжатия ZSTD. Используется только если network_compression_method имеет значение ZSTD.

Возможные значения:

Положительное целое число от 1 до 15.

normalize_function_names

Нормализовать имена функций до их канонических имен

number_of_mutations_to_delay

Если таблица, к которой применяются мутации, содержит как минимум столько незавершённых мутаций, искусственно замедлять выполнение последующих мутаций. 0 — отключено

number_of_mutations_to_throw

Если изменяемая таблица содержит не менее указанного количества незавершённых мутаций, будет выброшено исключение «Too many mutations ...». 0 — отключено

odbc_bridge_connection_pool_size

Размер пула соединений для каждой строки параметров подключения в ODBC-мосте.

odbc_bridge_use_connection_pooling

Использовать пул подключений в мосте ODBC. Если установлено значение false, каждый раз создаётся новое подключение.

offset

Задает количество строк, которые нужно пропустить перед началом возврата строк по результатам запроса. Корректирует смещение, заданное предложением OFFSET, таким образом, что эти два значения суммируются.

Возможные значения:

0 — строки не пропускаются.
Положительное целое число.

Пример

Исходная таблица:

CREATE TABLE test (i UInt64) ENGINE = MergeTree() ORDER BY i;
INSERT INTO test SELECT number FROM numbers(500);

Запрос:

SET limit = 5;
SET offset = 7;
SELECT * FROM test LIMIT 10 OFFSET 100;

Результат:

┌───i─┐
│ 107 │
│ 108 │
│ 109 │
└─────┘

opentelemetry_start_trace_probability

Задает вероятность того, что ClickHouse начнет трассировку для выполняемых запросов (если не передан родительский контекст трассировки).

Возможные значения:

0 — трассировка для всех выполняемых запросов отключена (если не передан родительский контекст трассировки).
Положительное число с плавающей запятой в диапазоне [0..1]. Например, если значение настройки равно 0,5, ClickHouse будет начинать трассировку в среднем для половины запросов.
1 — трассировка для всех выполняемых запросов включена.

opentelemetry_trace_cpu_scheduling

Сбор спанов OpenTelemetry для вытесняющего планирования CPU рабочих нагрузок.

opentelemetry_trace_processors

Собирать спаны OpenTelemetry процессоров.

optimize_aggregation_in_order

Включает оптимизацию GROUP BY в запросах SELECT для агрегации данных в соответствующем порядку сортировки в таблицах семейства MergeTree.

Возможные значения:

0 — оптимизация GROUP BY отключена.
1 — оптимизация GROUP BY включена.

См. также

Оптимизация GROUP BY

optimize_aggregators_of_group_by_keys

Устраняет агрегатные функции min/max/any/anyLast для ключей GROUP BY в секции SELECT

optimize_and_compare_chain

Дополняет цепочки AND константными сравнениями для повышения эффективности фильтрации. Поддерживает операторы <, <=, >, >=, = и их комбинации. Например, (a < b) AND (b < c) AND (c < 5) будет преобразовано в (a < b) AND (b < c) AND (c < 5) AND (b < 5) AND (a < 5).

optimize_append_index

Используйте constraints, чтобы добавить условие индекса при вставке данных. Значение по умолчанию — false.

Возможные значения:

true, false

optimize_arithmetic_operations_in_aggregate_functions

Вынос арифметических операций за пределы агрегатных функций

optimize_const_name_size

Заменяет константу на скаляр и использует хеш в качестве имени для больших констант (размер оценивается по длине имени).

Возможные значения:

положительное целое число — максимальная длина имени,
0 — всегда,
отрицательное целое число — никогда.

optimize_count_from_files

Включает или отключает оптимизацию подсчёта количества строк в файлах в различных входных форматах. Применяется к табличным функциям и движкам таблиц file/s3/url/hdfs/azureBlobStorage.

Возможные значения:

0 — оптимизация отключена.
1 — оптимизация включена.

optimize_distinct_in_order

Включает оптимизацию DISTINCT, если некоторые столбцы в операторе DISTINCT образуют префикс сортировки. Например, префикс ключа сортировки в MergeTree или выражения ORDER BY.

optimize_distributed_group_by_sharding_key

Оптимизирует выполнение запросов GROUP BY sharding_key, избегая дорогостоящей агрегации на сервере-инициаторе (что уменьшает потребление памяти запросом на сервере-инициаторе).

Поддерживаются следующие типы запросов (и все их комбинации):

SELECT DISTINCT [..., ]sharding_key[, ...] FROM dist
SELECT ... FROM dist GROUP BY sharding_key[, ...]
SELECT ... FROM dist GROUP BY sharding_key[, ...] ORDER BY x
SELECT ... FROM dist GROUP BY sharding_key[, ...] LIMIT 1
SELECT ... FROM dist GROUP BY sharding_key[, ...] LIMIT 1 BY x

Следующие типы запросов не поддерживаются (поддержка некоторых из них может быть добавлена позже):

SELECT ... GROUP BY sharding_key[, ...] WITH TOTALS
SELECT ... GROUP BY sharding_key[, ...] WITH ROLLUP
SELECT ... GROUP BY sharding_key[, ...] WITH CUBE
SELECT ... GROUP BY sharding_key[, ...] SETTINGS extremes=1

Возможные значения:

0 — Отключено.
1 — Включено.

См. также:

distributed_group_by_no_merge
distributed_push_down_limit
optimize_skip_unused_shards

Примечание

В настоящее время требуется optimize_skip_unused_shards (причина в том, что однажды этот параметр может быть включён по умолчанию, и он будет работать корректно только если данные были вставлены через таблицу Distributed, то есть данные распределены в соответствии с sharding_key).

optimize_empty_string_comparisons

Преобразует выражения вида col = '' или '' = col в empty(col), а col != '' или '' != col в notEmpty(col), только если col имеет тип String или FixedString.

optimize_extract_common_expressions

Позволяет выносить общие подвыражения из дизъюнкций в выражениях WHERE, PREWHERE, ON, HAVING и QUALIFY. Логическое выражение вида (A AND B) OR (A AND C) может быть переписано как A AND (B OR C), что может помочь лучше использовать:

индексы в простых фильтрующих выражениях
оптимизацию преобразования CROSS JOIN в INNER JOIN

optimize_functions_to_subcolumns

Включает или отключает оптимизацию путём преобразования некоторых функций к чтению подколонок. Это уменьшает объём считываемых данных.

Могут быть преобразованы следующие функции:

length для чтения подколонки size0.
empty для чтения подколонки size0.
notEmpty для чтения подколонки size0.
isNull для чтения подколонки null.
isNotNull для чтения подколонки null.
count для чтения подколонки null.
mapKeys для чтения подколонки keys.
mapValues для чтения подколонки values.

Возможные значения:

0 — оптимизация отключена.
1 — оптимизация включена.

optimize_group_by_constant_keys

Оптимизирует GROUP BY, если все ключи в блоке являются константами

optimize_group_by_function_keys

Устраняет функции от других ключей в секции GROUP BY

optimize_if_chain_to_multiif

Заменяет цепочки if(cond1, then1, if(cond2, ...)) на multiIf. Сейчас это не даёт преимуществ для числовых типов.

optimize_if_transform_strings_to_enum

Заменяет строковые аргументы в if и transform на Enum. По умолчанию отключена, поскольку может приводить к несогласованным изменениям в распределённом запросе и, как следствие, к его сбою.

optimize_injective_functions_in_group_by

Заменяет инъективные функции их аргументами в разделе GROUP BY

optimize_injective_functions_inside_uniq

Удаляет инъективные функции с одним аргументом внутри функций uniq*().

optimize_min_equality_disjunction_chain_length

Минимальная длина выражения expr = x1 OR ... expr = xN для оптимизации

optimize_min_inequality_conjunction_chain_length

Минимальная длина выражения expr <> x1 AND ... expr <> xN для оптимизации.

optimize_move_to_prewhere

Включает или отключает автоматическую оптимизацию PREWHERE в запросах SELECT.

Применяется только к таблицам *MergeTree.

Возможные значения:

0 — автоматическая оптимизация PREWHERE отключена.
1 — автоматическая оптимизация PREWHERE включена.

optimize_move_to_prewhere_if_final

Включает или отключает автоматическую оптимизацию PREWHERE в запросах SELECT с модификатором FINAL.

Работает только для таблиц семейства *MergeTree.

Возможные значения:

0 — автоматическая оптимизация PREWHERE в запросах SELECT с модификатором FINAL отключена.
1 — автоматическая оптимизация PREWHERE в запросах SELECT с модификатором FINAL включена.

См. также

настройка optimize_move_to_prewhere

optimize_multiif_to_if

Заменяет вызовы multiIf с единственным условием на if.

optimize_normalize_count_variants

Переписывать агрегатные функции, которые семантически эквивалентны функции count(), в count().

optimize_on_insert

Включает или отключает преобразование данных перед вставкой так, как если бы к этому блоку была применена операция слияния (merge) в соответствии с движком таблицы.

Возможные значения:

0 — Отключено.
1 — Включено.

Пример

Разница между включённым и отключённым режимом:

Запрос:

SET optimize_on_insert = 1;

CREATE TABLE test1 (`FirstTable` UInt32) ENGINE = ReplacingMergeTree ORDER BY FirstTable;

INSERT INTO test1 SELECT number % 2 FROM numbers(5);

SELECT * FROM test1;

SET optimize_on_insert = 0;

CREATE TABLE test2 (`SecondTable` UInt32) ENGINE = ReplacingMergeTree ORDER BY SecondTable;

INSERT INTO test2 SELECT number % 2 FROM numbers(5);

SELECT * FROM test2;

Результат:

┌─FirstTable─┐
│          0 │
│          1 │
└────────────┘

┌─SecondTable─┐
│           0 │
│           0 │
│           0 │
│           1 │
│           1 │
└─────────────┘

Обратите внимание, что этот параметр влияет на поведение материализованного представления.

optimize_or_like_chain

Оптимизирует несколько условий OR LIKE в multiMatchAny. Эту оптимизацию не следует включать по умолчанию, так как в некоторых случаях она мешает анализу индексов.

optimize_qbit_distance_function_reads

Заменяет функции расстояния для типа данных QBit эквивалентными функциями, которые считывают из хранилища только необходимые для вычисления столбцы.

optimize_read_in_order

Включает оптимизацию ORDER BY в запросах SELECT при чтении данных из таблиц MergeTree.

Возможные значения:

0 — оптимизация ORDER BY отключена.
1 — оптимизация ORDER BY включена.

См. также

Оператор ORDER BY

optimize_read_in_window_order

Включает оптимизацию ORDER BY в предложении WINDOW для чтения данных в соответствующем порядке из таблиц MergeTree.

optimize_redundant_functions_in_order_by

Удаляет функции из ORDER BY, если их аргументы также присутствуют в ORDER BY

optimize_respect_aliases

Если значение параметра — true, алиасы в WHERE/GROUP BY/ORDER BY учитываются, что помогает при отсечении партиций, использовании вторичных индексов, а также оптимизациях optimize_aggregation_in_order/optimize_read_in_order/optimize_trivial_count.

optimize_rewrite_aggregate_function_with_if

Переписывает агрегатные функции, в которых аргументом является выражение if, на логически эквивалентные варианты. Например, avg(if(cond, col, null)) может быть переписана как avgOrNullIf(cond, col). Это может улучшить производительность.

Примечание

Поддерживается только при использовании анализатора (enable_analyzer = 1).

optimize_rewrite_array_exists_to_has

Перезаписывает вызовы функции arrayExists() на has(), когда это логически эквивалентно. Например, arrayExists(x -> x = 1, arr) может быть переписано как has(arr, 1)

optimize_rewrite_like_perfect_affix

Переписывает выражения LIKE с точным префиксом или суффиксом (например, col LIKE 'ClickHouse%') во вызовы функций startsWith или endsWith (например, startsWith(col, 'ClickHouse')).

optimize_rewrite_regexp_functions

Переписывать функции, связанные с регулярными выражениями, в более простые и эффективные формы

optimize_rewrite_sum_if_to_count_if

Переписывать sumIf() и sum(if()) в countIf(), когда это логически эквивалентно

optimize_skip_merged_partitions

Включает или отключает оптимизацию для запроса OPTIMIZE TABLE ... FINAL, если существует только одна часть уровня > 0 и у неё не истёк TTL.

OPTIMIZE TABLE ... FINAL SETTINGS optimize_skip_merged_partitions=1

По умолчанию запрос OPTIMIZE TABLE ... FINAL переписывает эту часть, даже если она единственная.

Возможные значения:

1 - Включить оптимизацию.
0 - Отключить оптимизацию.

optimize_skip_unused_shards

Включает или отключает пропуск неиспользуемых шардов для запросов SELECT, которые содержат условие по ключу шардинга в WHERE/PREWHERE (при условии, что данные распределены по ключу шардинга; в противном случае запрос может вернуть некорректный результат).

Возможные значения:

0 — Отключено.
1 — Включено.

optimize_skip_unused_shards_limit

Ограничение на число значений ключа шардинга; при достижении этого лимита настройка optimize_skip_unused_shards отключается.

Слишком большое число значений может потребовать значительных затрат на обработку, при этом выгода сомнительна, поскольку если у вас очень много значений в IN (...), то, скорее всего, запрос всё равно будет отправлен на все шарды.

optimize_skip_unused_shards_nesting

Определяет работу optimize_skip_unused_shards (поэтому также требует включения optimize_skip_unused_shards) в зависимости от уровня вложенности распределённого запроса (случай, когда у вас есть таблица Distributed, которая обращается к другой таблице Distributed).

Возможные значения:

0 — Отключено, optimize_skip_unused_shards всегда применяется.
1 — Включает optimize_skip_unused_shards только для первого уровня.
2 — Включает optimize_skip_unused_shards до второго уровня включительно.

optimize_skip_unused_shards_rewrite_in

Переписывает оператор IN в запросах к удалённым шардам, чтобы исключить значения, которые не относятся к данному шарду (требует включённого optimize_skip_unused_shards).

Возможные значения:

0 — Отключено.
1 — Включено.

optimize_sorting_by_input_stream_properties

Оптимизировать сортировку с учётом свойств входного потока

optimize_substitute_columns

Используйте ограничения для замены столбцов. Значение по умолчанию — false.

Возможные значения:

true, false

optimize_syntax_fuse_functions

Позволяет объединять агрегатные функции с одинаковым аргументом. Переписывает запрос, который содержит как минимум две агрегатные функции sum, count или avg с одинаковым аргументом, в вызов sumCount.

Возможные значения:

0 — функции с одинаковым аргументом не объединяются.
1 — функции с одинаковым аргументом объединяются.

Пример

Запрос:

CREATE TABLE fuse_tbl(a Int8, b Int8) Engine = Log;
SET optimize_syntax_fuse_functions = 1;
EXPLAIN SYNTAX SELECT sum(a), sum(b), count(b), avg(b) from fuse_tbl FORMAT TSV;

Результат:

SELECT
    sum(a),
    sumCount(b).1,
    sumCount(b).2,
    (sumCount(b).1) / (sumCount(b).2)
FROM fuse_tbl

optimize_throw_if_noop

Включает или отключает выбрасывание исключения, если запрос OPTIMIZE не выполнил слияние.

По умолчанию OPTIMIZE успешно завершается, даже если он ничего не сделал. Эта настройка позволяет различать такие ситуации и получать причину в сообщении исключения.

Возможные значения:

1 — выбрасывание исключения включено.
0 — выбрасывание исключения отключено.

optimize_time_filter_with_preimage

Оптимизирует предикаты типов Date и DateTime, преобразуя функции в эквивалентные сравнения без приведения типов (например, toYear(col) = 2023 -> col >= '2023-01-01' AND col <= '2023-12-31')

optimize_trivial_approximate_count_query

Использовать приблизительное значение для тривиальной оптимизации запросов count в хранилищах, которые поддерживают такую оценку, например, EmbeddedRocksDB.

Возможные значения:

0 — Оптимизация отключена.
- 1 — Оптимизация включена.

optimize_trivial_count_query

Включает или отключает оптимизацию тривиального запроса SELECT count() FROM table с использованием метаданных MergeTree. Если вам нужно использовать безопасность на уровне строк (row-level security), отключите этот параметр.

Возможные значения:

0 — Оптимизация отключена.
- 1 — Оптимизация включена.

См. также:

optimize_functions_to_subcolumns

optimize_trivial_insert_select

Оптимизирует тривиальные запросы вида INSERT INTO table SELECT ... FROM TABLES

optimize_uniq_to_count

Заменяет uniq и его варианты (кроме uniqUpTo) на count, если подзапрос содержит предложение DISTINCT или GROUP BY.

optimize_use_implicit_projections

Автоматически выбирать неявные проекции для выполнения запроса SELECT

optimize_use_projection_filtering

Включает использование проекций для фильтрации диапазонов партиций, даже если проекции не выбраны для выполнения запроса SELECT.

optimize_use_projections

Псевдонимы: allow_experimental_projection_optimization

Включает или отключает оптимизацию проекций при обработке запросов SELECT.

Возможные значения:

0 — оптимизация проекций отключена.
1 — оптимизация проекций включена.

optimize_using_constraints

Используйте ограничения для оптимизации запросов. Значение по умолчанию — false.

Возможные значения:

true, false

os_threads_nice_value_materialized_view

Значение Linux nice для потоков материализованного представления. Меньшие значения означают более высокий приоритет использования CPU.

Требуются права CAP_SYS_NICE, в противном случае параметр не оказывает эффекта.

Возможные значения: от -20 до 19.

os_threads_nice_value_query

Псевдонимы: os_thread_priority

Значение nice в Linux для потоков обработки запросов. Более низкие значения означают более высокий приоритет использования CPU.

Требует привилегии CAP_SYS_NICE, в противном случае параметр не оказывает эффекта.

Возможные значения: от -20 до 19.

output_format_compression_level

Уровень сжатия по умолчанию, если результат запроса сжимается. Настройка применяется, когда запрос SELECT содержит INTO OUTFILE или при записи в табличные функции file, url, hdfs, s3 или azureBlobStorage.

Возможные значения: от 1 до 22

output_format_compression_zstd_window_log

Может использоваться, если в качестве метода сжатия вывода задан zstd. Если значение больше 0, этот параметр явно задаёт размер окна сжатия (степень двойки) и включает режим long-range для сжатия zstd. Это может помочь добиться лучшего коэффициента сжатия.

Возможные значения: неотрицательные числа. Обратите внимание, что если значение слишком мало или слишком велико, zstdlib выбросит исключение. Типичные значения — от 20 (размер окна = 1MB) до 30 (размер окна = 1GB).

output_format_parallel_formatting

Включает или отключает параллельное формирование данных в форматах. Поддерживается только для форматов TSV, TSKV, CSV и JSONEachRow.

Возможные значения:

1 — Включено.
0 — Отключено.

page_cache_block_size

Размер фрагментов файлов, хранимых в пользовательском кэше страниц (userspace page cache), в байтах. Все чтения, проходящие через кэш, будут округляться до кратного этому размеру.

Этот параметр можно настраивать на уровне отдельного запроса, но записи кэша с разными размерами блоков не могут быть повторно использованы. Изменение этого параметра по сути делает существующие записи в кэше недействительными.

Большее значение, например 1 MiB, подходит для запросов с высокой пропускной способностью, а меньшее значение, например 64 KiB, — для точечных запросов с низкой задержкой.

page_cache_inject_eviction

Кэш страниц в пространстве пользователя иногда случайным образом инвалидирует некоторые страницы. Параметр предназначен для тестирования.

page_cache_lookahead_blocks

При промахе по пользовательскому кэшу страниц (userspace page cache) считывается до указанного количества последовательных блоков из нижележащего хранилища, если они также отсутствуют в кэше. Каждый блок имеет размер page_cache_block_size байт.

Большее значение подходит для запросов с высокой пропускной способностью, тогда как точечные запросы с низкой задержкой будут работать лучше без опережающего чтения.

parallel_distributed_insert_select

Включает параллельное распределённое выполнение запроса INSERT ... SELECT.

Если выполняется запрос INSERT INTO distributed_table_a SELECT ... FROM distributed_table_b, и обе таблицы используют один и тот же кластер, и обе таблицы являются либо реплицируемыми, либо нереплицируемыми, то этот запрос обрабатывается локально на каждом шарде.

Возможные значения:

0 — Отключено.
1 — SELECT будет выполняться на каждом шарде из подлежащей таблицы движка Distributed.
2 — SELECT и INSERT будут выполняться на каждом шарде из/в подлежащую таблицу движка Distributed.

При использовании этой настройки необходимо установить enable_parallel_replicas = 1.

parallel_hash_join_threshold

При использовании алгоритма соединения по хэш-таблице этот порог определяет, следует ли применять hash или parallel_hash (только если доступна оценка размера правой таблицы). hash используется, когда известно, что размер правой таблицы ниже этого порога.

parallel_replica_offset

Beta feature. Learn more.

Это внутренняя настройка, которая не предназначена для прямого использования и является деталями реализации режима «parallel replicas». Это значение будет автоматически установлено инициирующим сервером для распределённых запросов на индекс той реплики, которая участвует в обработке запроса среди параллельных реплик.

parallel_replicas_allow_in_with_subquery

Beta feature. Learn more.

Если параметр имеет значение true, подзапрос в операторе IN будет выполняться на каждой ведомой реплике.

parallel_replicas_connect_timeout_ms

Beta feature. Learn more.

Таймаут в миллисекундах для подключения к удалённой реплике во время выполнения запроса с параллельными репликами. Если таймаут истёк, соответствующая реплика не используется для выполнения запроса.

parallel_replicas_count

Beta feature. Learn more.

Это внутренний параметр, который не следует использовать напрямую и который является деталью реализации режима parallel replicas. Для распределённых запросов это значение будет автоматически установлено инициирующим сервером и будет равно количеству параллельных реплик, участвующих в обработке запроса.

parallel_replicas_custom_key

Beta feature. Learn more.

Произвольное целочисленное выражение, которое может использоваться для разделения работы между репликами для заданной таблицы. Значением может быть любое целочисленное выражение.

Предпочтительны простые выражения на основе первичного ключа.

Если настройка используется в кластере, состоящем из одного шарда с несколькими репликами, эти реплики будут преобразованы в виртуальные шарды. В противном случае поведение будет таким же, как у ключа SAMPLE: будут использоваться несколько реплик каждого шарда.

parallel_replicas_custom_key_range_lower

Beta feature. Learn more.

Позволяет фильтру типа range равномерно распределять объём работы между репликами на основе пользовательского диапазона [parallel_replicas_custom_key_range_lower, INT_MAX].

При совместном использовании с parallel_replicas_custom_key_range_upper позволяет фильтру равномерно распределять объём работы между репликами для диапазона [parallel_replicas_custom_key_range_lower, parallel_replicas_custom_key_range_upper].

Примечание: эта настройка не приводит к дополнительной фильтрации данных во время выполнения запроса, а лишь изменяет точки, в которых диапазонный фильтр разбивает диапазон [0, INT_MAX] для параллельной обработки.

parallel_replicas_custom_key_range_upper

Beta feature. Learn more.

Позволяет фильтру типа range равномерно распределять работу между репликами на основе пользовательского диапазона [0, parallel_replicas_custom_key_range_upper]. Значение 0 отключает верхнюю границу, устанавливая её в максимальное значение выражения пользовательского ключа.

При совместном использовании с parallel_replicas_custom_key_range_lower позволяет фильтру равномерно распределять работу между репликами для диапазона [parallel_replicas_custom_key_range_lower, parallel_replicas_custom_key_range_upper].

Примечание: эта настройка не приводит к дополнительной фильтрации данных при обработке запроса, а изменяет точки, в которых диапазонный фильтр разбивает диапазон [0, INT_MAX] для параллельной обработки.

parallel_replicas_for_cluster_engines

Заменяет движки табличных функций на их варианты с суффиксом -Cluster

parallel_replicas_for_non_replicated_merge_tree

Beta feature. Learn more.

Если установлено в значение true, ClickHouse будет использовать алгоритм параллельных реплик также для нереплицируемых таблиц MergeTree

parallel_replicas_index_analysis_only_on_coordinator

Beta feature. Learn more.

Анализ индексов выполняется только на replica-coordinator и не выполняется на других репликах. Действует только при включённом параметре parallel_replicas_local_plan

parallel_replicas_insert_select_local_pipeline

Beta feature. Learn more.

Использовать локальный конвейер при распределённой операции INSERT SELECT с параллельными репликами

parallel_replicas_local_plan

Beta feature. Learn more.

Создавать локальный план для локальной реплики

parallel_replicas_mark_segment_size

Beta feature. Learn more.

Части логически (виртуально) делятся на сегменты, которые распределяются между репликами для параллельного чтения. Этот параметр управляет размером этих сегментов. Не рекомендуется изменять его, пока вы не будете абсолютно уверены в своих действиях. Значение должно быть в диапазоне [128; 16384]

parallel_replicas_min_number_of_rows_per_replica

Beta feature. Learn more.

Ограничивает число реплик, используемых в запросе, значением (оценочное число строк для чтения / min_number_of_rows_per_replica). Максимальное значение по‑прежнему ограничено параметром max_parallel_replicas.

parallel_replicas_mode

Beta feature. Learn more.

Тип фильтра, используемого с пользовательским ключом для параллельных реплик. default — использовать операцию взятия по модулю над пользовательским ключом, range — использовать диапазонный фильтр по пользовательскому ключу с перебором всех возможных значений для типа значения пользовательского ключа.

parallel_replicas_only_with_analyzer

Beta feature. Learn more.

Для использования параллельных реплик анализатор должен быть включён. При отключённом анализаторе запрос выполняется локально, даже если включено параллельное чтение с реплик. Использование параллельных реплик при отключённом анализаторе не поддерживается.

parallel_replicas_prefer_local_join

Beta feature. Learn more.

Если значение равно true, и JOIN может быть выполнен с использованием алгоритма параллельных реплик, и все хранилища правой части JOIN относятся к типу *MergeTree, будет использован локальный JOIN вместо GLOBAL JOIN.

parallel_replicas_support_projection

Beta feature. Learn more.

Оптимизация проекций может применяться на параллельных репликах. Действует только при включённом parallel_replicas_local_plan и выключенном aggregation_in_order.

parallel_view_processing

Включает параллельную отправку данных в подключённые представления вместо последовательной.

parallelize_output_from_storages

Параллелизирует вывод на этапе чтения из хранилища. Позволяет, при возможности, распараллелить обработку запроса сразу после чтения из хранилища.

parsedatetime_e_requires_space_padding

Форматтер '%e' в функции 'parseDateTime' ожидает, что однозначные значения дня будут дополнены слева пробелом: например, ' 2' принимается, а '2' приводит к ошибке.

parsedatetime_parse_without_leading_zeros

Спецификаторы формата '%c', '%l' и '%k' в функции 'parseDateTime' разбирают значения месяцев и часов без ведущих нулей.

partial_merge_join_left_table_buffer_bytes

Если не равно 0, объединяет блоки левой таблицы в более крупные для левой стороны при частичном соединении merge. Использует до 2× указанного объёма памяти на поток соединения.

partial_merge_join_rows_in_right_blocks

Ограничивает размер блоков данных правой части соединения в алгоритме частичного слияния для запросов JOIN.

Сервер ClickHouse:

Разбивает данные правой части соединения на блоки с количеством строк не более указанного значения.
Индексирует каждый блок по его минимальным и максимальным значениям.
Выгружает подготовленные блоки на диск, если это возможно.

Возможные значения:

Любое положительное целое число. Рекомендуемый диапазон значений: [1000, 100000].

partial_result_on_first_cancel

Позволяет вернуть частичный результат после отмены выполнения запроса.

parts_to_delay_insert

Если целевая таблица содержит как минимум такое количество активных частей в одной партиции, операция вставки в таблицу искусственно замедляется.

parts_to_throw_insert

Если в одном разделе целевой таблицы число активных частей превышает это значение, будет выброшено исключение «Too many parts ...».

per_part_index_stats

Записывает статистику индекса для каждой части

poll_interval

Приостанавливает цикл ожидания запроса на сервере на указанное число секунд.

postgresql_connection_attempt_timeout

Таймаут (в секундах) для отдельной попытки подключения к конечной точке PostgreSQL. Значение передаётся как параметр connect_timeout в URL подключения.

postgresql_connection_pool_auto_close_connection

Закрывать соединение перед возвратом в пул.

postgresql_connection_pool_retries

Количество повторных попыток операций push/pop в пуле подключений для движка таблиц PostgreSQL и движка баз данных PostgreSQL.

postgresql_connection_pool_size

Размер пула подключений для движков таблиц и баз данных PostgreSQL.

postgresql_connection_pool_wait_timeout

Тайм-аут ожидания операций push/pop в пуле подключений при пустом пуле для движка таблиц PostgreSQL и движка баз данных PostgreSQL. По умолчанию при пустом пуле операции будут блокироваться.

postgresql_fault_injection_probability

Приблизительная вероятность искусственного отказа внутренних запросов PostgreSQL (для репликации). Допустимое значение — в интервале [0.0f, 1.0f]

prefer_column_name_to_alias

Включает или отключает использование исходных имён столбцов вместо псевдонимов в выражениях и конструкциях запроса. Это особенно важно, когда псевдоним совпадает с именем столбца, см. Expression Aliases. Включите этот параметр, чтобы сделать правила синтаксиса псевдонимов в ClickHouse более совместимыми с правилами в большинстве других систем управления базами данных.

Возможные значения:

0 — Имя столбца заменяется псевдонимом.
1 — Имя столбца не заменяется псевдонимом.

Пример

Различие между включённой и отключённой настройкой:

Запрос:

SET prefer_column_name_to_alias = 0;
SELECT avg(number) AS number, max(number) FROM numbers(10);

Результат:

Получено исключение от сервера (версия 21.5.1):
Код: 184. DB::Exception: Получено от localhost:9000. DB::Exception: Агрегатная функция avg(number) найдена внутри другой агрегатной функции в запросе: При обработке avg(number) AS number.

Запрос:

SET prefer_column_name_to_alias = 1;
SELECT avg(number) AS number, max(number) FROM numbers(10);

Результат:

┌─number─┬─max(number)─┐
│    4.5 │           9 │
└────────┴─────────────┘

prefer_external_sort_block_bytes

Предпочитать наибольший размер блока в байтах при внешней сортировке, чтобы уменьшить расход памяти при слиянии.

prefer_global_in_and_join

Включает замену операторов IN/JOIN на GLOBAL IN/GLOBAL JOIN.

Возможные значения:

0 — Отключено. Операторы IN/JOIN не заменяются на GLOBAL IN/GLOBAL JOIN.
1 — Включено. Операторы IN/JOIN заменяются на GLOBAL IN/GLOBAL JOIN.

Использование

Хотя SET distributed_product_mode=global может изменить поведение запросов для распределённых таблиц, эта настройка не подходит для локальных таблиц или таблиц из внешних источников. В таких случаях применяется настройка prefer_global_in_and_join.

Например, у нас есть узлы, обслуживающие запросы и содержащие локальные таблицы, которые не подходят для распределения. Нам нужно распределять их данные «на лету» во время распределённой обработки с использованием ключевого слова GLOBAL — GLOBAL IN/GLOBAL JOIN.

Другой вариант использования prefer_global_in_and_join — доступ к таблицам, созданным внешними движками. Эта настройка помогает сократить количество обращений к внешним источникам при соединении таких таблиц: только один вызов на каждый запрос.

См. также:

Распределённые подзапросы для получения дополнительной информации об использовании GLOBAL IN/GLOBAL JOIN

prefer_localhost_replica

Включает/отключает предпочтительное использование локальной реплики (localhost) при обработке распределённых запросов.

Возможные значения:

1 — ClickHouse всегда отправляет запрос на локальную реплику, если она существует.
0 — ClickHouse использует стратегию балансировки, указанную в настройке load_balancing.

Примечание

Отключите этот параметр, если вы используете max_parallel_replicas без parallel_replicas_custom_key. Если для parallel_replicas_custom_key задано значение, отключайте этот параметр только в том случае, если он используется в кластере с несколькими шардами, содержащими несколько реплик. Если он используется в кластере с одним шардом и несколькими репликами, отключение этого параметра окажет негативное влияние.

prefer_warmed_unmerged_parts_seconds

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Если слитая часть моложе указанного количества секунд и не была предварительно прогрета (см. cache_populated_by_fetch), но все её исходные части доступны и предварительно прогреты, то SELECT-запросы будут считывать данные из этих исходных частей. Применяется только для Replicated-/SharedMergeTree. Обратите внимание, что здесь проверяется только факт обработки части CacheWarmer: если часть была помещена в кэш чем-то другим, она всё равно будет считаться «холодной», пока до неё не доберётся CacheWarmer; если же часть была прогрета, а затем вытеснена из кэша, она всё равно будет считаться «тёплой».

preferred_block_size_bytes

Этот параметр настраивает размер блока данных для обработки запросов и представляет собой дополнительную тонкую настройку по сравнению с более грубым параметром max_block_size. Если столбцы большие и при числе строк, равном max_block_size, ожидаемый размер блока, скорее всего, превышает указанное количество байт, его размер будет уменьшен для улучшения локальности кэша процессора.

preferred_max_column_in_block_size_bytes

Ограничение максимально допустимого размера столбца в блоке при чтении. Помогает уменьшить количество промахов кэша. Значение должно быть близко к размеру L2-кэша.

preferred_optimize_projection_name

Если параметр установлен в непустую строку, ClickHouse попытается применить указанную проекцию в запросе.

Возможные значения:

string: имя предпочтительной проекции

prefetch_buffer_size

Максимальный размер буфера предварительного чтения из файловой системы.

print_pretty_type_names

Позволяет выводить глубоко вложенные имена типов в более удобочитаемом виде с отступами в запросах DESCRIBE и в функции toTypeName().

Пример:

CREATE TABLE test (a Tuple(b String, c Tuple(d Nullable(UInt64), e Array(UInt32), f Array(Tuple(g String, h Map(String, Array(Tuple(i String, j UInt64))))), k Date), l Nullable(String))) ENGINE=Memory;
DESCRIBE TABLE test FORMAT TSVRaw SETTINGS print_pretty_type_names=1;

a   Tuple(
    b String,
    c Tuple(
        d Nullable(UInt64),
        e Array(UInt32),
        f Array(Tuple(
            g String,
            h Map(
                String,
                Array(Tuple(
                    i String,
                    j UInt64
                ))
            )
        )),
        k Date
    ),
    l Nullable(String)
)

priority

Приоритет запроса. 1 — наивысший, большее значение — более низкий приоритет; 0 — не использовать приоритет.

promql_database

Experimental feature. Learn more.

Указывает имя базы данных, используемой диалектом promql. Пустая строка означает текущую базу данных.

promql_evaluation_time

Experimental feature. Learn more.

Псевдонимы: evaluation_time

Устанавливает время вычисления, используемое диалектом PromQL. Значение auto означает текущее время.

promql_table

Experimental feature. Learn more.

Задаёт имя таблицы TimeSeries, используемой диалектом promql.

push_external_roles_in_interserver_queries

Включает передачу ролей пользователей с узла-инициатора на другие узлы при выполнении запроса.

query_cache_compress_entries

Сжимать записи в кэше запросов. Уменьшает потребление памяти кэшем запросов за счет более медленных операций вставки и чтения.

Возможные значения:

0 — отключено
1 — включено

query_cache_max_entries

Максимальное количество результатов запросов, которое текущий пользователь может сохранить в кэше запросов. 0 означает отсутствие ограничений.

Возможные значения:

Целое неотрицательное число (>= 0).

query_cache_max_size_in_bytes

Максимальный объем памяти (в байтах), который текущий пользователь может выделить в кэше запросов. 0 — без ограничений.

Возможные значения:

Положительное целое число >= 0.

query_cache_min_query_duration

Минимальная продолжительность в миллисекундах, в течение которой запрос должен выполняться, чтобы его результат был сохранён в кэше запросов.

Возможные значения:

Положительное целое число >= 0.

query_cache_min_query_runs

Минимальное количество запусков запроса SELECT, прежде чем его результат будет сохранён в кэше запросов.

Возможные значения:

Неотрицательное целое число (>= 0).

query_cache_nondeterministic_function_handling

Определяет, как кэш запросов обрабатывает SELECT-запросы с недетерминированными функциями, такими как rand() или now().

Возможные значения:

'throw' - Выбрасывать исключение и не кэшировать результат запроса.
'save' - Кэшировать результат запроса.
'ignore' - Не кэшировать результат запроса и не выбрасывать исключение.

query_cache_share_between_users

Если включено, результат запросов SELECT, кэшируемых в кэше запросов, может быть прочитан другими пользователями. Не рекомендуется включать этот параметр по соображениям безопасности.

Возможные значения:

0 — отключено
1 — включено

query_cache_squash_partial_results

Объединяет блоки частичных результатов в блоки размера max_block_size. Уменьшает производительность операций вставки в кеш запросов, но улучшает сжимаемость записей кеша (см. query_cache_compress-entries).

Возможные значения:

0 - Отключено
1 - Включено

query_cache_system_table_handling

Определяет, как кэш запросов обрабатывает запросы SELECT к системным таблицам, то есть таблицам в базах данных system.* и information_schema.*.

Возможные значения:

'throw' — Выдавать исключение и не кэшировать результат запроса.
'save' — Кэшировать результат запроса.
'ignore' — Не кэшировать результат запроса и не выдавать исключение.

query_cache_tag

Строка, которая служит меткой для записей кэша запросов. Одинаковые запросы с разными метками считаются кэшем запросов разными.

Возможные значения:

Любая строка

query_cache_ttl

По истечении указанного количества секунд записи в кеше запросов считаются устаревшими.

Возможные значения:

Положительное целое число >= 0.

query_condition_cache_store_conditions_as_plaintext

Сохраняет условие фильтра для кэша условий запросов в открытом (plaintext) виде. Если параметр включён, system.query_condition_cache показывает условие фильтра дословно, что упрощает отладку проблем с кэшем. По умолчанию параметр отключён, так как условие фильтра в открытом виде может раскрывать конфиденциальную информацию.

Возможные значения:

0 — Отключено
1 — Включено

query_metric_log_interval

Интервал в миллисекундах, с которым выполняется сбор query_metric_log для отдельных запросов.

Если установлено отрицательное значение, будет использоваться значение collect_interval_milliseconds из настройки query_metric_log или значение по умолчанию 1000, если оно не указано.

Чтобы отключить сбор для одного запроса, установите query_metric_log_interval в 0.

Значение по умолчанию: -1

query_plan_aggregation_in_order

Включает или отключает оптимизацию на уровне плана запроса для агрегации с сохранением порядка (in-order). Имеет эффект только если параметр query_plan_enable_optimizations установлен в 1.

Примечание

Это настройка для экспертов, которая должна использоваться только разработчиками для отладки. В будущем параметр может измениться несовместимым с прошлой версией образом или быть удалён.

Возможные значения:

0 — Отключить
1 — Включить

query_plan_convert_any_join_to_semi_or_anti_join

Позволяет преобразовывать ANY JOIN в SEMI или ANTI JOIN, если фильтр после JOIN всегда принимает значение false для несовпадающих или совпадающих строк

query_plan_convert_join_to_in

Разрешает преобразовывать JOIN в подзапрос с IN, если выходные столбцы зависят только от левой таблицы. Может приводить к неверным результатам для JOIN, отличных от ANY (например, ALL JOIN, используемого по умолчанию).

query_plan_convert_outer_join_to_inner_join

Разрешает преобразование OUTER JOIN в INNER JOIN, если фильтр после JOIN всегда отфильтровывает значения по умолчанию

query_plan_direct_read_from_text_index

Позволяет выполнять фильтрацию при полнотекстовом поиске, используя в плане запроса только инвертированный индекс.

query_plan_display_internal_aliases

Показывать внутренние псевдонимы (например __table1) в EXPLAIN PLAN вместо тех, которые указаны в исходном запросе.

query_plan_enable_multithreading_after_window_functions

Включает многопоточность после вычисления оконных функций, что позволяет параллельно обрабатывать потоки данных

query_plan_enable_optimizations

Включает или отключает оптимизацию запросов на уровне плана запроса.

Примечание

Это настройка экспертного уровня, которую разработчики должны использовать только для целей отладки. В будущем настройка может измениться несовместимым с предыдущими версиями способом или быть удалена.

Возможные значения:

0 - Отключить все оптимизации на уровне плана запроса
1 - Включить оптимизации на уровне плана запроса (но отдельные оптимизации всё ещё могут быть отключены с помощью их индивидуальных настроек)

query_plan_execute_functions_after_sorting

Переключает оптимизацию на уровне плана запроса, которая переносит вычисление выражений на этапы после сортировки. Вступает в силу только если параметр query_plan_enable_optimizations установлен в 1.

Примечание

Это параметр для экспертов, который следует использовать только для отладки разработчиками. В будущем он может измениться с нарушением обратной совместимости или быть удалён.

Возможные значения:

0 — отключить
1 — включить

query_plan_filter_push_down

Включает или отключает оптимизацию на уровне плана запроса, которая перемещает фильтры глубже в план выполнения. Действует только в том случае, если параметр query_plan_enable_optimizations установлен в 1.

Примечание

Это параметр для опытных пользователей, который разработчики должны использовать только для отладки. В будущем параметр может измениться с нарушением обратной совместимости или быть удалён.

Возможные значения:

0 - Отключить
1 - Включить

query_plan_join_shard_by_pk_ranges

Выполнять шардирование для JOIN, если ключи соединения содержат префикс PRIMARY KEY обеих таблиц. Поддерживается для алгоритмов hash, parallel_hash и full_sorting_merge. Как правило, не ускоряет выполнение запросов, но может уменьшить потребление памяти.

query_plan_join_swap_table

Определяет, какая сторона соединения должна быть build-таблицей (также называемой inner — той, которая вставляется в хеш-таблицу для хешевого соединения) в плане выполнения запроса. Этот параметр поддерживается только для строгости соединения ALL с предложением JOIN ON. Возможные значения:

'auto': позволить планировщику решить, какую таблицу использовать как build-таблицу.
- 'false': никогда не менять таблицы местами (правая таблица является build-таблицей).
- 'true': всегда менять таблицы местами (левая таблица является build-таблицей).

query_plan_lift_up_array_join

Включает или отключает оптимизацию на уровне плана запроса, которая переносит операции ARRAY JOIN выше в плане выполнения. Применяется только если настройка query_plan_enable_optimizations равна 1.

Примечание

Это настройка экспертного уровня, которую должны использовать только разработчики для отладки. В будущем настройка может измениться с нарушением обратной совместимости или быть удалена.

Возможные значения:

0 - Отключить
1 - Включить

query_plan_lift_up_union

Включает оптимизацию на уровне плана запроса, которая поднимает более крупные поддеревья плана запроса в UNION, чтобы дать возможность дальнейшим оптимизациям. Применяется только если настройка query_plan_enable_optimizations равна 1.

Примечание

Это экспертная настройка, которую следует использовать только разработчикам для отладки. В будущем параметр может быть изменён несовместимым образом или удалён.

Возможные значения:

0 — Отключить
1 — Включить

query_plan_max_limit_for_lazy_materialization

Управляет максимальным пороговым значением, при котором можно использовать план запроса для оптимизации ленивой материализации. При нулевом значении ограничение отсутствует.

query_plan_max_optimizations_to_apply

Ограничивает общее количество оптимизаций, применяемых к плану запроса, см. настройку query_plan_enable_optimizations. Полезно для предотвращения чрезмерно долгой оптимизации сложных запросов. В запросе EXPLAIN PLAN оптимизации перестают применяться после достижения этого лимита, и план возвращается как есть. При обычном выполнении запроса, если фактическое количество оптимизаций превышает это значение настройки, выбрасывается исключение.

Примечание

Это настройка экспертного уровня, которую следует использовать только для отладки разработчиками. В будущем настройка может быть изменена с нарушением обратной совместимости или удалена.

query_plan_max_step_description_length

Максимальная длина описания шага в EXPLAIN PLAN.

query_plan_merge_expressions

Включает или отключает оптимизацию на уровне плана запроса, объединяющую последовательные фильтры. Применяется только если параметр query_plan_enable_optimizations установлен в значение 1.

Примечание

Это параметр для экспертов, который следует использовать только разработчикам для отладки. В будущем он может быть изменён с нарушением обратной совместимости или удалён.

Возможные значения:

0 — Отключить
1 — Включить

query_plan_merge_filter_into_join_condition

Позволяет объединять фильтр с условием JOIN и преобразовывать CROSS JOIN в INNER JOIN.

query_plan_merge_filters

Разрешает объединять фильтры в плане запроса.

query_plan_optimize_join_order_limit

Оптимизирует порядок операций JOIN в пределах одного и того же подзапроса. В настоящее время поддерживается только для очень ограниченного числа случаев. Значение задаёт максимальное количество таблиц, для которых выполняется оптимизация.

query_plan_optimize_lazy_materialization

Использовать план запроса для оптимизации отложенной материализации.

query_plan_optimize_prewhere

Разрешает проталкивать фильтр в выражение PREWHERE для поддерживаемых хранилищ

query_plan_push_down_limit

Включает оптимизацию на уровне плана запроса, которая перемещает операторы LIMIT вниз по плану выполнения. Вступает в силу только если настройка query_plan_enable_optimizations установлена в 1.

Примечание

Это экспертная настройка, которую разработчики должны использовать только для отладки. Настройка может измениться в будущем с нарушением обратной совместимости или быть удалена.

Возможные значения:

0 - Отключить
1 - Включить

query_plan_read_in_order

Включает или отключает оптимизацию чтения в упорядоченном виде на уровне плана запроса. Применяется только если настройка query_plan_enable_optimizations установлена в 1.

Примечание

Это настройка экспертного уровня, которую следует использовать только разработчикам для отладки. В будущем она может быть изменена с нарушением обратной совместимости или удалена.

Возможные значения:

0 - Отключить
1 - Включить

query_plan_remove_redundant_distinct

Включает или отключает оптимизацию на уровне плана запроса, которая удаляет избыточные шаги DISTINCT. Влияет на выполнение только в том случае, если настройка query_plan_enable_optimizations установлена в 1.

Примечание

Это настройка экспертного уровня, которую разработчикам следует использовать только для отладки. В будущем настройка может быть изменена с нарушением обратной совместимости или удалена.

Возможные значения:

0 — Отключить
1 — Включить

query_plan_remove_redundant_sorting

Включает или отключает оптимизацию на уровне плана запроса, которая удаляет избыточные шаги сортировки, например в подзапросах. Вступает в силу только если настройка query_plan_enable_optimizations равна 1.

Примечание

Это настройка экспертного уровня, предназначенная только для использования разработчиками при отладке. В будущем она может измениться несовместимым с предыдущими версиями образом или быть удалена.

Возможные значения:

0 - Отключить
1 - Включить

query_plan_remove_unused_columns

Включает или отключает оптимизацию на уровне плана запроса, которая пытается удалить неиспользуемые столбцы (как входные, так и выходные) из шагов плана запроса. Применяется только если настройка query_plan_enable_optimizations равна 1.

Примечание

Это настройка экспертного уровня, которая должна использоваться только для отладки разработчиками. В будущем настройка может измениться несовместимым образом или быть удалена.

Возможные значения:

0 - Отключить
1 - Включить

query_plan_reuse_storage_ordering_for_window_functions

Включает оптимизацию на уровне плана запроса, которая использует порядок данных в хранилище при сортировке для оконных функций. Применяется только в том случае, если параметр query_plan_enable_optimizations равен 1.

Примечание

Это параметр для экспертов, который должен использоваться только разработчиками для отладки. В будущем его поведение может быть изменено с нарушением обратной совместимости или параметр может быть удалён.

Возможные значения:

0 - Отключить
1 - Включить

query_plan_split_filter

Примечание

Это настройка экспертного уровня, предназначенная только для использования разработчиками при отладке. В будущем она может быть изменена с нарушением обратной совместимости или удалена.

Включает оптимизацию на уровне плана запроса, которая разбивает фильтры на выражения. Применяется только если настройка query_plan_enable_optimizations равна 1.

Возможные значения:

0 — Отключить
1 — Включить

query_plan_try_use_vector_search

Управляет оптимизацией на уровне плана запроса, которая пытается использовать индекс векторного сходства. Вступает в силу только если настройка query_plan_enable_optimizations равна 1.

Примечание

Это настройка для экспертов, которую следует использовать только разработчикам для отладки. В будущем она может быть изменена несовместимым образом или удалена.

Возможные значения:

0 — Отключить
1 — Включить

query_plan_use_new_logical_join_step

Псевдонимы: query_plan_use_logical_join_step

Использовать логический шаг join в плане запроса. Примечание: параметр query_plan_use_new_logical_join_step устарел, вместо него используйте query_plan_use_logical_join_step.

query_profiler_cpu_time_period_ns

Устанавливает период таймера по времени работы CPU для профилировщика запросов. Этот таймер учитывает только процессорное время.

Возможные значения:

Положительное целое число наносекунд.

Рекомендуемые значения:
- 10000000 (100 раз в секунду) наносекунд и больше для отдельных запросов.
- 1000000000 (раз в секунду) для профилирования на уровне всего кластера.
0 для отключения таймера.

Параметр временно недоступен в ClickHouse Cloud.

См. также:

Системная таблица trace_log

query_profiler_real_time_period_ns

Задаёт период таймера реального времени для профилировщика запросов. Таймер реального времени измеряет «настенное» (реальное) время.

Возможные значения:

Положительное целое число в наносекундах.

Рекомендуемые значения:
- 10000000 наносекунд (100 раз в секунду) и меньше для одиночных запросов.
- 1000000000 наносекунд (раз в секунду) для профилирования на уровне кластера.
0 для отключения таймера.

Временно отключено в ClickHouse Cloud.

См. также:

Системная таблица trace_log

queue_max_wait_ms

Время ожидания в очереди запросов, если количество одновременных запросов превышает допустимый максимум.

rabbitmq_max_wait_ms

Время ожидания при чтении из RabbitMQ перед повторной попыткой.

read_backoff_max_throughput

Настройка для уменьшения количества потоков в случае медленного чтения. Событие учитывается, когда пропускная способность чтения меньше указанного количества байт в секунду.

read_backoff_min_concurrency

Настройка, позволяющая стараться сохранять минимальное число потоков при медленном чтении.

read_backoff_min_events

Настройка для уменьшения числа потоков при медленном чтении. Количество событий, после которого число потоков будет уменьшено.

read_backoff_min_interval_between_events_ms

Параметр для уменьшения числа потоков в случае медленного чтения. Событие игнорируется, если с момента предыдущего прошло меньше заданного интервала времени.

read_backoff_min_latency_ms

Параметр для уменьшения числа потоков в случае медленных операций чтения. Учитываются только операции чтения, которые заняли не менее этого времени.

read_from_distributed_cache_if_exists_otherwise_bypass_cache

ClickHouse Cloud only

Имеет эффект только в ClickHouse Cloud. Аналог настройки read_from_filesystem_cache_if_exists_otherwise_bypass_cache, но для распределённого кэша.

read_from_filesystem_cache_if_exists_otherwise_bypass_cache

Позволяет использовать файловый кэш в пассивном режиме — пользоваться уже существующими записями кэша, но не добавлять новые записи в кэш. Если включить этот параметр для тяжёлых ad-hoc‑запросов и оставить его выключенным для коротких запросов реального времени, это позволит избежать «вытеснения» кэша слишком тяжёлыми запросами и повысить общую эффективность системы.

read_from_page_cache_if_exists_otherwise_bypass_cache

Использовать кэш страниц в пространстве пользователя в пассивном режиме, аналогично read_from_filesystem_cache_if_exists_otherwise_bypass_cache.

read_in_order_two_level_merge_threshold

Минимальное число частей, которые нужно прочитать, чтобы запустить предварительный этап слияния при многопоточном чтении в порядке первичного ключа.

read_in_order_use_buffering

Включает буферизацию перед слиянием при чтении данных в порядке первичного ключа. Повышает степень параллелизма выполнения запроса.

read_in_order_use_virtual_row

Использовать виртуальную строку при чтении в порядке первичного ключа или монотонной функции от него. Полезно при поиске по нескольким частям, поскольку обрабатываются только релевантные части.

read_overflow_mode

Что делать при превышении лимита.

read_overflow_mode_leaf

Задает поведение при превышении объема считываемых данных одного из лимитов на уровне листьев.

Возможные варианты:

throw: выбросить исключение (по умолчанию).
break: прекратить выполнение запроса и вернуть частичный результат.

read_priority

Приоритет чтения данных с локальной или удалённой файловой системы. Поддерживается только для метода pread_threadpool для локальной файловой системы и метода threadpool для удалённой файловой системы.

read_through_distributed_cache

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Разрешает чтение из распределённого кэша.

readonly

0 — ограничения режима только для чтения не применяются. 1 — только запросы на чтение, а также изменение явно разрешённых настроек. 2 — только запросы на чтение, а также изменение настроек, за исключением настройки 'readonly'.

receive_data_timeout_ms

Таймаут ожидания первого пакета данных или пакета с положительным прогрессом от реплики

receive_timeout

Таймаут ожидания получения данных из сети в секундах. Если в течение этого интервала не было получено ни одного байта, генерируется исключение. Если вы зададите этот параметр на клиенте, то для сокета также будет установлен параметр send_timeout на соответствующей стороне соединения на сервере.

regexp_max_matches_per_row

Устанавливает максимальное количество совпадений одного регулярного выражения для одной строки. Используйте этот параметр, чтобы защититься от чрезмерного потребления памяти при использовании жадных регулярных выражений в функции extractAllGroupsHorizontal.

Возможные значения:

Положительное целое число.

reject_expensive_hyperscan_regexps

Отклонять шаблоны, вычисление которых с помощью Hyperscan, вероятнее всего, будет слишком ресурсоёмким (из‑за взрывного роста числа состояний NFA)

remerge_sort_lowered_memory_bytes_ratio

Если использование памяти после повторной сортировки не уменьшается как минимум в заданное число раз, повторная сортировка будет отключена.

remote_filesystem_read_method

Метод чтения данных из удалённой файловой системы, один из: read, threadpool.

remote_filesystem_read_prefetch

Использует упреждающее чтение при чтении данных из удалённой файловой системы.

remote_fs_read_backoff_max_tries

Максимальное количество попыток чтения с экспоненциальной задержкой

remote_fs_read_max_backoff_ms

Максимальное время ожидания при попытке прочитать данные с удалённого диска

remote_read_min_bytes_for_seek

Минимальное количество байт, необходимое для удалённого чтения (URL, S3), при котором выполняется операция seek вместо чтения с параметром ignore.

rename_files_after_processing

Тип: Строка
Значение по умолчанию: Пустая строка

Этот параметр позволяет задать шаблон переименования файлов, обрабатываемых табличной функцией file. Если параметр задан, все файлы, читаемые табличной функцией file, будут переименованы в соответствии с указанным шаблоном с плейсхолдерами, но только в случае успешной обработки файлов.

Подстановки

%a — Полное исходное имя файла (например, «sample.csv»).
%f — Исходное имя файла без расширения (например, «sample»).
%e — Исходное расширение файла с точкой (например, «.csv»).
%t — Временная метка (в микросекундах).
%% — Знак процента («%»).

Пример

Опция: --rename_files_after_processing="processed_%f_%t%e"
Запрос: SELECT * FROM file('sample.csv')

Если файл sample.csv был успешно прочитан, он будет переименован в processed_sample_1683473210851438.csv

replace_running_query

При использовании HTTP-интерфейса можно передать параметр query_id. Это любая строка, служащая идентификатором запроса. Если в этот момент уже существует запрос от того же пользователя с тем же query_id, поведение зависит от параметра replace_running_query.

0 (по умолчанию) – выбрасывать исключение (не позволять выполнению запроса, если запрос с тем же query_id уже выполняется).

1 – отменить старый запрос и запустить новый.

Установите этот параметр в 1 для реализации подсказок при задании условий сегментации. После ввода следующего символа, если старый запрос ещё не завершился, он должен быть отменён.

replace_running_query_max_wait_ms

Время ожидания завершения запущенного запроса с тем же query_id, когда включена настройка replace_running_query.

Возможные значения:

Положительное целое число.
0 — Генерируется исключение, не позволяющее запустить новый запрос, если сервер уже выполняет запрос с тем же query_id.

replication_wait_for_inactive_replica_timeout

Определяет, как долго (в секундах) ожидать выполнения запросов ALTER, OPTIMIZE или TRUNCATE неактивными репликами.

Возможные значения:

0 — не ждать.
Отрицательное целое число — ждать неограниченное время.
Положительное целое число — количество секунд ожидания.

restore_replace_external_dictionary_source_to_null

Заменяет источники внешних словарей на Null при восстановлении. Полезно для тестирования.

restore_replace_external_engines_to_null

Для тестирования. Заменяет все внешние движки на Null, чтобы не устанавливать внешние соединения.

restore_replace_external_table_functions_to_null

Для тестирования. Заменяет все внешние табличные функции на Null, чтобы не инициировать внешние подключения.

restore_replicated_merge_tree_to_shared_merge_tree

Заменяет движок таблицы ReplicatedMergeTree на SharedMergeTree при выполнении RESTORE.

result_overflow_mode

Значение по умолчанию в Cloud: throw

Определяет, что делать, если объём результата превышает один из лимитов.

Возможные значения:

throw: сгенерировать исключение (значение по умолчанию).
break: остановить выполнение запроса и вернуть частичный результат, как если бы исходные данные закончились.

Использование 'break' аналогично использованию LIMIT. Break прерывает выполнение только на уровне блока. Это означает, что количество возвращаемых строк будет больше значения max_result_rows, будет кратно max_block_size и будет зависеть от max_threads.

Пример

SET max_threads = 3, max_block_size = 3333;
SET max_result_rows = 3334, result_overflow_mode = 'break';

SELECT *
FROM numbers_mt(100000)
FORMAT Null;

6666 rows in set. ...

rewrite_count_distinct_if_with_count_distinct_implementation

Позволяет перезаписывать countDistinctIf с помощью параметра count_distinct_implementation.

Возможные значения:

true — разрешить.
false — запретить.

rewrite_in_to_join

Experimental feature. Learn more.

Переписывает выражения вида x IN subquery в JOIN. Это может быть полезно для оптимизации всего запроса за счёт переупорядочивания операций JOIN.

s3_allow_multipart_copy

Разрешает многокомпонентное (multipart) копирование в S3.

s3_allow_parallel_part_upload

Использовать несколько потоков для многосоставной (multipart) загрузки в S3. Это может привести к немного более высокому потреблению памяти

s3_check_objects_after_upload

Проверять каждый загруженный в S3 объект с помощью HEAD-запроса, чтобы убедиться, что загрузка прошла успешно

s3_connect_timeout_ms

Таймаут подключения к хосту, используемому дисками S3.

s3_create_new_file_on_insert

Включает или отключает создание нового файла при каждой вставке в таблицы с движком S3. Если включено, при каждой вставке будет создаваться новый объект S3 с ключом по следующему шаблону:

например: data.Parquet.gz -> data.1.Parquet.gz -> data.2.Parquet.gz и т.д.

Возможные значения:

0 — запрос INSERT создает новый файл или завершается с ошибкой, если файл уже существует и s3_truncate_on_insert не установлен.
1 — запрос INSERT создает новый файл при каждой вставке, используя суффикс (начиная со второго файла), если s3_truncate_on_insert не установлен.

Подробнее см. здесь.

s3_disable_checksum

Не вычисляет контрольную сумму при отправке файла в S3. Это ускоряет операции записи, так как позволяет избежать лишних проходов обработки файла. В большинстве случаев это безопасно, поскольку данные таблиц MergeTree в любом случае снабжаются контрольными суммами в ClickHouse, а при доступе к S3 по HTTPS уровень TLS уже обеспечивает целостность при передаче по сети. Дополнительные контрольные суммы на стороне S3 служат еще одним уровнем защиты.

s3_ignore_file_doesnt_exist

Игнорировать отсутствие файла при чтении некоторых ключей, если он не существует.

Возможные значения:

1 — SELECT возвращает пустой результат.
0 — SELECT вызывает исключение.

s3_list_object_keys_size

Максимальное количество файлов, которое может быть возвращено одним пакетным запросом ListObject

s3_max_connections

Максимальное количество подключений к одному серверу.

s3_max_get_burst

Максимальное количество запросов, которое может быть отправлено одновременно перед достижением лимита запросов в секунду. По умолчанию значение 0 соответствует s3_max_get_rps.

s3_max_get_rps

Лимит числа запросов S3 GET в секунду, после превышения которого включается ограничение пропускной способности. Ноль означает отсутствие лимита.

s3_max_inflight_parts_for_one_file

Максимальное количество одновременно загружаемых частей в multipart‑запросе на загрузку. 0 означает отсутствие ограничений.

s3_max_part_number

Максимальный порядковый номер части при загрузке в S3.

s3_max_put_burst

Максимальное количество запросов, которые могут быть отправлены одновременно до достижения ограничения по числу запросов в секунду. Значение по умолчанию (0) равно s3_max_put_rps.

s3_max_put_rps

Ограничение на частоту запросов S3 PUT в секунду, после превышения которого включается троттлинг. Ноль означает отсутствие лимита.

s3_max_single_operation_copy_size

Максимальный размер для однократной операции копирования в S3. Этот параметр используется только, если s3_allow_multipart_copy установлено в значение true.

s3_max_single_part_upload_size

Максимальный размер объекта, загружаемого в S3 при однократной (single-part) загрузке.

s3_max_single_read_retries

Максимальное количество повторных попыток для одной операции чтения из S3.

s3_max_unexpected_write_error_retries

Максимальное число повторных попыток в случае неожиданных ошибок при записи в S3.

s3_max_upload_part_size

Максимальный размер части объекта при многочастной (multipart) загрузке в S3.

s3_min_upload_part_size

Минимальный размер части данных при многокомпонентной загрузке в S3.

s3_request_timeout_ms

Таймаут простоя для отправки и получения данных в S3 и из него. Считать операцию неудачной, если одиночный вызов чтения или записи по TCP блокируется дольше этого времени.

s3_skip_empty_files

Включает или отключает пропуск пустых файлов в таблицах движка S3.

Возможные значения:

0 — SELECT выбрасывает исключение, если пустой файл не совместим с запрошенным форматом.
1 — SELECT возвращает пустой результат для пустого файла.

s3_slow_all_threads_after_network_error

Если установлено значение true, все потоки, выполняющие S3‑запросы к одной и той же конечной точке резервного копирования, замедляются после того, как любой отдельный S3‑запрос получает повторяемую сетевую ошибку, например тайм-аут сокета. Если установлено значение false, каждый поток обрабатывает замедление (backoff) S3‑запросов независимо от остальных.

s3_strict_upload_part_size

Точный размер фрагмента для загрузки при многокомпонентной (multipart) загрузке в S3 (некоторые реализации не поддерживают фрагменты переменного размера).

s3_throw_on_zero_files_match

Вызывает ошибку, если запрос ListObjects не находит ни одного файла

s3_truncate_on_insert

Включает или отключает очистку содержимого перед вставками в таблицы движка S3. Если параметр отключен, при попытке вставки будет сгенерировано исключение, если объект в S3 уже существует.

Возможные значения:

0 — запрос INSERT создает новый файл или завершается с ошибкой, если файл уже существует и параметр s3_create_new_file_on_insert не установлен.
1 — запрос INSERT заменяет существующее содержимое файла новыми данными.

Подробнее см. здесь.

s3_upload_part_size_multiply_factor

Умножает s3_min_upload_part_size на этот коэффициент каждый раз, когда при одной операции записи в S3 было загружено s3_multiply_parts_count_threshold частей.

s3_upload_part_size_multiply_parts_count_threshold

Каждый раз, когда в S3 загружается такое количество частей, значение s3_min_upload_part_size умножается на s3_upload_part_size_multiply_factor.

s3_use_adaptive_timeouts

Если установлено значение true, то для всех запросов к S3 первые две попытки выполняются с короткими таймаутами отправки и получения. Если установлено значение false, то все попытки выполняются с одинаковыми таймаутами.

s3_validate_request_settings

Включает проверку настроек запросов к S3. Возможные значения:

1 — проверять настройки.
0 — не проверять настройки.

s3queue_default_zookeeper_path

Префикс пути ZooKeeper по умолчанию для движка S3Queue

s3queue_enable_logging_to_s3queue_log

Включает запись в журнал system.s3queue_log. Значение можно переопределить для конкретной таблицы с помощью настроек таблицы.

s3queue_keeper_fault_injection_probability

Вероятность инъекции отказов Keeper для S3Queue.

s3queue_migrate_old_metadata_to_buckets

Мигрирует старую структуру метаданных таблицы S3Queue в новую

schema_inference_cache_require_modification_time_for_url

Использовать схему из кэша для URL-адресов с проверкой времени последнего изменения (для URL-адресов с заголовком Last-Modified)

schema_inference_use_cache_for_azure

Использовать кэш при определении схемы при использовании табличной функции azure

schema_inference_use_cache_for_file

Использовать кэш при определении схемы при использовании табличной функции file

schema_inference_use_cache_for_hdfs

Использовать кэш при выводе схемы при использовании табличной функции hdfs

schema_inference_use_cache_for_s3

Использовать кэш для вывода схемы при использовании табличной функции S3

schema_inference_use_cache_for_url

Использовать кэш для определения схемы при использовании табличной функции url

secondary_indices_enable_bulk_filtering

Включает алгоритм пакетной фильтрации для индексов. Предполагается, что он всегда работает лучше, однако эта настройка предусмотрена для совместимости и контроля.

select_sequential_consistency

Примечание

Параметр ведёт себя по-разному в SharedMergeTree и ReplicatedMergeTree. Дополнительную информацию о поведении select_sequential_consistency в SharedMergeTree см. в разделе SharedMergeTree consistency.

Включает или отключает последовательную согласованность для запросов SELECT. Требует отключения параметра insert_quorum_parallel (по умолчанию включён).

Возможные значения:

0 — Отключено.
1 — Включено.

Использование

Когда последовательная согласованность включена, ClickHouse позволяет клиенту выполнять запрос SELECT только к тем репликам, которые содержат данные всех предыдущих запросов INSERT, выполнявшихся с insert_quorum. Если клиент обращается к неполной реплике, ClickHouse сгенерирует исключение. Запрос SELECT не будет включать данные, которые ещё не были записаны в кворум реплик.

Когда insert_quorum_parallel включён (значение по умолчанию), select_sequential_consistency не работает. Это связано с тем, что параллельные запросы INSERT могут быть записаны в разные наборы кворумных реплик, поэтому нет гарантии, что одна реплика получит все записи.

См. также:

insert_quorum
insert_quorum_timeout
insert_quorum_parallel

send_logs_level

Отправляет текстовые логи сервера клиенту, начиная с указанного минимального уровня. Допустимые значения: 'trace', 'debug', 'information', 'warning', 'error', 'fatal', 'none'

send_logs_source_regexp

Отправлять текстовые серверные логи, имя источника которых соответствует заданному регулярному выражению. Пустое значение означает все источники.

send_profile_events

Включает или отключает отправку клиенту пакетов ProfileEvents.

Настройку можно отключить для уменьшения сетевого трафика у клиентов, которым не требуются события профиля.

Возможные значения:

0 — выключено.
1 — включено.

send_progress_in_http_headers

Включает или отключает HTTP-заголовки X-ClickHouse-Progress в ответах clickhouse-server.

Для получения дополнительной информации см. описание HTTP-интерфейса.

Возможные значения:

0 — Отключено.
1 — Включено.

send_timeout

Таймаут отправки данных в сеть, в секундах. Если клиенту необходимо отправить данные, но он не может передать ни одного байта в течение этого интервала, будет сгенерировано исключение. Если вы задаёте этот параметр на стороне клиента, то на соответствующем конце соединения на сервере для сокета также будет установлен параметр receive_timeout.

serialize_query_plan

Сериализовать план запроса для распределённой обработки

session_timezone

Beta feature. Learn more.

Устанавливает неявный часовой пояс текущего сеанса или запроса. Неявный часовой пояс — это часовой пояс, применяемый к значениям типа DateTime/DateTime64, для которых явно не указан часовой пояс. Этот параметр имеет приоритет над глобальной настройкой (на уровне сервера) неявного часового пояса. Значение '' (пустая строка) означает, что неявный часовой пояс текущего сеанса или запроса равен часовому поясу сервера.

Вы можете использовать функции timeZone() и serverTimeZone() чтобы получить часовой пояс сеанса и часовой пояс сервера.

Возможные значения:

Любое имя часового пояса из system.time_zones, например Europe/Berlin, UTC или Zulu

Примеры:

SELECT timeZone(), serverTimeZone() FORMAT CSV

"Europe/Berlin","Europe/Berlin"

SELECT timeZone(), serverTimeZone() SETTINGS session_timezone = 'Asia/Novosibirsk' FORMAT CSV

"Asia/Novosibirsk","Europe/Berlin"

Установите часовой пояс сеанса 'America/Denver' для внутреннего DateTime, у которого явно не указан часовой пояс:

SELECT toDateTime64(toDateTime64('1999-12-12 23:23:23.123', 3), 3, 'Europe/Zurich') SETTINGS session_timezone = 'America/Denver' FORMAT TSV

1999-12-13 07:23:23.123

Примечание

Не все функции, выполняющие разбор значений типов DateTime/DateTime64, учитывают session_timezone. Это может приводить к трудноуловимым ошибкам. См. следующий пример и пояснение.

CREATE TABLE test_tz (`d` DateTime('UTC')) ENGINE = Memory AS SELECT toDateTime('2000-01-01 00:00:00', 'UTC');

SELECT *, timeZone() FROM test_tz WHERE d = toDateTime('2000-01-01 00:00:00') SETTINGS session_timezone = 'Asia/Novosibirsk'
0 rows in set.

SELECT *, timeZone() FROM test_tz WHERE d = '2000-01-01 00:00:00' SETTINGS session_timezone = 'Asia/Novosibirsk'
┌───────────────────d─┬─timeZone()───────┐
│ 2000-01-01 00:00:00 │ Asia/Novosibirsk │
└─────────────────────┴──────────────────┘

Это происходит из-за разных конвейеров обработки:

toDateTime() без явно заданного часового пояса, используемый в первом запросе SELECT, учитывает настройку session_timezone и глобальный часовой пояс.
Во втором запросе значение типа DateTime разбирается из String и наследует тип и часовой пояс существующего столбца d. Поэтому настройка session_timezone и глобальный часовой пояс не учитываются.

См. также

timezone

set_overflow_mode

Задаёт поведение при превышении одного из лимитов по объёму данных.

Возможные значения:

throw: выбросить исключение (по умолчанию).
break: остановить выполнение запроса и вернуть частичный результат, как если бы исходные данные закончились.

shared_merge_tree_sync_parts_on_partition_operations

Автоматически синхронизирует набор частей данных после операций MOVE|REPLACE|ATTACH с партициями в таблицах SMT. Только в ClickHouse Cloud

short_circuit_function_evaluation

Позволяет вычислять функции if, multiIf, and и or по сокращённой схеме вычисления. Это помогает оптимизировать выполнение сложных выражений в этих функциях и предотвратить возможные исключения (например, деление на ноль, когда оно не должно выполняться).

Возможные значения:

enable — Включает сокращённое вычисление для функций, для которых оно подходит (могут выбрасывать исключение или являются вычислительно затратными).
force_enable — Включает сокращённое вычисление для всех функций.
disable — Отключает сокращённое вычисление функций.

short_circuit_function_evaluation_for_nulls

Оптимизирует вычисление функций, которые возвращают NULL, если любой из аргументов имеет значение NULL. Когда доля значений NULL в аргументах функции превышает порог short_circuit_function_evaluation_for_nulls_threshold, система перестаёт вычислять функцию построчно. Вместо этого она сразу возвращает NULL для всех строк, избегая ненужных вычислений.

short_circuit_function_evaluation_for_nulls_threshold

Пороговое значение доли значений NULL, при котором функции с аргументами типа Nullable выполняются только для строк, в которых все аргументы имеют значения, отличные от NULL. Применяется, когда включена настройка short_circuit_function_evaluation_for_nulls. Когда отношение количества строк, содержащих значения NULL, к общему числу строк превышает этот порог, строки, содержащие значения NULL, не участвуют в вычислениях.

show_data_lake_catalogs_in_system_tables

Включает отображение каталогов Data Lake в системных таблицах.

show_processlist_include_internal

Показывать внутренние вспомогательные процессы в выводе запроса SHOW PROCESSLIST.

К внутренним процессам относятся перезагрузки словарей, перезагрузки обновляемых материализованных представлений, вспомогательные SELECT-запросы, выполняемые в запросах SHOW ..., вспомогательные запросы CREATE DATABASE ..., автоматически выполняемые внутри системы для обработки повреждённых таблиц, и т. п.

show_table_uuid_in_table_create_query_if_not_nil

Настраивает формат вывода результата запроса SHOW TABLE.

Возможные значения:

0 — запрос отображается без UUID таблицы.
1 — запрос отображается с UUID таблицы.

single_join_prefer_left_table

Для одиночного JOIN при неоднозначности идентификаторов отдавать предпочтение левой таблице.

skip_redundant_aliases_in_udf

Избыточные псевдонимы не используются (не подставляются) в пользовательских функциях, чтобы упростить их использование.

Возможные значения:

1 — Псевдонимы пропускаются (подставляются) в UDF.
0 — Псевдонимы не пропускаются (не подставляются) в UDF.

Пример

Разница между включённой и отключённой настройкой:

Запрос:

SET skip_redundant_aliases_in_udf = 0;
CREATE FUNCTION IF NOT EXISTS test_03274 AS ( x ) -> ((x + 1 as y, y + 2));

EXPLAIN SYNTAX SELECT test_03274(4 + 2);

Результат:

SELECT ((4 + 2) + 1 AS y, y + 2)

Запрос:

SET skip_redundant_aliases_in_udf = 1;
CREATE FUNCTION IF NOT EXISTS test_03274 AS ( x ) -> ((x + 1 as y, y + 2));

EXPLAIN SYNTAX SELECT test_03274(4 + 2);

Результат:

SELECT ((4 + 2) + 1, ((4 + 2) + 1) + 2)

skip_unavailable_shards

Включает или отключает бесшумный пропуск недоступных шардов.

Шард считается недоступным, если все его реплики недоступны. Реплика считается недоступной в следующих случаях:

ClickHouse не может подключиться к реплике по какой-либо причине.

При подключении к реплике ClickHouse выполняет несколько попыток. Если все эти попытки завершаются неудачей, реплика считается недоступной.
Реплика не может быть разрешена через DNS.

Если имя хоста реплики не может быть разрешено через DNS, это может указывать на следующие ситуации:
- У хоста реплики нет DNS-записи. Это может происходить в системах с динамическим DNS, например, в Kubernetes, где узлы во время простоя могут не разрешаться по DNS, и это не является ошибкой.
- Ошибка конфигурации. Файл конфигурации ClickHouse содержит неверное имя хоста.

Возможные значения:

1 — пропуск включён.

Если шард недоступен, ClickHouse возвращает результат на основе частичных данных и не сообщает о проблемах с доступностью узла.
0 — пропуск отключён.

Если шард недоступен, ClickHouse генерирует исключение.

sleep_after_receiving_query_ms

Время задержки после получения запроса в TCPHandler

sleep_in_send_data_ms

Время задержки (sleep) при отправке данных в TCPHandler

sleep_in_send_tables_status_ms

Длительность паузы при отправке ответа о статусе таблиц в TCPHandler

sort_overflow_mode

Определяет, что происходит, если количество строк, полученных до сортировки, превышает установленный предел.

Возможные значения:

throw: выбросить исключение.
break: остановить выполнение запроса и вернуть частичный результат.

split_intersecting_parts_ranges_into_layers_final

Разбивать пересекающиеся диапазоны частей на слои во время оптимизации FINAL

split_parts_ranges_into_intersecting_and_non_intersecting_final

Разбивать диапазоны партиций на пересекающиеся и непересекающиеся при оптимизации FINAL

splitby_max_substrings_includes_remaining_string

Контролирует, будет ли функция splitBy*() при значении аргумента max_substrings > 0 включать оставшуюся строку в последний элемент результирующего массива.

Возможные значения:

0 - оставшаяся строка не включается в последний элемент результирующего массива.
1 - оставшаяся строка включается в последний элемент результирующего массива. Соответствует поведению функции Spark split() и метода Python string.split().

stop_refreshable_materialized_views_on_startup

Experimental feature. Learn more.

При запуске сервера предотвращает планирование обновляемых материализованных представлений, как при выполнении команды SYSTEM STOP VIEWS. После этого вы можете запустить их вручную с помощью SYSTEM START VIEWS или SYSTEM START VIEW <name>. Также применяется к вновь создаваемым представлениям. Не влияет на необновляемые материализованные представления.

storage_file_read_method

Метод чтения данных из файла хранилища: read, pread или mmap. Метод mmap не применяется к clickhouse-server (он предназначен для clickhouse-local).

storage_system_stack_trace_pipe_read_timeout_ms

Максимальное время чтения из канала (pipe) для получения информации от потоков при выполнении запроса к таблице system.stack_trace. Этот параметр предназначен исключительно для тестирования и не должен изменяться пользователями.

stream_flush_interval_ms

Применяется для таблиц со стримингом при срабатывании тайм-аута или когда поток генерирует max_insert_block_size строк.

Значение по умолчанию — 7500.

Чем меньше значение, тем чаще данные записываются в таблицу. Слишком маленькое значение приводит к снижению производительности.

stream_like_engine_allow_direct_select

Разрешает прямые запросы SELECT для движков Kafka, RabbitMQ, FileLog, Redis Streams и NATS. Если подключены материализованные представления, запросы SELECT запрещены, даже если этот параметр включён.

stream_like_engine_insert_queue

Когда stream-подобный движок читает из нескольких очередей, пользователю необходимо выбрать одну очередь для вставки данных при записи. Используется в Redis Streams и NATS.

stream_poll_timeout_ms

Таймаут ожидания при опросе данных в потоковых хранилищах и из них.

system_events_show_zero_values

Позволяет выбирать события с нулевыми значениями из system.events.

Некоторые системы мониторинга требуют передавать им все значения метрик для каждой контрольной точки, даже если значение метрики равно нулю.

Возможные значения:

0 — Отключено.
1 — Включено.

Примеры

Запрос

SELECT * FROM system.events WHERE event='QueryMemoryLimitExceeded';

Результат

Ок.

Запрос

SET system_events_show_zero_values = 1;
SELECT * FROM system.events WHERE event='QueryMemoryLimitExceeded';

Результат

┌─event────────────────────┬─value─┬─description───────────────────────────────────────────┐
│ QueryMemoryLimitExceeded │     0 │ Количество превышений лимита памяти для запроса. │
└──────────────────────────┴───────┴───────────────────────────────────────────────────────┘

table_engine_read_through_distributed_cache

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Позволяет выполнять чтение из распределённого кэша через движки таблиц и табличные функции (S3, Azure и т. д.).

table_function_remote_max_addresses

Устанавливает максимальное количество адресов, получаемых по шаблонам для функции remote.

Возможные значения:

Положительное целое число.

tcp_keep_alive_timeout

Время простоя соединения в секундах до начала отправки TCP keepalive-пакетов.

temporary_data_in_cache_reserve_space_wait_lock_timeout_milliseconds

Время ожидания при блокировке кэша для резервирования пространства под временные данные в файловом кэше

temporary_files_buffer_size

Размер буфера для записи во временные файлы. Увеличение размера буфера уменьшает количество системных вызовов, но повышает потребление памяти.

temporary_files_codec

Задает кодек сжатия для временных файлов, используемых при сортировке и операциях соединения данных на диске.

Возможные значения:

LZ4 — применяется сжатие LZ4.
NONE — сжатие не применяется.

text_index_use_bloom_filter

Для тестирования включает или отключает использование блум-фильтра в текстовом индексе.

throw_if_deduplication_in_dependent_materialized_views_enabled_with_async_insert

Генерирует исключение для запроса INSERT, если одновременно включены настройки deduplicate_blocks_in_dependent_materialized_views и async_insert. Это гарантирует корректность работы, поскольку эти функции несовместимы.

throw_if_no_data_to_insert

Разрешает или запрещает пустые INSERT-запросы. По умолчанию настройка включена (выдаётся ошибка при пустом INSERT-запросе). Применяется только к INSERT-запросам, выполняемым через clickhouse-client или gRPC-интерфейс.

throw_on_error_from_cache_on_write_operations

Игнорировать ошибки кэша при кэшировании во время операций записи (INSERT, слияния)

throw_on_max_partitions_per_insert_block

Позволяет управлять поведением при достижении порога max_partitions_per_insert_block.

Возможные значения:

true - Если вставляемый блок достигает max_partitions_per_insert_block, генерируется исключение.
false - При достижении max_partitions_per_insert_block в журнал записывается предупреждение.

Совет

Это может быть полезно, если вы хотите оценить влияние на пользователей при изменении значения max_partitions_per_insert_block.

throw_on_unsupported_query_inside_transaction

Experimental feature. Learn more.

Выбрасывать исключение, если внутри транзакции выполняется неподдерживаемый запрос

timeout_before_checking_execution_speed

Проверяет, что скорость выполнения не слишком низкая (не менее min_execution_speed) после истечения указанного количества секунд.

timeout_overflow_mode

Определяет, что делать, если запрос выполняется дольше, чем max_execution_time, или если оценочное время выполнения превышает max_estimated_execution_time.

Возможные значения:

throw: сгенерировать исключение (значение по умолчанию).
break: остановить выполнение запроса и вернуть частичный результат, как если бы исходные данные закончились.

timeout_overflow_mode_leaf

Определяет, что происходит, когда выполнение запроса на листовом узле превышает max_execution_time_leaf.

Возможные значения:

throw: сгенерировать исключение (по умолчанию).
break: остановить выполнение запроса и вернуть частичный результат, как если бы исходные данные закончились.

totals_auto_threshold

Пороговое значение для totals_mode = 'auto'. См. раздел «Модификатор WITH TOTALS».

totals_mode

Как вычисляются TOTALS при наличии HAVING, а также при использовании max_rows_to_group_by и group_by_overflow_mode = 'any'. См. раздел «Модификатор WITH TOTALS».

trace_profile_events

Включает или отключает сбор стеков вызовов при каждом обновлении события профилирования вместе с именем события профилирования и значением инкремента и их отправку в trace_log.

Возможные значения:

1 — трассировка событий профилирования включена.
0 — трассировка событий профилирования отключена.

transfer_overflow_mode

Определяет, что происходит, когда объём данных превышает один из лимитов.

Возможные значения:

throw: выбросить исключение (по умолчанию).
break: остановить выполнение запроса и вернуть частичный результат, как если бы исходные данные закончились.

transform_null_in

Включает равенство значений NULL для оператора IN.

По умолчанию значения NULL не сравниваются, потому что NULL означает неопределённое значение. Поэтому сравнение expr = NULL всегда должно возвращать false. При включении этой настройки выражение NULL = NULL возвращает true для оператора IN.

Возможные значения:

0 — сравнение значений NULL в операторе IN возвращает false;
1 — сравнение значений NULL в операторе IN возвращает true.

Пример

Рассмотрим таблицу null_in:

┌──idx─┬─────i─┐
│    1 │     1 │
│    2 │  NULL │
│    3 │     3 │
└──────┴───────┘

Запрос:

SELECT idx, i FROM null_in WHERE i IN (1, NULL) SETTINGS transform_null_in = 0;

Результат:

┌──idx─┬────i─┐
│    1 │    1 │
└──────┴──────┘

Запрос:

SELECT idx, i FROM null_in WHERE i IN (1, NULL) SETTINGS transform_null_in = 1;

Результат:

┌──idx─┬─────i─┐
│    1 │     1 │
│    2 │  NULL │
└──────┴───────┘

См. также

Обработка NULL в операторах IN

traverse_shadow_remote_data_paths

Выполняет обход замороженных данных (теневого каталога) в дополнение к основным данным таблицы при запросе system.remote_data_paths

union_default_mode

Устанавливает режим объединения результатов запроса SELECT. Настройка используется только при совместном использовании с оператором UNION без явного указания UNION ALL или UNION DISTINCT.

Возможные значения:

'DISTINCT' — ClickHouse выводит строки как результат объединения запросов, удаляя повторяющиеся строки.
'ALL' — ClickHouse выводит все строки как результат объединения запросов, включая повторяющиеся строки.
'' — ClickHouse генерирует исключение при использовании с UNION.

См. примеры в разделе UNION.

unknown_packet_in_send_data

Отправлять неизвестный пакет вместо N-го пакета данных

update_parallel_mode

Определяет поведение одновременных запросов UPDATE.

Возможные значения:

sync — выполнять последовательно все запросы UPDATE.
auto — выполнять последовательно только те запросы UPDATE, у которых есть зависимости между столбцами, обновляемыми в одном запросе, и столбцами, используемыми в выражениях другого запроса.
async — не синхронизировать запросы UPDATE.

update_sequential_consistency

Если установлено значение true, то перед выполнением оператора UPDATE набор частей обновляется до последней версии.

use_async_executor_for_materialized_views

Использовать асинхронное и потенциально многопоточное выполнение запросов материализованных представлений. Может ускорить обработку представлений во время выполнения INSERT, но при этом может потреблять больше памяти.

use_cache_for_count_from_files

Включает кэширование количества строк при выполнении COUNT по файлам в табличных функциях file/s3/url/hdfs/azureBlobStorage.

По умолчанию включено.

use_client_time_zone

Интерпретировать строковые значения типа DateTime в часовом поясе клиента, а не сервера.

use_compact_format_in_distributed_parts_names

Использует компактный формат для хранения блоков при фоновой (distributed_foreground_insert) операции INSERT в таблицы с движком Distributed.

Возможные значения:

0 — Используется формат каталога user[:password]@host:port#default_database.
1 — Используется формат каталога [shard{shard_index}[_replica{replica_index}]].

Примечание

при use_compact_format_in_distributed_parts_names=0 изменения, внесённые в определение кластера, не будут применяться к фоновым операциям INSERT.
при use_compact_format_in_distributed_parts_names=1 изменение порядка узлов в определении кластера изменит значения shard_index/replica_index, имейте это в виду.

use_concurrency_control

Учитывать контроль параллелизма, настроенный на сервере (см. глобальные настройки сервера concurrent_threads_soft_limit_num и concurrent_threads_soft_limit_ratio_to_cores). Если параметр отключен, можно использовать больше потоков, даже если сервер перегружен (не рекомендуется для обычного использования и в основном требуется для тестов).

use_hedged_requests

Включает логику hedged-запросов для удалённых запросов. Она позволяет устанавливать несколько соединений с разными репликами для выполнения запроса. Новое соединение создаётся, если существующие соединения с репликами не были установлены в течение hedged_connection_timeout или данные не были получены в течение receive_data_timeout. Запрос использует первое соединение, которое отправит непустой пакет прогресса (или пакет данных, если allow_changing_replica_until_first_data_packet); остальные соединения отменяются. Поддерживаются запросы с max_parallel_replicas > 1.

Включено по умолчанию.

Значение по умолчанию в облаке: 1

use_hive_partitioning

При включённой настройке ClickHouse будет определять разбиение в стиле Hive в пути (/name=value/) для файловых движков таблиц File/S3/URL/HDFS/AzureBlobStorage и позволит использовать столбцы разбиения как виртуальные столбцы в запросе. Эти виртуальные столбцы будут иметь те же имена, что и в пути разбиения, но с префиксом _.

use_iceberg_metadata_files_cache

Если параметр включён, табличная функция iceberg и хранилище iceberg могут использовать кэш файлов метаданных iceberg.

Возможные значения:

0 - Отключено
1 - Включено

use_iceberg_partition_pruning

Использовать отсечение партиций для таблиц Iceberg

use_index_for_in_with_subqueries

Пробовать использовать индекс, если в правой части оператора IN находится подзапрос или табличное выражение.

use_index_for_in_with_subqueries_max_values

Максимальный размер множества в правой части оператора IN, при котором для фильтрации используется индекс таблицы. Позволяет избежать деградации производительности и повышенного потребления памяти из‑за подготовки дополнительных структур данных для больших запросов. Ноль означает отсутствие ограничения.

use_join_disjunctions_push_down

Включает проталкивание частей условий JOIN, соединённых оператором OR, на соответствующие стороны входных данных («частичное проталкивание»). Это позволяет движкам хранилищ раньше выполнять фильтрацию, что может сократить объём считываемых данных. Оптимизация сохраняет семантику запроса и применяется только тогда, когда каждая верхнеуровневая ветвь по OR содержит как минимум один детерминированный предикат для соответствующей стороны соединения.

use_legacy_to_time

Если настройка включена, используется устаревшая функция toTime, которая преобразует дату со временем в некоторую фиксированную дату, сохраняя время. В противном случае используется новая функция toTime, которая преобразует различные типы данных в тип Time. Старая функция также всегда доступна под именем toTimeWithFixedDate.

use_page_cache_for_disks_without_file_cache

Использовать кэш страниц в пространстве пользователя для удалённых дисков, для которых не включён файловый кэш.

use_page_cache_with_distributed_cache

Использовать кэш страниц в пространстве пользователя при использовании распределённого кэша.

use_paimon_partition_pruning

Experimental feature. Learn more.

Включает использование отсечения партиций Paimon для табличных функций Paimon

use_query_cache

Если параметр включён, запросы SELECT могут использовать кэш запросов. Параметры enable_reads_from_query_cache и enable_writes_to_query_cache более подробно определяют порядок его использования.

Возможные значения:

0 — отключено
1 — включено

use_query_condition_cache

Включает кэш условий запроса. Кэш сохраняет диапазоны гранул в частях данных, которые не удовлетворяют условию в предложении WHERE, и затем использует эту информацию как временный индекс для последующих запросов.

Возможные значения:

0 - Отключено
1 - Включено

use_roaring_bitmap_iceberg_positional_deletes

Использовать битовые карты Roaring для позиционных удалений в Iceberg.

use_skip_indexes

Использовать индексы пропуска данных при выполнении запросов.

Возможные значения:

0 — Отключено.
1 — Включено.

use_skip_indexes_if_final

Управляет использованием пропускающих индексов при выполнении запроса с модификатором FINAL.

Пропускающие индексы могут исключать строки (гранулы), содержащие самые последние данные, что может приводить к некорректным результатам запроса с модификатором FINAL. Когда эта настройка включена, пропускающие индексы применяются даже с модификатором FINAL, что потенциально улучшает производительность, но с риском пропуска недавних обновлений. Эту настройку следует включать совместно с настройкой use_skip_indexes_if_final_exact_mode (по умолчанию включена).

Возможные значения:

0 — Отключена.
1 — Включена.

use_skip_indexes_if_final_exact_mode

Управляет тем, разворачиваются ли гранулы, возвращаемые пропускающим индексом, в более новых частях, чтобы возвращать корректные результаты при выполнении запроса с модификатором FINAL.

Использование пропускающих индексов может исключать строки (гранулы), содержащие самые последние данные, что может приводить к некорректным результатам. Этот параметр позволяет гарантировать корректные результаты за счёт сканирования более новых частей, которые пересекаются с диапазонами, возвращаемыми пропускающим индексом. Отключайте этот параметр только в том случае, если для приложения приемлемы приблизительные результаты, основанные на поиске по пропускающему индексу.

Возможные значения:

0 — Отключено.
1 — Включено.

use_skip_indexes_on_data_read

Включает использование индексов пропуска данных при чтении.

При включении индексы пропуска данных оцениваются динамически в момент чтения каждой гранулы, а не анализируются заранее перед началом выполнения запроса. Это может уменьшить задержку запуска запроса.

Возможные значения:

0 — Отключено.
1 — Включено.

use_statistics_cache

Experimental feature. Learn more.

Использовать кэш статистики в запросе, чтобы избежать накладных расходов на загрузку статистики для каждой части данных.

use_structure_from_insertion_table_in_table_functions

Использовать структуру таблицы, в которую выполняется вставка, вместо вывода схемы по данным. Возможные значения: 0 — отключено, 1 — включено, 2 — авто.

use_text_index_dictionary_cache

Определяет, следует ли использовать кеш десериализованного блока словаря текстового индекса. Использование кеша блока словаря текстового индекса может значительно снизить задержку и увеличить пропускную способность при выполнении большого количества запросов к текстовому индексу.

use_text_index_header_cache

Использовать ли кэш десериализованного заголовка текстового индекса. Использование кэша заголовка текстового индекса может значительно снизить задержку и увеличить пропускную способность при выполнении большого числа запросов к текстовому индексу.

use_text_index_postings_cache

Определяет, использовать ли кэш десериализованных списков вхождений текстового индекса. Использование кэша списков вхождений текстового индекса может значительно снизить задержку и увеличить пропускную способность при работе с большим количеством запросов к текстовому индексу.

use_uncompressed_cache

Использовать ли кэш несжатых блоков. Принимает значения 0 или 1. По умолчанию — 0 (отключено). Использование кэша несжатых данных (только для таблиц семейства MergeTree) может значительно уменьшить задержки и увеличить пропускную способность при работе с большим количеством коротких запросов. Включайте этот параметр для пользователей, которые отправляют частые короткие запросы. Также обратите внимание на конфигурационный параметр uncompressed_cache_size (задаётся только в конфигурационном файле) — размер блоков кэша несжатых данных. По умолчанию он равен 8 GiB. Кэш несжатых данных заполняется по мере необходимости, а наименее используемые данные автоматически удаляются.

Для запросов, которые читают хотя бы относительно большой объём данных (один миллион строк и более), кэш несжатых данных автоматически отключается, чтобы освободить место для действительно небольших запросов. Это означает, что вы можете всегда держать настройку use_uncompressed_cache равной 1.

use_variant_as_common_type

Позволяет использовать тип Variant в качестве результирующего типа для функций if/multiIf/array/map, когда для типов аргументов нет общего типа.

Пример:

SET use_variant_as_common_type = 1;
SELECT toTypeName(if(number % 2, number, range(number))) as variant_type FROM numbers(1);
SELECT if(number % 2, number, range(number)) as variant FROM numbers(5);

┌─variant_type───────────────────┐
│ Variant(Array(UInt64), UInt64) │
└────────────────────────────────┘
┌─variant───┐
│ []        │
│ 1         │
│ [0,1]     │
│ 3         │
│ [0,1,2,3] │
└───────────┘

SET use_variant_as_common_type = 1;
SELECT toTypeName(multiIf((number % 4) = 0, 42, (number % 4) = 1, [1, 2, 3], (number % 4) = 2, 'Hello, World!', NULL)) AS variant_type FROM numbers(1);
SELECT multiIf((number % 4) = 0, 42, (number % 4) = 1, [1, 2, 3], (number % 4) = 2, 'Hello, World!', NULL) AS variant FROM numbers(4);

─variant_type─────────────────────────┐
│ Variant(Array(UInt8), String, UInt8) │
└──────────────────────────────────────┘

┌─variant───────┐
│ 42            │
│ [1,2,3]       │
│ Hello, World! │
│ ᴺᵁᴸᴸ          │
└───────────────┘

SET use_variant_as_common_type = 1;
SELECT toTypeName(array(range(number), number, 'str_' || toString(number))) as array_of_variants_type from numbers(1);
SELECT array(range(number), number, 'str_' || toString(number)) as array_of_variants FROM numbers(3);

┌─array_of_variants_type────────────────────────┐
│ Array(Variant(Array(UInt64), String, UInt64)) │
└───────────────────────────────────────────────┘

┌─array_of_variants─┐
│ [[],0,'str_0']    │
│ [[0],1,'str_1']   │
│ [[0,1],2,'str_2'] │
└───────────────────┘

SET use_variant_as_common_type = 1;
SELECT toTypeName(map('a', range(number), 'b', number, 'c', 'str_' || toString(number))) as map_of_variants_type from numbers(1);
SELECT map('a', range(number), 'b', number, 'c', 'str_' || toString(number)) as map_of_variants FROM numbers(3);

┌─map_of_variants_type────────────────────────────────┐
│ Map(String, Variant(Array(UInt64), String, UInt64)) │
└─────────────────────────────────────────────────────┘

┌─map_of_variants───────────────┐
│ {'a':[],'b':0,'c':'str_0'}    │
│ {'a':[0],'b':1,'c':'str_1'}   │
│ {'a':[0,1],'b':2,'c':'str_2'} │
└───────────────────────────────┘

use_with_fill_by_sorting_prefix

Столбцы, расположенные перед столбцами WITH FILL в предложении ORDER BY, образуют сортировочный префикс. Строки с различными значениями сортировочного префикса заполняются независимо

validate_enum_literals_in_operators

Если настройка включена, выполняется проверка литералов перечислимого типа в операторах IN, NOT IN, ==, != на соответствие типу Enum, и генерируется исключение, если литерал не является допустимым значением перечисления.

validate_mutation_query

Проверяет запросы мутаций до их принятия. Мутации выполняются в фоновом режиме, и запуск некорректного запроса приведёт к «зависанию» мутаций, что потребует ручного вмешательства.

Изменяйте эту настройку только в случае возникновения ошибки, связанной с обратной несовместимостью.

validate_polygons

Включает или отключает выбрасывание исключения в функции pointInPolygon, если многоугольник является самопересекающимся или самокасательным.

Возможные значения:

0 — Выбрасывание исключения отключено. pointInPolygon принимает некорректные многоугольники и возвращает для них потенциально неверные результаты.
1 — Выбрасывание исключения включено.

vector_search_filter_strategy

Если запрос векторного поиска содержит предложение WHERE, этот параметр определяет, вычисляется ли оно первым (предфильтрация) или же сначала используется векторный индекс сходства (постфильтрация). Возможные значения:

'auto' — постфильтрация (точная семантика может измениться в будущем).
'postfilter' — использовать векторный индекс сходства для определения ближайших соседей, затем применять остальные фильтры.
'prefilter' — сначала применять остальные фильтры, затем выполнять поиск прямым перебором для определения соседей.

vector_search_index_fetch_multiplier

Псевдонимы: vector_search_postfilter_multiplier

Умножает количество ближайших соседей, выбираемых из индекса векторного сходства, на это число. Применяется только при постфильтрации с другими предикатами или если установлена настройка vector_search_with_rescoring = 1.

vector_search_with_rescoring

Определяет, выполняет ли ClickHouse повторную переоценку результатов (rescoring) для запросов, использующих индекс векторного сходства. Без rescoring индекс векторного сходства сразу возвращает строки с наилучшим совпадением. При включённом rescoring строки расширяются до уровня гранулы, и все строки в этой грануле повторно проверяются. В большинстве случаев rescoring лишь незначительно повышает точность, но при этом значительно ухудшает производительность запросов векторного поиска. Примечание: запрос, выполняемый без rescoring и с включёнными параллельными репликами, в некоторых случаях может быть выполнен с rescoring.

wait_changes_become_visible_after_commit_mode

Experimental feature. Learn more.

Ожидать, пока зафиксированные изменения не станут видимыми в последнем снимке

wait_for_async_insert

Если имеет значение true, ожидает завершения обработки асинхронной вставки

wait_for_async_insert_timeout

Таймаут ожидания обработки асинхронной вставки данных

wait_for_window_view_fire_signal_timeout

Experimental feature. Learn more.

Таймаут ожидания сигнала срабатывания window view при обработке по времени события (event time)

window_view_clean_interval

Experimental feature. Learn more.

Интервал очистки window view в секундах для удаления устаревших данных.

window_view_heartbeat_interval

Experimental feature. Learn more.

Интервал (в секундах) отправки сигнала heartbeat, показывающего, что запрос типа WATCH продолжает выполняться.

workload

Имя рабочей нагрузки, используемое для доступа к ресурсам

write_full_path_in_iceberg_metadata

Experimental feature. Learn more.

Записывает полные пути (включая s3://) в файлы метаданных Iceberg.

write_through_distributed_cache

ClickHouse Cloud only

Действует только в ClickHouse Cloud. Разрешает выполнять запись в распределённый кэш (при этом запись в S3 также будет выполняться через распределённый кэш).

write_through_distributed_cache_buffer_size

ClickHouse Cloud only

Применяется только в ClickHouse Cloud. Задает размер буфера для сквозного (write-through) распределенного кэша. Если установлено значение 0, используется размер буфера, который был бы применен при отсутствии распределенного кэша.

zstd_window_log_max

Позволяет задать максимальное значение параметра window_log для ZSTD (не используется для семейства MergeTree).

add_http_cors_header
additional_result_filter
additional_table_filters
aggregate_functions_null_for_empty
aggregation_in_order_max_block_bytes
aggregation_memory_efficient_merge_threads
allow_aggregate_partitions_independently
allow_archive_path_syntax
allow_asynchronous_read_from_io_pool_for_merge_tree
allow_changing_replica_until_first_data_packet
allow_create_index_without_type
allow_custom_error_code_in_throwif
allow_ddl
allow_deprecated_database_ordinary
allow_deprecated_error_prone_window_functions
allow_deprecated_snowflake_conversion_functions
allow_deprecated_syntax_for_merge_tree
allow_distributed_ddl
allow_drop_detached
allow_dynamic_type_in_join_keys
allow_execute_multiif_columnar
allow_experimental_alias_table_engine
allow_experimental_analyzer
allow_experimental_codecs
allow_experimental_correlated_subqueries
allow_experimental_database_glue_catalog
allow_experimental_database_hms_catalog
allow_experimental_database_iceberg
allow_experimental_database_materialized_postgresql
allow_experimental_database_unity_catalog
allow_experimental_delta_kernel_rs
allow_experimental_delta_lake_writes
allow_experimental_full_text_index
allow_experimental_funnel_functions
allow_experimental_hash_functions
allow_experimental_iceberg_compaction
allow_experimental_insert_into_iceberg
allow_experimental_join_right_table_sorting
allow_experimental_kafka_offsets_storage_in_keeper
allow_experimental_kusto_dialect
allow_experimental_materialized_postgresql_table
allow_experimental_nlp_functions
allow_experimental_parallel_reading_from_replicas
allow_experimental_prql_dialect
allow_experimental_qbit_type
allow_experimental_query_deduplication
allow_experimental_statistics
allow_experimental_time_series_aggregate_functions
allow_experimental_time_series_table
allow_experimental_time_time64_type
allow_experimental_window_view
allow_experimental_ytsaurus_dictionary_source
allow_experimental_ytsaurus_table_engine
allow_experimental_ytsaurus_table_function
allow_general_join_planning
allow_get_client_http_header
allow_hyperscan
allow_introspection_functions
allow_materialized_view_with_bad_select
allow_named_collection_override_by_default
allow_non_metadata_alters
allow_nonconst_timezone_arguments
allow_nondeterministic_mutations
allow_nondeterministic_optimize_skip_unused_shards
allow_not_comparable_types_in_comparison_functions
allow_not_comparable_types_in_order_by
allow_prefetched_read_pool_for_local_filesystem
allow_prefetched_read_pool_for_remote_filesystem
allow_push_predicate_ast_for_distributed_subqueries
allow_push_predicate_when_subquery_contains_with
allow_reorder_prewhere_conditions
allow_settings_after_format_in_insert
allow_simdjson
allow_special_serialization_kinds_in_output_formats
allow_statistics_optimize
allow_suspicious_codecs
allow_suspicious_fixed_string_types
allow_suspicious_indices
allow_suspicious_low_cardinality_types
allow_suspicious_primary_key
allow_suspicious_ttl_expressions
allow_suspicious_types_in_group_by
allow_suspicious_types_in_order_by
allow_suspicious_variant_types
allow_unrestricted_reads_from_keeper
alter_move_to_space_execute_async
alter_partition_verbose_result
alter_sync
alter_update_mode
analyze_index_with_space_filling_curves
analyzer_compatibility_allow_compound_identifiers_in_unflatten_nested
analyzer_compatibility_join_using_top_level_identifier
any_join_distinct_right_table_keys
apply_deleted_mask
apply_mutations_on_fly
apply_patch_parts
apply_patch_parts_join_cache_buckets
apply_settings_from_server
arrow_flight_request_descriptor_type
asterisk_include_alias_columns
asterisk_include_materialized_columns
async_insert
async_insert_busy_timeout_decrease_rate
async_insert_busy_timeout_increase_rate
async_insert_busy_timeout_max_ms
async_insert_busy_timeout_min_ms
async_insert_deduplicate
async_insert_max_data_size
async_insert_max_query_number
async_insert_poll_timeout_ms
async_insert_use_adaptive_busy_timeout
async_query_sending_for_remote
async_socket_for_remote
azure_allow_parallel_part_upload
azure_check_objects_after_upload
azure_connect_timeout_ms
azure_create_new_file_on_insert
azure_ignore_file_doesnt_exist
azure_list_object_keys_size
azure_max_blocks_in_multipart_upload
azure_max_get_burst
azure_max_get_rps
azure_max_inflight_parts_for_one_file
azure_max_put_burst
azure_max_put_rps
azure_max_redirects
azure_max_single_part_copy_size
azure_max_single_part_upload_size
azure_max_single_read_retries
azure_max_unexpected_write_error_retries
azure_max_upload_part_size
azure_min_upload_part_size
azure_request_timeout_ms
azure_sdk_max_retries
azure_sdk_retry_initial_backoff_ms
azure_sdk_retry_max_backoff_ms
azure_skip_empty_files
azure_strict_upload_part_size
azure_throw_on_zero_files_match
azure_truncate_on_insert
azure_upload_part_size_multiply_factor
azure_upload_part_size_multiply_parts_count_threshold
azure_use_adaptive_timeouts
backup_restore_batch_size_for_keeper_multi
backup_restore_batch_size_for_keeper_multiread
backup_restore_failure_after_host_disconnected_for_seconds
backup_restore_finish_timeout_after_error_sec
backup_restore_keeper_fault_injection_probability
backup_restore_keeper_fault_injection_seed
backup_restore_keeper_max_retries
backup_restore_keeper_max_retries_while_handling_error
backup_restore_keeper_max_retries_while_initializing
backup_restore_keeper_retry_initial_backoff_ms
backup_restore_keeper_retry_max_backoff_ms
backup_restore_keeper_value_max_size
backup_restore_s3_retry_attempts
backup_restore_s3_retry_initial_backoff_ms
backup_restore_s3_retry_jitter_factor
backup_restore_s3_retry_max_backoff_ms
backup_slow_all_threads_after_retryable_s3_error
cache_warmer_threads
calculate_text_stack_trace
cancel_http_readonly_queries_on_client_close
cast_ipv4_ipv6_default_on_conversion_error
cast_keep_nullable
cast_string_to_date_time_mode
cast_string_to_dynamic_use_inference
cast_string_to_variant_use_inference
check_query_single_value_result
check_referential_table_dependencies
check_table_dependencies
checksum_on_read
cloud_mode
cloud_mode_database_engine
cloud_mode_engine
cluster_for_parallel_replicas
cluster_function_process_archive_on_multiple_nodes
cluster_table_function_buckets_batch_size
cluster_table_function_split_granularity
collect_hash_table_stats_during_aggregation
collect_hash_table_stats_during_joins
compatibility
compatibility_ignore_auto_increment_in_create_table
compatibility_ignore_collation_in_create_table
compile_aggregate_expressions
compile_expressions
compile_sort_description
connect_timeout
connect_timeout_with_failover_ms
connect_timeout_with_failover_secure_ms
connection_pool_max_wait_ms
connections_with_failover_max_tries
convert_query_to_cnf
correlated_subqueries_default_join_kind
correlated_subqueries_substitute_equivalent_expressions
count_distinct_implementation
count_distinct_optimization
count_matches_stop_at_empty_match
create_if_not_exists
create_index_ignore_unique
create_replicated_merge_tree_fault_injection_probability
create_table_empty_primary_key_by_default
cross_join_min_bytes_to_compress
cross_join_min_rows_to_compress
data_type_default_nullable
database_atomic_wait_for_drop_and_detach_synchronously
database_replicated_allow_explicit_uuid
database_replicated_allow_heavy_create
database_replicated_allow_only_replicated_engine
database_replicated_allow_replicated_engine_arguments
database_replicated_always_detach_permanently
database_replicated_enforce_synchronous_settings
database_replicated_initial_query_timeout_sec
database_shared_drop_table_delay_seconds
decimal_check_overflow
deduplicate_blocks_in_dependent_materialized_views
default_materialized_view_sql_security
default_max_bytes_in_join
default_normal_view_sql_security
default_table_engine
default_temporary_table_engine
default_view_definer
delta_lake_enable_engine_predicate
delta_lake_enable_expression_visitor_logging
delta_lake_insert_max_bytes_in_data_file
delta_lake_insert_max_rows_in_data_file
delta_lake_log_metadata
delta_lake_snapshot_version
delta_lake_throw_on_engine_predicate_error
describe_compact_output
describe_include_subcolumns
describe_include_virtual_columns
dialect
dictionary_validate_primary_key_type
distinct_overflow_mode
distributed_aggregation_memory_efficient
distributed_background_insert_batch
distributed_background_insert_max_sleep_time_ms
distributed_background_insert_sleep_time_ms
distributed_background_insert_split_batch_on_failure
distributed_background_insert_timeout
distributed_cache_alignment
distributed_cache_bypass_connection_pool
distributed_cache_connect_backoff_max_ms
distributed_cache_connect_backoff_min_ms
distributed_cache_connect_max_tries
distributed_cache_connect_timeout_ms
distributed_cache_credentials_refresh_period_seconds
distributed_cache_data_packet_ack_window
distributed_cache_discard_connection_if_unread_data
distributed_cache_fetch_metrics_only_from_current_az
distributed_cache_log_mode
distributed_cache_max_unacked_inflight_packets
distributed_cache_min_bytes_for_seek
distributed_cache_pool_behaviour_on_limit
distributed_cache_prefer_bigger_buffer_size
distributed_cache_read_only_from_current_az
distributed_cache_read_request_max_tries
distributed_cache_receive_response_wait_milliseconds
distributed_cache_receive_timeout_milliseconds
distributed_cache_receive_timeout_ms
distributed_cache_send_timeout_ms
distributed_cache_tcp_keep_alive_timeout_ms
distributed_cache_throw_on_error
distributed_cache_wait_connection_from_pool_milliseconds
distributed_connections_pool_size
distributed_ddl_entry_format_version
distributed_ddl_output_mode
distributed_ddl_task_timeout
distributed_foreground_insert
distributed_group_by_no_merge
distributed_insert_skip_read_only_replicas
distributed_plan_default_reader_bucket_count
distributed_plan_default_shuffle_join_bucket_count
distributed_plan_execute_locally
distributed_plan_force_exchange_kind
distributed_plan_force_shuffle_aggregation
distributed_plan_max_rows_to_broadcast
distributed_plan_optimize_exchanges
distributed_product_mode
distributed_push_down_limit
distributed_replica_error_cap
distributed_replica_error_half_life
distributed_replica_max_ignored_errors
do_not_merge_across_partitions_select_final
empty_result_for_aggregation_by_constant_keys_on_empty_set
empty_result_for_aggregation_by_empty_set
enable_adaptive_memory_spill_scheduler
enable_add_distinct_to_in_subqueries
enable_blob_storage_log
enable_deflate_qpl_codec
enable_early_constant_folding
enable_extended_results_for_datetime_functions
enable_filesystem_cache
enable_filesystem_cache_log
enable_filesystem_cache_on_write_operations
enable_filesystem_read_prefetches_log
enable_global_with_statement
enable_hdfs_pread
enable_http_compression
enable_job_stack_trace
enable_join_runtime_filters
enable_lazy_columns_replication
enable_lightweight_delete
enable_lightweight_update
enable_memory_bound_merging_of_aggregation_results
enable_multiple_prewhere_read_steps
enable_named_columns_in_function_tuple
enable_optimize_predicate_expression
enable_optimize_predicate_expression_to_final_subquery
enable_order_by_all
enable_parallel_blocks_marshalling
enable_parsing_to_custom_serialization
enable_positional_arguments
enable_producing_buckets_out_of_order_in_aggregation
enable_reads_from_query_cache
enable_s3_requests_logging
enable_scalar_subquery_optimization
enable_scopes_for_with_statement
enable_shared_storage_snapshot_in_query
enable_sharing_sets_for_mutations
enable_software_prefetch_in_aggregation
enable_unaligned_array_join
enable_url_encoding
enable_vertical_final
enable_writes_to_query_cache
enable_zstd_qat_codec
enforce_strict_identifier_format
engine_file_allow_create_multiple_files
engine_file_empty_if_not_exists
engine_file_skip_empty_files
engine_file_truncate_on_insert
engine_url_skip_empty_files
except_default_mode
exclude_materialize_skip_indexes_on_insert
execute_exists_as_scalar_subquery
external_storage_connect_timeout_sec
external_storage_max_read_bytes
external_storage_max_read_rows
external_storage_rw_timeout_sec
external_table_functions_use_nulls
external_table_strict_query
extract_key_value_pairs_max_pairs_per_row
extremes
fallback_to_stale_replicas_for_distributed_queries
filesystem_cache_allow_background_download
filesystem_cache_boundary_alignment
filesystem_cache_enable_background_download_during_fetch
filesystem_cache_enable_background_download_for_metadata_files_in_packed_storage
filesystem_cache_max_download_size
filesystem_cache_name
filesystem_cache_prefer_bigger_buffer_size
filesystem_cache_reserve_space_wait_lock_timeout_milliseconds
filesystem_cache_segments_batch_size
filesystem_cache_skip_download_if_exceeds_per_query_cache_write_limit
filesystem_prefetch_max_memory_usage
filesystem_prefetch_step_bytes
filesystem_prefetch_step_marks
filesystem_prefetches_limit
final
flatten_nested
force_aggregate_partitions_independently
force_aggregation_in_order
force_data_skipping_indices
force_grouping_standard_compatibility
force_index_by_date
force_optimize_projection
force_optimize_projection_name
force_optimize_skip_unused_shards
force_optimize_skip_unused_shards_nesting
force_primary_key
force_remove_data_recursively_on_drop
formatdatetime_e_with_space_padding
formatdatetime_f_prints_scale_number_of_digits
formatdatetime_f_prints_single_zero
formatdatetime_format_without_leading_zeros
formatdatetime_parsedatetime_m_is_month_name
fsync_metadata
function_date_trunc_return_type_behavior
function_implementation
function_json_value_return_type_allow_complex
function_json_value_return_type_allow_nullable
function_locate_has_mysql_compatible_argument_order
function_range_max_elements_in_block
function_sleep_max_microseconds_per_block
function_visible_width_behavior
geo_distance_returns_float64_on_float64_arguments
geotoh3_argument_order
glob_expansion_max_elements
grace_hash_join_initial_buckets
grace_hash_join_max_buckets
group_by_overflow_mode
group_by_two_level_threshold
group_by_two_level_threshold_bytes
group_by_use_nulls
h3togeo_lon_lat_result_order
handshake_timeout_ms
hdfs_create_new_file_on_insert
hdfs_ignore_file_doesnt_exist
hdfs_replication
hdfs_skip_empty_files
hdfs_throw_on_zero_files_match
hdfs_truncate_on_insert
hedged_connection_timeout_ms
hnsw_candidate_list_size_for_search
hsts_max_age
http_connection_timeout
http_headers_progress_interval_ms
http_make_head_request
http_max_field_name_size
http_max_field_value_size
http_max_fields
http_max_multipart_form_data_size
http_max_request_param_data_size
http_max_tries
http_max_uri_size
http_native_compression_disable_checksumming_on_decompress
http_receive_timeout
http_response_buffer_size
http_response_headers
http_retry_initial_backoff_ms
http_retry_max_backoff_ms
http_send_timeout
http_skip_not_found_url_for_globs
http_wait_end_of_query
http_write_exception_in_output_format
http_zlib_compression_level
iceberg_delete_data_on_drop
iceberg_insert_max_bytes_in_data_file
iceberg_insert_max_partitions
iceberg_insert_max_rows_in_data_file
iceberg_metadata_compression_method
iceberg_metadata_log_level
iceberg_snapshot_id
iceberg_timestamp_ms
idle_connection_timeout
ignore_cold_parts_seconds
ignore_data_skipping_indices
ignore_drop_queries_probability
ignore_materialized_views_with_dropped_target_table
ignore_on_cluster_for_replicated_access_entities_queries
ignore_on_cluster_for_replicated_named_collections_queries
ignore_on_cluster_for_replicated_udf_queries
implicit_select
implicit_table_at_top_level
implicit_transaction
inject_random_order_for_select_without_order_by
input_format_parallel_parsing
insert_allow_materialized_columns
insert_deduplicate
insert_deduplication_token
insert_keeper_fault_injection_probability
insert_keeper_fault_injection_seed
insert_keeper_max_retries
insert_keeper_retry_initial_backoff_ms
insert_keeper_retry_max_backoff_ms
insert_null_as_default
insert_quorum
insert_quorum_parallel
insert_quorum_timeout
insert_shard_id
interactive_delay
intersect_default_mode
jemalloc_collect_profile_samples_in_trace_log
jemalloc_enable_profiler
join_algorithm
join_any_take_last_row
join_default_strictness
join_on_disk_max_files_to_merge
join_output_by_rowlist_perkey_rows_threshold
join_overflow_mode
join_runtime_bloom_filter_bytes
join_runtime_bloom_filter_hash_functions
join_runtime_filter_exact_values_limit
join_to_sort_maximum_table_rows
join_to_sort_minimum_perkey_rows
join_use_nulls
joined_block_split_single_row
joined_subquery_requires_alias
kafka_disable_num_consumers_limit
kafka_max_wait_ms
keeper_map_strict_mode
keeper_max_retries
keeper_retry_initial_backoff_ms
keeper_retry_max_backoff_ms
least_greatest_legacy_null_behavior
legacy_column_name_of_tuple_literal
lightweight_delete_mode
lightweight_deletes_sync
limit
load_balancing
load_balancing_first_offset
load_marks_asynchronously
local_filesystem_read_method
local_filesystem_read_prefetch
lock_acquire_timeout
log_comment
log_formatted_queries
log_processors_profiles
log_profile_events
log_queries
log_queries_cut_to_length
log_queries_min_query_duration_ms
log_queries_min_type
log_queries_probability
log_query_settings
log_query_threads
log_query_views
low_cardinality_allow_in_native_format
low_cardinality_max_dictionary_size
low_cardinality_use_single_dictionary_for_part
low_priority_query_wait_time_ms
make_distributed_plan
materialize_skip_indexes_on_insert
materialize_statistics_on_insert
materialize_ttl_after_modify
materialized_views_ignore_errors
materialized_views_squash_parallel_inserts
max_analyze_depth
max_ast_depth
max_ast_elements
max_autoincrement_series
max_backup_bandwidth
max_block_size
max_bytes_before_external_group_by
max_bytes_before_external_sort
max_bytes_before_remerge_sort
max_bytes_in_distinct
max_bytes_in_join
max_bytes_in_set
max_bytes_ratio_before_external_group_by
max_bytes_ratio_before_external_sort
max_bytes_to_read
max_bytes_to_read_leaf
max_bytes_to_sort
max_bytes_to_transfer
max_columns_to_read
max_compress_block_size
max_concurrent_queries_for_all_users
max_concurrent_queries_for_user
max_distributed_connections
max_distributed_depth
max_download_buffer_size
max_download_threads
max_estimated_execution_time
max_execution_speed
max_execution_speed_bytes
max_execution_time
max_execution_time_leaf
max_expanded_ast_elements
max_fetch_partition_retries_count
max_final_threads
max_http_get_redirects
max_hyperscan_regexp_length
max_hyperscan_regexp_total_length
max_insert_block_size
max_insert_delayed_streams_for_parallel_write
max_insert_threads
max_joined_block_size_bytes
max_joined_block_size_rows
max_limit_for_vector_search_queries
max_local_read_bandwidth
max_local_write_bandwidth
max_memory_usage
max_memory_usage_for_user
max_network_bandwidth
max_network_bandwidth_for_all_users
max_network_bandwidth_for_user
max_network_bytes
max_number_of_partitions_for_independent_aggregation
max_os_cpu_wait_time_ratio_to_throw
max_parallel_replicas
max_parser_backtracks
max_parser_depth
max_parsing_threads
max_partition_size_to_drop
max_partitions_per_insert_block
max_partitions_to_read
max_parts_to_move
max_projection_rows_to_use_projection_index
max_query_size
max_read_buffer_size
max_read_buffer_size_local_fs
max_read_buffer_size_remote_fs
max_recursive_cte_evaluation_depth
max_remote_read_network_bandwidth
max_remote_write_network_bandwidth
max_replica_delay_for_distributed_queries
max_result_bytes
max_result_rows
max_reverse_dictionary_lookup_cache_size_bytes
max_rows_in_distinct
max_rows_in_join
max_rows_in_set
max_rows_in_set_to_optimize_join
max_rows_to_group_by
max_rows_to_read
max_rows_to_read_leaf
max_rows_to_sort
max_rows_to_transfer
max_sessions_for_user
max_size_to_preallocate_for_aggregation
max_size_to_preallocate_for_joins
max_streams_for_merge_tree_reading
max_streams_multiplier_for_merge_tables
max_streams_to_max_threads_ratio
max_subquery_depth
max_table_size_to_drop
max_temporary_columns
max_temporary_data_on_disk_size_for_query
max_temporary_data_on_disk_size_for_user
max_temporary_non_const_columns
max_threads
max_threads_for_indexes
max_untracked_memory
memory_overcommit_ratio_denominator
memory_overcommit_ratio_denominator_for_user
memory_profiler_sample_max_allocation_size
memory_profiler_sample_min_allocation_size
memory_profiler_sample_probability
memory_profiler_step
memory_tracker_fault_probability
memory_usage_overcommit_max_wait_microseconds
merge_table_max_tables_to_look_for_schema_inference
merge_tree_coarse_index_granularity
merge_tree_compact_parts_min_granules_to_multibuffer_read
merge_tree_determine_task_size_by_prewhere_columns
merge_tree_max_bytes_to_use_cache
merge_tree_max_rows_to_use_cache
merge_tree_min_bytes_for_concurrent_read
merge_tree_min_bytes_for_concurrent_read_for_remote_filesystem
merge_tree_min_bytes_for_seek
merge_tree_min_bytes_per_task_for_remote_reading
merge_tree_min_read_task_size
merge_tree_min_rows_for_concurrent_read
merge_tree_min_rows_for_concurrent_read_for_remote_filesystem
merge_tree_min_rows_for_seek
merge_tree_read_split_ranges_into_intersecting_and_non_intersecting_injection_probability
merge_tree_storage_snapshot_sleep_ms
merge_tree_use_const_size_tasks_for_remote_reading
merge_tree_use_deserialization_prefixes_cache
merge_tree_use_prefixes_deserialization_thread_pool
merge_tree_use_v1_object_and_dynamic_serialization
metrics_perf_events_enabled
metrics_perf_events_list
min_bytes_to_use_direct_io
min_bytes_to_use_mmap_io
min_chunk_bytes_for_parallel_parsing
min_compress_block_size
min_count_to_compile_aggregate_expression
min_count_to_compile_expression
min_count_to_compile_sort_description
min_execution_speed
min_execution_speed_bytes
min_external_table_block_size_bytes
min_external_table_block_size_rows
min_free_disk_bytes_to_perform_insert
min_free_disk_ratio_to_perform_insert
min_free_disk_space_for_temporary_data
min_hit_rate_to_use_consecutive_keys_optimization
min_insert_block_size_bytes
min_insert_block_size_bytes_for_materialized_views
min_insert_block_size_rows
min_insert_block_size_rows_for_materialized_views
min_joined_block_size_bytes
min_joined_block_size_rows
min_os_cpu_wait_time_ratio_to_throw
min_outstreams_per_resize_after_split
min_table_rows_to_use_projection_index
mongodb_throw_on_unsupported_query
move_all_conditions_to_prewhere
move_primary_key_columns_to_end_of_prewhere
multiple_joins_try_to_keep_original_names
mutations_execute_nondeterministic_on_initiator
mutations_execute_subqueries_on_initiator
mutations_max_literal_size_to_replace
mutations_sync
mysql_datatypes_support_level
mysql_map_fixed_string_to_text_in_show_columns
mysql_map_string_to_text_in_show_columns
mysql_max_rows_to_insert
network_compression_method
network_zstd_compression_level
normalize_function_names
number_of_mutations_to_delay
number_of_mutations_to_throw
odbc_bridge_connection_pool_size
odbc_bridge_use_connection_pooling
offset
opentelemetry_start_trace_probability
opentelemetry_trace_cpu_scheduling
opentelemetry_trace_processors
optimize_aggregation_in_order
optimize_aggregators_of_group_by_keys
optimize_and_compare_chain
optimize_append_index
optimize_arithmetic_operations_in_aggregate_functions
optimize_const_name_size
optimize_count_from_files
optimize_distinct_in_order
optimize_distributed_group_by_sharding_key
optimize_empty_string_comparisons
optimize_extract_common_expressions
optimize_functions_to_subcolumns
optimize_group_by_constant_keys
optimize_group_by_function_keys
optimize_if_chain_to_multiif
optimize_if_transform_strings_to_enum
optimize_injective_functions_in_group_by
optimize_injective_functions_inside_uniq
optimize_min_equality_disjunction_chain_length
optimize_min_inequality_conjunction_chain_length
optimize_move_to_prewhere
optimize_move_to_prewhere_if_final
optimize_multiif_to_if
optimize_normalize_count_variants
optimize_on_insert
optimize_or_like_chain
optimize_qbit_distance_function_reads
optimize_read_in_order
optimize_read_in_window_order
optimize_redundant_functions_in_order_by
optimize_respect_aliases
optimize_rewrite_aggregate_function_with_if
optimize_rewrite_array_exists_to_has
optimize_rewrite_like_perfect_affix
optimize_rewrite_regexp_functions
optimize_rewrite_sum_if_to_count_if
optimize_skip_merged_partitions
optimize_skip_unused_shards
optimize_skip_unused_shards_limit
optimize_skip_unused_shards_nesting
optimize_skip_unused_shards_rewrite_in
optimize_sorting_by_input_stream_properties
optimize_substitute_columns
optimize_syntax_fuse_functions
optimize_throw_if_noop
optimize_time_filter_with_preimage
optimize_trivial_approximate_count_query
optimize_trivial_count_query
optimize_trivial_insert_select
optimize_uniq_to_count
optimize_use_implicit_projections
optimize_use_projection_filtering
optimize_use_projections
optimize_using_constraints
os_threads_nice_value_materialized_view
os_threads_nice_value_query
output_format_compression_level
output_format_compression_zstd_window_log
output_format_parallel_formatting
page_cache_block_size
page_cache_inject_eviction
page_cache_lookahead_blocks
parallel_distributed_insert_select
parallel_hash_join_threshold
parallel_replica_offset
parallel_replicas_allow_in_with_subquery
parallel_replicas_connect_timeout_ms
parallel_replicas_count
parallel_replicas_custom_key
parallel_replicas_custom_key_range_lower
parallel_replicas_custom_key_range_upper
parallel_replicas_for_cluster_engines
parallel_replicas_for_non_replicated_merge_tree
parallel_replicas_index_analysis_only_on_coordinator
parallel_replicas_insert_select_local_pipeline
parallel_replicas_local_plan
parallel_replicas_mark_segment_size
parallel_replicas_min_number_of_rows_per_replica
parallel_replicas_mode
parallel_replicas_only_with_analyzer
parallel_replicas_prefer_local_join
parallel_replicas_support_projection
parallel_view_processing
parallelize_output_from_storages
parsedatetime_e_requires_space_padding
parsedatetime_parse_without_leading_zeros
partial_merge_join_left_table_buffer_bytes
partial_merge_join_rows_in_right_blocks
partial_result_on_first_cancel
parts_to_delay_insert
parts_to_throw_insert
per_part_index_stats
poll_interval
postgresql_connection_attempt_timeout
postgresql_connection_pool_auto_close_connection
postgresql_connection_pool_retries
postgresql_connection_pool_size
postgresql_connection_pool_wait_timeout
postgresql_fault_injection_probability
prefer_column_name_to_alias
prefer_external_sort_block_bytes
prefer_global_in_and_join
prefer_localhost_replica
prefer_warmed_unmerged_parts_seconds
preferred_block_size_bytes
preferred_max_column_in_block_size_bytes
preferred_optimize_projection_name
prefetch_buffer_size
print_pretty_type_names
priority
promql_database
promql_evaluation_time
promql_table
push_external_roles_in_interserver_queries
query_cache_compress_entries
query_cache_max_entries
query_cache_max_size_in_bytes
query_cache_min_query_duration
query_cache_min_query_runs
query_cache_nondeterministic_function_handling
query_cache_share_between_users
query_cache_squash_partial_results
query_cache_system_table_handling
query_cache_tag
query_cache_ttl
query_condition_cache_store_conditions_as_plaintext
query_metric_log_interval
query_plan_aggregation_in_order
query_plan_convert_any_join_to_semi_or_anti_join
query_plan_convert_join_to_in
query_plan_convert_outer_join_to_inner_join
query_plan_direct_read_from_text_index
query_plan_display_internal_aliases
query_plan_enable_multithreading_after_window_functions
query_plan_enable_optimizations
query_plan_execute_functions_after_sorting
query_plan_filter_push_down
query_plan_join_shard_by_pk_ranges
query_plan_join_swap_table
query_plan_lift_up_array_join
query_plan_lift_up_union
query_plan_max_limit_for_lazy_materialization
query_plan_max_optimizations_to_apply
query_plan_max_step_description_length
query_plan_merge_expressions
query_plan_merge_filter_into_join_condition
query_plan_merge_filters
query_plan_optimize_join_order_limit
query_plan_optimize_lazy_materialization
query_plan_optimize_prewhere
query_plan_push_down_limit
query_plan_read_in_order
query_plan_remove_redundant_distinct
query_plan_remove_redundant_sorting
query_plan_remove_unused_columns
query_plan_reuse_storage_ordering_for_window_functions
query_plan_split_filter
query_plan_try_use_vector_search
query_plan_use_new_logical_join_step
query_profiler_cpu_time_period_ns
query_profiler_real_time_period_ns
queue_max_wait_ms
rabbitmq_max_wait_ms
read_backoff_max_throughput
read_backoff_min_concurrency
read_backoff_min_events
read_backoff_min_interval_between_events_ms
read_backoff_min_latency_ms
read_from_distributed_cache_if_exists_otherwise_bypass_cache
read_from_filesystem_cache_if_exists_otherwise_bypass_cache
read_from_page_cache_if_exists_otherwise_bypass_cache
read_in_order_two_level_merge_threshold
read_in_order_use_buffering
read_in_order_use_virtual_row
read_overflow_mode
read_overflow_mode_leaf
read_priority
read_through_distributed_cache
readonly
receive_data_timeout_ms
receive_timeout
regexp_max_matches_per_row
reject_expensive_hyperscan_regexps
remerge_sort_lowered_memory_bytes_ratio
remote_filesystem_read_method
remote_filesystem_read_prefetch
remote_fs_read_backoff_max_tries
remote_fs_read_max_backoff_ms
remote_read_min_bytes_for_seek
rename_files_after_processing
replace_running_query
replace_running_query_max_wait_ms
replication_wait_for_inactive_replica_timeout
restore_replace_external_dictionary_source_to_null
restore_replace_external_engines_to_null
restore_replace_external_table_functions_to_null
restore_replicated_merge_tree_to_shared_merge_tree
result_overflow_mode
rewrite_count_distinct_if_with_count_distinct_implementation
rewrite_in_to_join
s3_allow_multipart_copy
s3_allow_parallel_part_upload
s3_check_objects_after_upload
s3_connect_timeout_ms
s3_create_new_file_on_insert
s3_disable_checksum
s3_ignore_file_doesnt_exist
s3_list_object_keys_size
s3_max_connections
s3_max_get_burst
s3_max_get_rps
s3_max_inflight_parts_for_one_file
s3_max_part_number
s3_max_put_burst
s3_max_put_rps
s3_max_single_operation_copy_size
s3_max_single_part_upload_size
s3_max_single_read_retries
s3_max_unexpected_write_error_retries
s3_max_upload_part_size
s3_min_upload_part_size
s3_request_timeout_ms
s3_skip_empty_files
s3_slow_all_threads_after_network_error
s3_strict_upload_part_size
s3_throw_on_zero_files_match
s3_truncate_on_insert
s3_upload_part_size_multiply_factor
s3_upload_part_size_multiply_parts_count_threshold
s3_use_adaptive_timeouts
s3_validate_request_settings
s3queue_default_zookeeper_path
s3queue_enable_logging_to_s3queue_log
s3queue_keeper_fault_injection_probability
s3queue_migrate_old_metadata_to_buckets
schema_inference_cache_require_modification_time_for_url
schema_inference_use_cache_for_azure
schema_inference_use_cache_for_file
schema_inference_use_cache_for_hdfs
schema_inference_use_cache_for_s3
schema_inference_use_cache_for_url
secondary_indices_enable_bulk_filtering
select_sequential_consistency
send_logs_level
send_logs_source_regexp
send_profile_events
send_progress_in_http_headers
send_timeout
serialize_query_plan
session_timezone
set_overflow_mode
shared_merge_tree_sync_parts_on_partition_operations
short_circuit_function_evaluation
short_circuit_function_evaluation_for_nulls
short_circuit_function_evaluation_for_nulls_threshold
show_data_lake_catalogs_in_system_tables
show_processlist_include_internal
show_table_uuid_in_table_create_query_if_not_nil
single_join_prefer_left_table
skip_redundant_aliases_in_udf
skip_unavailable_shards
sleep_after_receiving_query_ms
sleep_in_send_data_ms
sleep_in_send_tables_status_ms
sort_overflow_mode
split_intersecting_parts_ranges_into_layers_final
split_parts_ranges_into_intersecting_and_non_intersecting_final
splitby_max_substrings_includes_remaining_string
stop_refreshable_materialized_views_on_startup
storage_file_read_method
storage_system_stack_trace_pipe_read_timeout_ms
stream_flush_interval_ms
stream_like_engine_allow_direct_select
stream_like_engine_insert_queue
stream_poll_timeout_ms
system_events_show_zero_values
table_engine_read_through_distributed_cache
table_function_remote_max_addresses
tcp_keep_alive_timeout
temporary_data_in_cache_reserve_space_wait_lock_timeout_milliseconds
temporary_files_buffer_size
temporary_files_codec
text_index_use_bloom_filter
throw_if_deduplication_in_dependent_materialized_views_enabled_with_async_insert
throw_if_no_data_to_insert
throw_on_error_from_cache_on_write_operations
throw_on_max_partitions_per_insert_block
throw_on_unsupported_query_inside_transaction
timeout_before_checking_execution_speed
timeout_overflow_mode
timeout_overflow_mode_leaf
totals_auto_threshold
totals_mode
trace_profile_events
transfer_overflow_mode
transform_null_in
traverse_shadow_remote_data_paths
union_default_mode
unknown_packet_in_send_data
update_parallel_mode
update_sequential_consistency
use_async_executor_for_materialized_views
use_cache_for_count_from_files
use_client_time_zone
use_compact_format_in_distributed_parts_names
use_concurrency_control
use_hedged_requests
use_hive_partitioning
use_iceberg_metadata_files_cache
use_iceberg_partition_pruning
use_index_for_in_with_subqueries
use_index_for_in_with_subqueries_max_values
use_join_disjunctions_push_down
use_legacy_to_time
use_page_cache_for_disks_without_file_cache
use_page_cache_with_distributed_cache
use_paimon_partition_pruning
use_query_cache
use_query_condition_cache
use_roaring_bitmap_iceberg_positional_deletes
use_skip_indexes
use_skip_indexes_if_final
use_skip_indexes_if_final_exact_mode
use_skip_indexes_on_data_read
use_statistics_cache
use_structure_from_insertion_table_in_table_functions
use_text_index_dictionary_cache
use_text_index_header_cache
use_text_index_postings_cache
use_uncompressed_cache
use_variant_as_common_type
use_with_fill_by_sorting_prefix
validate_enum_literals_in_operators
validate_mutation_query
validate_polygons
vector_search_filter_strategy
vector_search_index_fetch_multiplier
vector_search_with_rescoring
wait_changes_become_visible_after_commit_mode
wait_for_async_insert
wait_for_async_insert_timeout
wait_for_window_view_fire_signal_timeout
window_view_clean_interval
window_view_heartbeat_interval
workload
write_full_path_in_iceberg_metadata
write_through_distributed_cache
write_through_distributed_cache_buffer_size
zstd_window_log_max

Was this page helpful?

add_http_cors_header​

additional_result_filter​

additional_table_filters​

aggregate_functions_null_for_empty​

aggregation_in_order_max_block_bytes​

aggregation_memory_efficient_merge_threads​

allow_aggregate_partitions_independently​

allow_archive_path_syntax​

allow_asynchronous_read_from_io_pool_for_merge_tree​

allow_changing_replica_until_first_data_packet​

allow_create_index_without_type​

allow_custom_error_code_in_throwif​

allow_ddl​

allow_deprecated_database_ordinary​

allow_deprecated_error_prone_window_functions​

allow_deprecated_snowflake_conversion_functions​

allow_deprecated_syntax_for_merge_tree​

allow_distributed_ddl​

allow_drop_detached​

allow_dynamic_type_in_join_keys​

allow_execute_multiif_columnar​

allow_experimental_alias_table_engine​

allow_experimental_analyzer​

allow_experimental_codecs​

allow_experimental_correlated_subqueries​

allow_experimental_database_glue_catalog​

allow_experimental_database_hms_catalog​

allow_experimental_database_iceberg​

allow_experimental_database_materialized_postgresql​

allow_experimental_database_unity_catalog​

allow_experimental_delta_kernel_rs​

allow_experimental_delta_lake_writes​

allow_experimental_full_text_index​

allow_experimental_funnel_functions​

allow_experimental_hash_functions​

allow_experimental_iceberg_compaction​

allow_experimental_insert_into_iceberg​

allow_experimental_join_right_table_sorting​

allow_experimental_kafka_offsets_storage_in_keeper​

allow_experimental_kusto_dialect​

allow_experimental_materialized_postgresql_table​

allow_experimental_nlp_functions​

allow_experimental_parallel_reading_from_replicas​

allow_experimental_prql_dialect​

allow_experimental_qbit_type​

allow_experimental_query_deduplication​

allow_experimental_statistics​

allow_experimental_time_series_aggregate_functions​

allow_experimental_time_series_table​

allow_experimental_time_time64_type​

allow_experimental_window_view​

allow_experimental_ytsaurus_dictionary_source​

allow_experimental_ytsaurus_table_engine​

allow_experimental_ytsaurus_table_function​

allow_general_join_planning​

allow_get_client_http_header​

allow_hyperscan​

allow_introspection_functions​

allow_materialized_view_with_bad_select​

allow_named_collection_override_by_default​

allow_non_metadata_alters​

allow_nonconst_timezone_arguments​

allow_nondeterministic_mutations​

allow_nondeterministic_optimize_skip_unused_shards​

allow_not_comparable_types_in_comparison_functions​

allow_not_comparable_types_in_order_by​

allow_prefetched_read_pool_for_local_filesystem​

allow_prefetched_read_pool_for_remote_filesystem​

allow_push_predicate_ast_for_distributed_subqueries​

allow_push_predicate_when_subquery_contains_with​

allow_reorder_prewhere_conditions​

allow_settings_after_format_in_insert​

allow_simdjson​

allow_special_serialization_kinds_in_output_formats​

allow_statistics_optimize​

allow_suspicious_codecs​

allow_suspicious_fixed_string_types​

allow_suspicious_indices​

allow_suspicious_low_cardinality_types​

allow_suspicious_primary_key​

add_http_cors_header

additional_result_filter

additional_table_filters

aggregate_functions_null_for_empty

aggregation_in_order_max_block_bytes

aggregation_memory_efficient_merge_threads

allow_aggregate_partitions_independently

allow_archive_path_syntax

allow_asynchronous_read_from_io_pool_for_merge_tree

allow_changing_replica_until_first_data_packet

allow_create_index_without_type

allow_custom_error_code_in_throwif

allow_ddl

allow_deprecated_database_ordinary

allow_deprecated_error_prone_window_functions

allow_deprecated_snowflake_conversion_functions

allow_deprecated_syntax_for_merge_tree

allow_distributed_ddl

allow_drop_detached

allow_dynamic_type_in_join_keys

allow_execute_multiif_columnar

allow_experimental_alias_table_engine

allow_experimental_analyzer

allow_experimental_codecs

allow_experimental_correlated_subqueries

allow_experimental_database_glue_catalog

allow_experimental_database_hms_catalog

allow_experimental_database_iceberg

allow_experimental_database_materialized_postgresql

allow_experimental_database_unity_catalog

allow_experimental_delta_kernel_rs

allow_experimental_delta_lake_writes

allow_experimental_full_text_index

allow_experimental_funnel_functions

allow_experimental_hash_functions

allow_experimental_iceberg_compaction

allow_experimental_insert_into_iceberg

allow_experimental_join_right_table_sorting

allow_experimental_kafka_offsets_storage_in_keeper

allow_experimental_kusto_dialect

allow_experimental_materialized_postgresql_table

allow_experimental_nlp_functions

allow_experimental_parallel_reading_from_replicas

allow_experimental_prql_dialect

allow_experimental_qbit_type

allow_experimental_query_deduplication

allow_experimental_statistics

allow_experimental_time_series_aggregate_functions

allow_experimental_time_series_table

allow_experimental_time_time64_type

allow_experimental_window_view

allow_experimental_ytsaurus_dictionary_source

allow_experimental_ytsaurus_table_engine

allow_experimental_ytsaurus_table_function

allow_general_join_planning

allow_get_client_http_header

allow_hyperscan

allow_introspection_functions

allow_materialized_view_with_bad_select

allow_named_collection_override_by_default

allow_non_metadata_alters

allow_nonconst_timezone_arguments

allow_nondeterministic_mutations

allow_nondeterministic_optimize_skip_unused_shards

allow_not_comparable_types_in_comparison_functions

allow_not_comparable_types_in_order_by

allow_prefetched_read_pool_for_local_filesystem

allow_prefetched_read_pool_for_remote_filesystem

allow_push_predicate_ast_for_distributed_subqueries

allow_push_predicate_when_subquery_contains_with

allow_reorder_prewhere_conditions

allow_settings_after_format_in_insert

allow_simdjson

allow_special_serialization_kinds_in_output_formats

allow_statistics_optimize

allow_suspicious_codecs

allow_suspicious_fixed_string_types

allow_suspicious_indices

allow_suspicious_low_cardinality_types

allow_suspicious_primary_key