Skip to content

Обзор

Важно

Сервис предоставляется на стадии готовности Preview.

Managed ClickHouse — это сервис для развертывания и управления кластерами столбцовой системы управления данными ClickHouse, предназначенной для скоростной аналитики больших объемов данных в реальном времени.

Сервис поддерживает ClickHouse версии 25.3.

Сценарии использования:

  • Аналитика и отчетность в реальном времени
    Мгновенная агрегация высокоскоростных потоков данных для оперативных дашбордов, например, по поведению пользователей или телеметрии.
  • Веб- и поведенческая аналитика
    Обработка миллионов событий для построения детализированных отчетов по посещаемости и когортному анализу.
  • Агрегация данных для аналитики и ML
    Агрегация логов в базы данных для создания выборок готовых признаков, анализ предсказаний и метрик.
  • Мониторинг и отладка систем
    Сбор и анализ всех системных логов и метрик производительности для мгновенного поиска аномалий и причин сбоев.

Ключевые особенности

  • Горизонтальное масштабирование
    Кластер автоматически распределяет данные и нагрузку по шардам. Это позволяет линейно наращивать производительность и объем хранимой информации для работы с петабайтами данных.
  • Надежность и устойчивость к сбоям
    За счет репликации данных кластер устойчив к сбоям на уровне узлов. Это обеспечивает сохранность данных и таблиц даже при выходе из строя отдельных узлов системы.
  • Сжатие и хранение данных
    Столбцовая архитектура обеспечивает высокую степень сжатия данных. Это позволяет сократить стоимость хранения больших объемов структурированной информации.
  • Высокая производительность аналитических запросов
    Столбцовое хранение и векторное исполнение запросов позволяют обрабатывать терабайты данных за доли секунды для построения интерактивных отчетов и дашбордов.
  • Резервное копирование
    В сервисе доступно резервное копирование, которое может запускаться автоматически по расписанию и вручную.
  • Контроль доступа
    Настройки доступа на уровнях платформы и каждого кластера позволяют разграничить права для разных пользователей и систем и обеспечивают соответствие политикам безопасности.

Как работает сервис

Для работы с базами данных в Managed ClickHouse создается кластер. Кластер состоит из узлов — виртуальных машин, на которых развернуты экземпляры баз данных. Узлы кластера могут находиться в разных зонах доступности.

В Managed ClickHouse доступны два типа кластеров: standalone- и multi-node-кластер. В standalone-кластере всегда 1 узел с данными. В multi-node-кластере может быть 2 или 4 узла с данными. Работа multi-node-кластера координируется узлами ClickHouse Keeper.

В кластере вы можете создать несколько логических баз данных, изолированных друг от друга. В multi-node-кластере для распределения нагрузки и масштабирования под изменяющийся объем данных в БД можно использовать шардирование. Если шардирование включено, узлы распределяются между шардами. Если шардирование отключено, в кластере создается 1 шард со всеми узлами.

Managed ClickHouse позволяет автоматизировать резервное копирование. Для восстановления кластера можно выбрать одну из его автоматических или ручных резервных копий. Автоматические резервные копии кластера создаются по заданному расписанию.

Доступ к управлению ресурсами Managed ClickHouse сервиса регулируется с помощью сервисных ролей. Эти роли определяют, какие действия пользователь может выполнять на уровне облака.

Управление доступом к данным и операциям внутри кластера регулируется средствами СУБД ClickHouse. Для этого используется модель ролевого управления доступом. Каждому пользователю назначаются профили настроек и роли ClickHouse. При создании кластера автоматически создается пользователь-администратор, который обладает всеми правами для настройки этой модели.

Репликация данных

В каждом шарде, состоящем из двух или более узлов, работает репликация. Все узлы в шарде — реплики и дублируют данные друг друга. Сначала запись выполняется на одном узле, а потом данные реплицируются на остальные узлы.

Репликация в ClickHouse функционирует на уровне таблицы, а не узла. Кроме того, данные реплицируются только для таблиц на движке семейства ReplicatedMergeTree. Такую таблицу нужно создать на каждом узле — вручную или с помощью распределенного DDL-запроса.

На узле могут одновременно храниться реплицируемые и нереплицируемые таблицы.

Активация

Чтобы начать пользоваться сервисом Managed ClickHouse, нажмите кнопку Оставить заявку на странице сервиса. Доступ к сервису появится, как только заявка будет обработана.

Тарификация

На стадии Preview сервис не тарифицируется.