Разбираемся во внутреннем устройстве ClickHouse
ClickHouse - высокопроизводительная аналитическая база данных с открытыми исходниками. Изначально ClickHouse создавался для задач Яндекс.Метрики, но постепенно нашёл множество применений как внутри Яндекса, так и в других компаниях. Я расскажу то, как ClickHouse устроен внутри, что позволит лучше понять систему, ее сильные и слабые стороны. Полученные знания должны быть полезны при администрировании и разработке решений на основе ClickHouse.
Основные темы доклада:
Устройство хранения данных - почему оно хорошо подходит для аналитических сценариев, что стоит учитывать при выборе индекса
Выполнение SELECT запросов - что влияет на их производительность, как их можно ускорить
Как работает шардирование и репликация - как это соотносится с CAP, как диагностировать проблемы на production-кластере