Дата: 2025-01-23
Принято
С целью аудита и аналитики требуется хранить big data: бизнес-события вида «продукт добавлен», «заказ оплачен».
К слову, Uptrace хранит технические метрики в ClickHouse и никак иначе. Это намекает на то, что логично использовать одно хранилище для обоих типов данных.
Разнообразные и многочисленные бизнес-события хранятся и агрегируются таким способом, что время агрегации сотен миллионов записей - типично не более 1 сек. (зависит от правильной организации данных и запросов к ним). Возможность визуализировать данные в онлайн-конструкторе в виде графиков и таблиц.
[наверх]
Эта система хранит и визуализирует big data, но только в части агрегированных логов. Разумеется, там можно хранить любые данные, однако набор аналитических возможностей ограничен (находится примерно на уровне реляционных БД), а язык запросов своеобразен.
ElasticSearch был стандартным решением до появления OLAP-систем нового поколения, который возможно и не появились бы, если бы ElasticSearch отвечал возросшим требованиям в этой области. Тем не менее, в области поиска и визуализации логов, а также полнотекстового поиска (любых данных) он остается лидером. Для сравнения, в ClickHouse полнотекстовый поиск находится в экспериментальной стадии.
Лицензия ElasticSearch 8 запрещает предоставлять продукт в виде сервиса (чтобы облака не перепродавали изначально бесплатный продукт), а для внутреннего использования в проектах - позволяет.
[наверх]
ClickHouse был разработан Яндексом, с 2009 г. обслуживает «Яндекс Метрику», а в 2016 г. стал общедоступен под лицензией Apache. На сайте производителя предлагается облачный вариант, но можно хостить самому, бесплатно.
JdbcTemplate
.Для визуализации аналитических данных есть Metabase. Этот онлайн-конструктор визуализаций не привязан к конкретному источнику данных: есть плагины для ClickHouse, Postgres и др.
[наверх]