Новости нашего ИТ логотип
Подписаться
Опубликовано

Как собрать дата‑стек на ноутбуке одной командой

Автор

Data Forge: Собираем весь современный дата-стек на своем ноутбуке одной командой #databases Привет, Хабр! Давайте признаемся: порог входа в Data Engineering довольно высок. И дело не только в знании SQL или Python. Настоящая боль начинается, когда ты пытаешься собрать на своей машине хотя бы простенький пайплайн. Нужно поднять Kafka, рядом поставить Zookeeper (или обойтись Kraft, если ты хипстер), прикрутить Debezium для CDC, развернуть Spark для обработки, где-то хранить результат (привет, MinIO!), а потом всё это оркестрировать через Airflow и визуализировать в Superset. Каждый инструмент — это отдельный Docker-контейнер, своя конфигурация, свои порты и свои зависимости. Через пару часов борьбы с docker-compose.yml и сетевыми настройками желание учиться и экспериментировать улетучивается. Знакомо? А что, если я скажу, что весь этот зоопарк можно поднять одной командой, и он про

link

avatar
Новости нашего ИТ
12 подписчиков
4788 постов
Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Свежие посты