- Опубликовано
MapReduce в SQL: генераторы на курсорах
- Автор

- Имя
- Новости нашего ИТ
- Telegram
Новости нашего ИТ12 подписчиков4789 постовДанный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
Добавляем MapReduce в этот наш SQL: генераторы на основе курсоров
#java
Вот уже который год я потихоньку разрабатываю SQL-ный движок на основе Apache Spark, специализированный под задачи ETL. И хотя диалект языка изначально называется «Transform Definition Language», писать трансформации данных непосредственно на нём самом было до сих пор невозможно. Вместо этого на фазе Transform предполагалось использовать подключаемые модули, которые рантайм интерпретатора предоставляет из Java classpath. Это очень эффективный с точки зрения производительности, но довольно долгий с точки зрения внедрения, и дорогой в разработке способ. Сначала трансформацию надо описать формально в виде статьи-whitepaper'а (это делает data scientist), потом написать прототип на Python (ответственность data analyst), отладиться на сэмпле реальных данных (тоже аналитик), и тогда уже делать и
Предыдущий пост
- Опубликовано
ТОП-5 ИБ-событий недели по версии Jet CSIRT
Из подборки #databases
- Опубликовано
OpenMedata в облаке: DataGovernance обзор Collate 1
- Опубликовано
Java PostgreSQL Query Cancellation Explained
- Опубликовано
Как написать линтер для SQL-миграций
- Опубликовано
Как документировать разработку ERP-платформы. Часть 2
- Опубликовано
Почему SQLite наконец выглядит современно
- Опубликовано
Хотят многие, делают единицы: наш опыт автоматизации рутины пентеста
Свежие посты
- Опубликовано
Удобная синхронизация настроек Kafka
- Опубликовано
Spring Data 2025.1.2 и 2025.0.8 released
- Опубликовано
How Ansible does the real work in hyperautomation
- Опубликовано
OpenMedata в облаке: DataGovernance обзор Collate 1
- Опубликовано
Python без Python: как запускать код где угодно
- Опубликовано
Хакатон Норникеля: YOLO, 2 место
- Опубликовано
Nginx с человеческим лицом: обзор Nginx Proxy Manager
- Опубликовано