- Опубликовано
MapReduce в SQL: генераторы на курсорах
- Автор
- Имя
- Новости нашего ИТ
- Telegram
- Новости нашего ИТ14 подписчиков5145 постовДанный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
Добавляем MapReduce в этот наш SQL: генераторы на основе курсоров
#java
Вот уже который год я потихоньку разрабатываю SQL-ный движок на основе Apache Spark, специализированный под задачи ETL. И хотя диалект языка изначально называется «Transform Definition Language», писать трансформации данных непосредственно на нём самом было до сих пор невозможно. Вместо этого на фазе Transform предполагалось использовать подключаемые модули, которые рантайм интерпретатора предоставляет из Java classpath. Это очень эффективный с точки зрения производительности, но довольно долгий с точки зрения внедрения, и дорогой в разработке способ. Сначала трансформацию надо описать формально в виде статьи-whitepaper'а (это делает data scientist), потом написать прототип на Python (ответственность data analyst), отладиться на сэмпле реальных данных (тоже аналитик), и тогда уже делать и
Предыдущий пост
- Опубликовано
ТОП-5 ИБ-событий недели по версии Jet CSIRT
Из подборки #databases
- Опубликовано
красные флаги в резюме мешают работе мечты
- Опубликовано
Redis — это больше, чем просто кэш
- Опубликовано
Как AI убьет вашу базу: безопасность в 2026
- Опубликовано
4 проекта РСХБ.Цифра лауреаты Global CIO
- Опубликовано
Прозрачность как главный UX-принцип: что не должен скрывать интерфейс инженерных продуктов
- Опубликовано
Python‑бинарник в Tauri: проблемы на Arch Linux
Свежие посты
- Опубликовано
Model Context Protocol на Go: 100K ops/sec
- Опубликовано
Создать Telegram‑бот погоды за 5 минут Nyagram
- Опубликовано
Регуляторные документы РФ по ИИ в 2026 году
- Опубликовано
Spring Shell 4.0.1 is out!
- Опубликовано
CDC своими руками: Kafka + Debezium в лаборатории
- Опубликовано
Kafka: обработка ошибок и Dead Letter Queues
- Опубликовано
Создание Ambilight приложения для Android на Java
- Опубликовано