- Опубликовано
Оптимизация Apache Iceberg для real-time загрузки
- Автор
- Имя
- Новости нашего ИТ
- Telegram
- Новости нашего ИТ14 подписчиков5145 постовДанный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
Оптимизации функционала Apache Iceberg в задачах real-time загрузки и обработки данных
#Kubernetes
Привет, Хабр! На связи — технические лидеры направления разработки Apache Spark в составе платформы Data Ocean Андрей Первушин и Дмитрий Паршин из Data Sapience. Мы занимаемся решением нетривиальных задач в области Spark-вычислений, некоторые из которых становятся частью конечного продукта. Сегодня мы расскажем, с какими проблемами можно столкнуться при реализации Upsert Streaming в Iceberg, что такое equality delete, почему они создают нагрузку при чтении таблиц в Apache Iceberg и как мы оптимизировали Apache Spark, чтобы снизить потребление памяти и ускорить чтение данных.
Новости нашего ИТ
14 подписчиков
5145 постов
Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
Предыдущий пост
- Опубликовано
Обнаружение взаимоблокировок на JVM с помощью Fray
Обнаружить взаимоблокировки на JVM с помощью Fray
Из подборки #databases
- Опубликовано
красные флаги в резюме мешают работе мечты
красные флаги в резюме, которые мешают кандидатам получить работу мечты
- Опубликовано
Redis — это больше, чем просто кэш
Redis больше чем кэш: брокер сообщений, гео‑БД, распределённые блокировки
- Опубликовано
Как AI убьет вашу базу: безопасность в 2026
как AI убьет базу данных безопасность 2026
- Опубликовано
4 проекта РСХБ.Цифра лауреаты Global CIO
4 проекта РСХБ.Цифра выиграли конкурс «Проект года» Global CIO
- Опубликовано
Прозрачность как главный UX-принцип: что не должен скрывать интерфейс инженерных продуктов
Прозрачность UX в инженерных продуктах: что не должно скрывать интерфейс
- Опубликовано
Python‑бинарник в Tauri: проблемы на Arch Linux
Проблемы Python‑бинарника в Tauri на Arch Linux и решения
Свежие посты
- Опубликовано
#devops
+1
Model Context Protocol на Go: 100K ops/sec
Model Context Protocol на Go: 100K ops/sec, 10× быстрее Python SDK, multi‑tenancy, security
- Опубликовано
#java
+1
Создать Telegram‑бот погоды за 5 минут Nyagram
Как создать Telegram‑бот погоды за 5 минут на Java с Nyagram и OpenWeatherMap
- Опубликовано
Kafka
+1
Регуляторные документы РФ по ИИ в 2026 году
регуляторные документы РФ безопасность ИИ 2026
- Опубликовано
#java
+1
Spring Shell 4.0.1 is out!
Spring Shell 4.0.1 выпуск
- Опубликовано
Kafka
+1
CDC своими руками: Kafka + Debezium в лаборатории
CDC Kafka Debezium домашняя лаборатория PostgreSQL
- Опубликовано
Kafka
+1
Kafka: обработка ошибок и Dead Letter Queues
Как обработать ошибки в Spring Kafka и использовать Dead Letter Queue
- Опубликовано
#java
+1
Создание Ambilight приложения для Android на Java
Как создать приложение Ambilight для Android на Java
- Опубликовано
#java
+1
Архитектура факторов ранжирования Ozon runtime
архитектура факторов ранжирования в runtime поиска Ozon