- Опубликовано
Влияние маленьких файлов на Big Data HDFS vs S3
- Автор
- Имя
- Новости нашего ИТ
- Telegram
- Новости нашего ИТ14 подписчиков5145 постовДанный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
Влияние маленьких файлов на Big Data: HDFS vs S3
#java
Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. В этой статье рассмотрим, как большое количество мелких файлов влияет на производительность различных систем хранения, таких как HDFS и объектные хранилища с S3 API. Разберём, какие технологии хранения лучше всего подходят для работы с мелкими файлами в архитектурах Data Lake и Lakehouse. Сравним производительность HDFS и объектных хранилищ с S3 API. На конкретных тестах покажем, почему именно HDFS эффективнее справляется с большим количеством небольших файлов. Обсудим также случаи, когда мелкие файлы становятся не просто нежелательной ситуацией, а неизбежной необходимостью, например в подходах типа Change Data Capture (CDC).
Предыдущий пост
- Опубликовано
Объектное хранилище VK Cloud: архитектура Storage
Следующий пост
- Опубликовано
Сезон Open source на Хабре: итоги
Из подборки #databases
- Опубликовано
красные флаги в резюме мешают работе мечты
- Опубликовано
Redis — это больше, чем просто кэш
- Опубликовано
Как AI убьет вашу базу: безопасность в 2026
- Опубликовано
4 проекта РСХБ.Цифра лауреаты Global CIO
- Опубликовано
Прозрачность как главный UX-принцип: что не должен скрывать интерфейс инженерных продуктов
- Опубликовано
Python‑бинарник в Tauri: проблемы на Arch Linux
Свежие посты
- Опубликовано
Model Context Protocol на Go: 100K ops/sec
- Опубликовано
Создать Telegram‑бот погоды за 5 минут Nyagram
- Опубликовано
Регуляторные документы РФ по ИИ в 2026 году
- Опубликовано
Spring Shell 4.0.1 is out!
- Опубликовано
CDC своими руками: Kafka + Debezium в лаборатории
- Опубликовано
Kafka: обработка ошибок и Dead Letter Queues
- Опубликовано
Создание Ambilight приложения для Android на Java
- Опубликовано