- Опубликовано
Как Lamoda Tech варит данные для ML
- Автор

- Имя
- Новости нашего ИТ
- Telegram
Новости нашего ИТ12 подписчиков4788 постовДанный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
От сырого кликстрима к чистым датасетам: как мы в Lamoda Tech варим данные
#Spring kafka
Привет, Хабр! Это тимлид DS группы ранжирования и поиска Дана Злочевская и тимлид группы разработки Михаил Нестеров из Lamoda Tech. Как и у любой крупной e-commerce платформы, данные — наш главный актив. Они помогают бизнесу принимать обоснованные решения, а пользователям — получать персонализированный, качественный опыт во всех продуктах Lamoda. Поэтому в продакшене ежедневно работают десятки ML-пайплайнов, а в Airflow запускаются сотни DAG-воркфлоу. Данные готовят и используют более 100 специалистов из самых разных команд: аналитики, дата-сайентисты, ML-инженеры, маркетологи — у каждой свои задачи и логика работы с ними. Однако с ростом команд, задач и инфраструктуры мы начали сталкиваться с рядом системных проблем: • Разрозненные подходы к подготовке данных. Каждая команда собирала данн
Предыдущий пост
- Опубликовано
9 июля ждём всех на Java AI meetup от VK
Следующий пост
- Опубликовано
Spring Data JPA Hibernate производительность 3
Из подборки #it_news
- Опубликовано
OpenMedata в облаке: DataGovernance обзор Collate 1
- Опубликовано
Сеть вместо SD: собрать Linux для Raspberry Pi
- Опубликовано
Язык моделирования ИТ-инфраструктуры
- Опубликовано
Bank-in-a-Box: собрать песочницу для API‑хакатона
- Опубликовано
Из чего состоят промышленные сети
- Опубликовано
Project Panama: Java говорит на C (Часть 1)
Свежие посты
- Опубликовано
Удобная синхронизация настроек Kafka
- Опубликовано
Spring Data 2025.1.2 и 2025.0.8 released
- Опубликовано
How Ansible does the real work in hyperautomation
- Опубликовано
OpenMedata в облаке: DataGovernance обзор Collate 1
- Опубликовано
Python без Python: как запускать код где угодно
- Опубликовано
Хакатон Норникеля: YOLO, 2 место
- Опубликовано
Nginx с человеческим лицом: обзор Nginx Proxy Manager
- Опубликовано