Подписаться
Опубликовано

Универсальный коллектор для интеграции КХД с Kafka

Автор
  • Имя
    Новости нашего ИТ
    Telegram

Опыт разработки и внедрения универсального коллектора для интеграции КХД с Kafka #java Привет, Хабр! В этой статье хочу поделиться нашим опытом интеграции с Kafka. В Мегафоне несколько десятков сервисов являются потребителями данных, публикуемых в кластерах Kafka. Все они разрабатывались под узкоспециализированные задачи. В какой-то момент в нашем КХД также появилась необходимость интеграции с Kafka. При разработке первой интеграции мы пошли традиционным путем и использовали Kafka Connect для Confluent 6.0.1. Сообщения, читаемые коннектором, перекладывались в Hadoop. Далее в PySpark выполнялся парсинг нужных данных, и полученные пачки выгружались в Oracle Exadata. Но на этапе опытно-промышленной эксплуатации у нас возникли проблемы с производительностью из-за большого объема читаемых данных: ~100-110 млн сообщений в час (поток со звонками абонентов). Также было требование от

link

Новости нашего ИТ
14 подписчиков
5145 постов
Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Свежие посты