Новости нашего ИТ логотип
Подписаться
Опубликовано

Data Quality в Big Data: контроль качества в Hadoop

Автор

Data Quality в масштабе Big Data: как мы построили систему контроля качества данных в Hadoop #Kubernetes Качество данных — это не просто вопрос наличия значений в столбцах таблиц. Это вопрос доверия к данным в целом. Мы можем создавать сложные системы отчётности, но если на каком-то этапе ETL в данных возникают пропуски, дубликаты или они не соответствуют ожиданиям, вся система теряет доверие потребителей. В результате приходится тратить много времени на поиск и устранение причин таких проблем.

link

avatar
Новости нашего ИТ
12 подписчиков
4771 пост
Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Свежие посты