- Опубликовано
Обзор UDTF в PySpark
- Автор
- Имя
- Новости нашего ИТ
- Telegram
- Новости нашего ИТ14 подписчиков5145 постовДанный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
Обзор UDTF в PySpark
#databases
Привет, Хабр! Сегодня разберём фичу из PySpark — UDTF. Если раньше мы писали UDF и UDAF, то UDTF — это про функцию, которая запускается в секции FROM запроса и возвращает как бы несколько стро» для каждой входной записи Звучит круто. UDTFs пригодятся, когда на один входной объект нужно получить множество выходных строк. Простой пример: у нас есть строка текста и мы хотим разделить её на слова так, чтобы каждое слово вышло отдельной строкой. Со стандартным UDF такое не сделать (он возвращает одно значение, например конкатенацию или длину). Но UDTF может делать цикл yield внутри и выдавать сколько угодно строк. Итак, приступим к делу.
Новости нашего ИТ
14 подписчиков
5145 постов
Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
Предыдущий пост
- Опубликовано
Работа со временем в Java: Instant и long
как использовать Java Instant и long для работы с временем
Следующий пост
- Опубликовано
Security Week 2536: эволюция уязвимостей Q2 2025
Эволюция уязвимостей во втором квартале 2025 года
Из подборки #databases
- Опубликовано
красные флаги в резюме мешают работе мечты
красные флаги в резюме, которые мешают кандидатам получить работу мечты
- Опубликовано
Redis — это больше, чем просто кэш
Redis больше чем кэш: брокер сообщений, гео‑БД, распределённые блокировки
- Опубликовано
Как AI убьет вашу базу: безопасность в 2026
как AI убьет базу данных безопасность 2026
- Опубликовано
4 проекта РСХБ.Цифра лауреаты Global CIO
4 проекта РСХБ.Цифра выиграли конкурс «Проект года» Global CIO
- Опубликовано
Прозрачность как главный UX-принцип: что не должен скрывать интерфейс инженерных продуктов
Прозрачность UX в инженерных продуктах: что не должно скрывать интерфейс
- Опубликовано
Python‑бинарник в Tauri: проблемы на Arch Linux
Проблемы Python‑бинарника в Tauri на Arch Linux и решения
Свежие посты
- Опубликовано
#devops
+1
Model Context Protocol на Go: 100K ops/sec
Model Context Protocol на Go: 100K ops/sec, 10× быстрее Python SDK, multi‑tenancy, security
- Опубликовано
#java
+1
Создать Telegram‑бот погоды за 5 минут Nyagram
Как создать Telegram‑бот погоды за 5 минут на Java с Nyagram и OpenWeatherMap
- Опубликовано
Kafka
+1
Регуляторные документы РФ по ИИ в 2026 году
регуляторные документы РФ безопасность ИИ 2026
- Опубликовано
#java
+1
Spring Shell 4.0.1 is out!
Spring Shell 4.0.1 выпуск
- Опубликовано
Kafka
+1
CDC своими руками: Kafka + Debezium в лаборатории
CDC Kafka Debezium домашняя лаборатория PostgreSQL
- Опубликовано
Kafka
+1
Kafka: обработка ошибок и Dead Letter Queues
Как обработать ошибки в Spring Kafka и использовать Dead Letter Queue
- Опубликовано
#java
+1
Создание Ambilight приложения для Android на Java
Как создать приложение Ambilight для Android на Java
- Опубликовано
#java
+1
Архитектура факторов ранжирования Ozon runtime
архитектура факторов ранжирования в runtime поиска Ozon