Новости нашего ИТ

Подписаться

Опубликовано: вторник, 13 мая 2025 г.

LLM as a Judge: опыт оптимизации генератора описаний Pull Request

Автор

Имя
Новости нашего ИТ
Telegram
telegram

Новости нашего ИТ

13 подписчиков

5145 постов

Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

LLM as a Judge: опыт оптимизации генератора описаний Pull Request #Kubernetes Меня зовут Дмитрий Успенский, я работаю в команде ML RnD Техплатформы Городских сервисов Яндекса, и в статье я расскажу, как мы применили подход LLM as a judge — когда сама языковая модель оценивает качество генераций и сравнивает между собой разные варианты описаний. Поделюсь опытом определения критериев качества, сбора валидационного датасета, подбора промптов и выбора модели. Результаты оказались обнадёживающими: метод действительно позволяет улучшить генеративную систему без участия ручной разметки и асессоров.

Обсудить в Telegram

Новости нашего ИТ

13 подписчиков

5145 постов

Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Предыдущий пост

Опубликовано: 13 мая 2025 г.

Пакетная репликация данных в аналитическом ландшафте

Пакетная репликация данных для аналитических хранилищ и озер. Когда выбрать пакетную загрузку или онлайн-подход.

Следующий пост

Опубликовано: 13 мая 2025 г.

Чистая архитектура FastAPI пример

Чистая архитектура FastAPI: пример проекта с Docker, PostgreSQL и мониторингом

Из подборки #ai

Опубликовано: 1 февр. 2026 г.

+1

Регуляторные документы РФ по ИИ в 2026 году

регуляторные документы РФ безопасность ИИ 2026

Опубликовано: 30 янв. 2026 г.

+1

Куда и почему уходят бабки на нейросети

почему компании тратят деньги на нейросети и как это работает

Опубликовано: 30 янв. 2026 г.

+1

An Introduction to Using simple-openai in Java

Как использовать библиотеку simple-openai в Java для интеграции LLM

Опубликовано: 30 янв. 2026 г.

+1

Как AI убьет вашу базу: безопасность в 2026

как AI убьет базу данных безопасность 2026

Опубликовано: 29 янв. 2026 г.

+1

Как нейросеть может быть лучшим ассистентом?

как нейросеть стать лучшим ассистентом для работы и автоматизации

Опубликовано: 29 янв. 2026 г.

+1

Open-Source AI фитнес‑тренер: 27 MCP‑инструментов

Open-Source AI фитнес‑тренер: 27 MCP‑инструментов, 3 провайдера, граф упражнений, Docker PWA, код Claude Code

Все посты из подборки →

Свежие посты

Опубликовано: 1 февр. 2026 г.

+1

Model Context Protocol на Go: 100K ops/sec

Model Context Protocol на Go: 100K ops/sec, 10× быстрее Python SDK, multi‑tenancy, security

Опубликовано: 1 февр. 2026 г.

+1

Создать Telegram‑бот погоды за 5 минут Nyagram

Как создать Telegram‑бот погоды за 5 минут на Java с Nyagram и OpenWeatherMap

Опубликовано: 1 февр. 2026 г.

+1

Регуляторные документы РФ по ИИ в 2026 году

регуляторные документы РФ безопасность ИИ 2026

Опубликовано: 31 янв. 2026 г.

+1

Spring Shell 4.0.1 is out!

Spring Shell 4.0.1 выпуск

Опубликовано: 31 янв. 2026 г.

+1

CDC своими руками: Kafka + Debezium в лаборатории

CDC Kafka Debezium домашняя лаборатория PostgreSQL

Опубликовано: 31 янв. 2026 г.

+1

Kafka: обработка ошибок и Dead Letter Queues

Как обработать ошибки в Spring Kafka и использовать Dead Letter Queue

Опубликовано: 31 янв. 2026 г.

+1

Создание Ambilight приложения для Android на Java

Как создать приложение Ambilight для Android на Java

Опубликовано: 31 янв. 2026 г.

+1

Архитектура факторов ранжирования Ozon runtime

архитектура факторов ранжирования в runtime поиска Ozon

Следующие посты →