Новости нашего ИТ логотип
Подписаться
Опубликовано

LLM as a Judge: опыт оптимизации генератора описаний Pull Request

Автор

LLM as a Judge: опыт оптимизации генератора описаний Pull Request #Kubernetes Меня зовут Дмитрий Успенский, я работаю в команде ML RnD Техплатформы Городских сервисов Яндекса, и в статье я расскажу, как мы применили подход LLM as a judge — когда сама языковая модель оценивает качество генераций и сравнивает между собой разные варианты описаний. Поделюсь опытом определения критериев качества, сбора валидационного датасета, подбора промптов и выбора модели. Результаты оказались обнадёживающими: метод действительно позволяет улучшить генеративную систему без участия ручной разметки и асессоров.

link

avatar
Новости нашего ИТ
12 подписчиков
4789 постов
Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Свежие посты