Новости нашего ИТ

Подписаться

Опубликовано: четверг, 11 сентября 2025 г.

GEPA вместо RL: рефлексивная эволюция промптов

Автор

Имя
Новости нашего ИТ
Telegram
telegram

Новости нашего ИТ

13 подписчиков

5145 постов

Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

GEPA вместо RL: как рефлексивная эволюция промптов обгоняет обучение с подкреплением #java Большие языковые модели (LLM) всё чаще адаптируются к downstream-задачам с помощью методов RL, таких как Group Relative Policy Optimization (GRPO), которые нередко требуют тысячи прогонов для освоения новых задач. Мы утверждаем, что интерпретируемая природа языка может предоставлять LLM куда более богатую обучающую среду по сравнению с policy gradient’ами, основанными на разреженных скалярных наградах. Чтобы проверить эту гипотезу, мы представляем GEPA (Genetic-Pareto) — оптимизатор промптов, который системно использует natural language reflection для извлечения высокоуровневых правил из trial-and-error процесса. Для любой AI-системы, содержащей один или несколько промптов LLM, GEPA сэмплирует траектории на уровне системы (например, рассуждения, вызовы инструментов и их выводы) и анализиру

Обсудить в Telegram

Новости нашего ИТ

13 подписчиков

5145 постов

Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Предыдущий пост

Опубликовано: 11 сент. 2025 г.

OpenSDN vRouter Forwarder маршрутизация контейнеров

Как установить OpenSDN vRouter Forwarder и настроить простейшую маршрутизацию пакетов между контейнерами Docker

Следующий пост

Опубликовано: 11 сент. 2025 г.

Гексагональная (порты и адаптеры) архитектура Java

Гексагональная архитектура Java: порты и адаптеры, тесты без UI и БД

Из подборки #ai

Опубликовано: 1 февр. 2026 г.

+1

Регуляторные документы РФ по ИИ в 2026 году

регуляторные документы РФ безопасность ИИ 2026

Опубликовано: 30 янв. 2026 г.

+1

Куда и почему уходят бабки на нейросети

почему компании тратят деньги на нейросети и как это работает

Опубликовано: 30 янв. 2026 г.

+1

An Introduction to Using simple-openai in Java

Как использовать библиотеку simple-openai в Java для интеграции LLM

Опубликовано: 30 янв. 2026 г.

+1

Как AI убьет вашу базу: безопасность в 2026

как AI убьет базу данных безопасность 2026

Опубликовано: 29 янв. 2026 г.

+1

Как нейросеть может быть лучшим ассистентом?

как нейросеть стать лучшим ассистентом для работы и автоматизации

Опубликовано: 29 янв. 2026 г.

+1

Open-Source AI фитнес‑тренер: 27 MCP‑инструментов

Open-Source AI фитнес‑тренер: 27 MCP‑инструментов, 3 провайдера, граф упражнений, Docker PWA, код Claude Code

Все посты из подборки →

Свежие посты

Опубликовано: 1 февр. 2026 г.

+1

Model Context Protocol на Go: 100K ops/sec

Model Context Protocol на Go: 100K ops/sec, 10× быстрее Python SDK, multi‑tenancy, security

Опубликовано: 1 февр. 2026 г.

+1

Создать Telegram‑бот погоды за 5 минут Nyagram

Как создать Telegram‑бот погоды за 5 минут на Java с Nyagram и OpenWeatherMap

Опубликовано: 1 февр. 2026 г.

+1

Регуляторные документы РФ по ИИ в 2026 году

регуляторные документы РФ безопасность ИИ 2026

Опубликовано: 31 янв. 2026 г.

+1

Spring Shell 4.0.1 is out!

Spring Shell 4.0.1 выпуск

Опубликовано: 31 янв. 2026 г.

+1

CDC своими руками: Kafka + Debezium в лаборатории

CDC Kafka Debezium домашняя лаборатория PostgreSQL

Опубликовано: 31 янв. 2026 г.

+1

Kafka: обработка ошибок и Dead Letter Queues

Как обработать ошибки в Spring Kafka и использовать Dead Letter Queue

Опубликовано: 31 янв. 2026 г.

+1

Создание Ambilight приложения для Android на Java

Как создать приложение Ambilight для Android на Java

Опубликовано: 31 янв. 2026 г.

+1

Архитектура факторов ранжирования Ozon runtime

архитектура факторов ранжирования в runtime поиска Ozon

Следующие посты →