- Опубликовано
Как мы собираем SWE-bench на других языках
- Автор

- Имя
- Новости нашего ИТ
- Telegram
Новости нашего ИТ12 подписчиков4804 постаДанный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
Как мы собираем SWE-bench на других языках
#java
Современная разработка ПО — это плавильный котел языков: Java, C#, JS/TS, Go, Kotlin… список можно продолжать. Но когда дело доходит до оценки ИИ-агентов, способных помогать в написании и исправлении кода, мы часто упираемся в ограничения. Популярный бенчмарк SWE-bench, например, долгое время поддерживал только Python. Чтобы преодолеть разрыв между реальностью разработки и возможностями оценки ИИ, наша команда в Doubletapp взялась за адаптацию SWE-bench для множества языков программирования. Меня зовут Кирилл Увенс, и в этой статье я расскажу, как мы подходим к этой задаче и почему считаем ее важной для всей индустрии. В статье расскажем: • Что такое SWE-Bench • Какие сложности возникают при сборе данных и тестировании • Наш опыт: какие языки поддерживает SWE-bench • Ручная перепроверка, и
Предыдущий пост
- Опубликовано
Сложности разработки OLAP-базы данных
Следующий пост
- Опубликовано
This Week in Spring - April 15th, 2025
Из подборки #ai
- Опубликовано
Хакатон Норникеля: YOLO, 2 место
- Опубликовано
Spring AI Agentic Patterns Part 2 AskUserQuestion
- Опубликовано
Roo Code: как использовать DeepSeek для тестирования
- Опубликовано
Нейросети для задач: сравнение Кэмп и ChatGPT
- Опубликовано
Я год не пишу код вручную и не вернусь
- Опубликовано
ИИ-статьи: спасение автора или смерть интернета
Свежие посты
- Опубликовано
Удобная синхронизация настроек Kafka
- Опубликовано
Spring Data 2025.1.2 и 2025.0.8 released
- Опубликовано
How Ansible does the real work in hyperautomation
- Опубликовано
OpenMedata в облаке: DataGovernance обзор Collate 1
- Опубликовано
Python без Python: как запускать код где угодно
- Опубликовано
Хакатон Норникеля: YOLO, 2 место
- Опубликовано
Nginx с человеческим лицом: обзор Nginx Proxy Manager
- Опубликовано