- Опубликовано
Как мы собираем SWE-bench на других языках
- Автор
- Имя
- Новости нашего ИТ
- Telegram
- Новости нашего ИТ14 подписчиков5145 постовДанный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news
Как мы собираем SWE-bench на других языках
#java
Современная разработка ПО — это плавильный котел языков: Java, C#, JS/TS, Go, Kotlin… список можно продолжать. Но когда дело доходит до оценки ИИ-агентов, способных помогать в написании и исправлении кода, мы часто упираемся в ограничения. Популярный бенчмарк SWE-bench, например, долгое время поддерживал только Python. Чтобы преодолеть разрыв между реальностью разработки и возможностями оценки ИИ, наша команда в Doubletapp взялась за адаптацию SWE-bench для множества языков программирования. Меня зовут Кирилл Увенс, и в этой статье я расскажу, как мы подходим к этой задаче и почему считаем ее важной для всей индустрии. В статье расскажем: • Что такое SWE-Bench • Какие сложности возникают при сборе данных и тестировании • Наш опыт: какие языки поддерживает SWE-bench • Ручная перепроверка, и
Предыдущий пост
- Опубликовано
Сложности разработки OLAP-базы данных
Следующий пост
- Опубликовано
This Week in Spring - April 15th, 2025
Из подборки #ai
- Опубликовано
Регуляторные документы РФ по ИИ в 2026 году
- Опубликовано
Куда и почему уходят бабки на нейросети
- Опубликовано
An Introduction to Using simple-openai in Java
- Опубликовано
Как AI убьет вашу базу: безопасность в 2026
- Опубликовано
Как нейросеть может быть лучшим ассистентом?
- Опубликовано
Open-Source AI фитнес‑тренер: 27 MCP‑инструментов
Свежие посты
- Опубликовано
Model Context Protocol на Go: 100K ops/sec
- Опубликовано
Создать Telegram‑бот погоды за 5 минут Nyagram
- Опубликовано
Регуляторные документы РФ по ИИ в 2026 году
- Опубликовано
Spring Shell 4.0.1 is out!
- Опубликовано
CDC своими руками: Kafka + Debezium в лаборатории
- Опубликовано
Kafka: обработка ошибок и Dead Letter Queues
- Опубликовано
Создание Ambilight приложения для Android на Java
- Опубликовано