OpenAI представила модель GPT-5.1 с улучшенными возможностями программирования
Модель демонстрирует результат 76,3% на тесте исправления ошибок в репозиториях SWE-bench Verified и получает обновленный инструментарий для разработки в среде Codex.
Компания OpenAI выпустила модель GPT-5.1 в интерфейсе программирования и интегрировала ее в платформу Codex. Архитектура основана на GPT-5 с сохранением функции продолжительного анализа сложных задач, включая исследование репозиториев и создание исправлений.
На тестовых испытаниях модель показывает стабильное улучшение характеристик. В бенчмарке SWE-bench Verified, оценивающем исправление реальных ошибок в программных репозиториях, показатель достиг 76,3 процента против 72,8 процента у предыдущей версии. Результаты по другим тестам, включая MMMU, GPQA и Tau²-bench, также демонстрируют прогресс в решении специализированных задач.
Обновление инструментария Codex включает версии gpt-5.1-codex и gpt-5.1-codex-mini, оптимизированные для анализа программного кода и сценариев с агентными функциями. В интерфейс программирования добавлены инструменты apply_patch для генерации патчей в формате diff и shell для ограниченного доступа к командной строке.
Стоимость использования GPT-5.1 сохранена на уровне предыдущей версии: 1,25 доллара за миллион входящих токенов, 10 долларов за миллион исходящих токенов и 0,125 доллара за миллион кэшированных токенов. Время хранения промптов в кэше увеличено до 24 часов, что снижает затраты при работе с объемными проектами и код-агентами.