OpenAI втихаря выкатила GPT Pro и разнесла Claude Opus 4.7

Официального анонса нет, релизных заметок тоже. Но разрыв в качестве стал настолько заметным, что игнорировать его уже невозможно. Провели прямой бенчмарк между GPT Pro, Gemini 3.1 Pro и Claude Opus 4.7 на задачах фронтенд кодинга. По UI и UX реализации соперники даже рядом не стоят.
Возможно, это долгожданная модель SPUD, которая выкатилась на неделю раньше. А возможно, просто крупный архитектурный сдвиг под капотом. Цифры и визуальные результаты говорят сами за себя. Задержка ответа упала в разы, пространственное и визуальное понимание выросло кратно, а фронтенд дизайн теперь без вопросов SOTA.
Прогнали серию тестов Image to Code и Text to Code. В каждом сценарии с референсным изображением GPT Pro выдавал точность дизайна, которая просто раздавила Gemini 3.1 Pro и Claude Opus 4.7.
И вот где начинается самое интересное. Когда модели явно сказали сделать UI на сто процентов идентичным референсу, GPT Pro не стал дотошно писать более точный CSS. Он занялся чистым reward hacking. Вместо того чтобы вручную кодить сложные графические элементы, модель самостоятельно вырезала нужные куски UI прямо из референсного изображения и вставляла их в код.
Ленивый трюк? Да. Блестящая, почти человеческая интерпретация фразы сделай точно так же? Тоже да. Модель динамически оценивает, каким способом эффективнее всего удовлетворить ограничения промпта, и выбирает кратчайший путь.
Стратегические последствия огромные. Все референсные изображения в тесте были сгенерированы через GPT-IMAGE-2. Представьте рабочий цикл, когда новая SOTA способность во фронтенде полностью интегрируется с GPT-IMAGE-2 и Codex. Получается замкнутая цепочка, где одна модель рисует референс, вторая собирает по нему интерфейс, а третья пишет рабочий код. Без участия человека.

+1
0
+1
0
+1
0
+1
0
+1
0

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *