OpenAI анонсировали новый chatgpt o3
Результаты тестов просто поражают! Новая версия модели показывает уровень программирования, сравнимый с опытом сеньор-разработчика, оставляя далеко позади конкурентов и программистов. 😱
Однако есть и плохие новости: пока что доступ к этой версии для широкой публики предоставлен не будет. Сегодня ограниченная мини-версия модели передана командам, занимающимся вопросами безопасности, для тестирования.
Когда же состоится публичный релиз, у многих разработчиков могут возникнуть опасения за своё будущее.
Команда Сэма Альтмана специально пропустила нейминг O2, чтобы избежать судебных разбирательств с брендом из Британии.
Представлены новые модели o3 и o3-mini (название o2 уже занято другими разработками):
— На данный момент эти модели доступны только для Public Safety Tests, поэтому учёные смогут участвовать в их тестировании, тогда как нам пока не предоставляется возможность проверять их на прочность.
— Модель o3 работает на уровне кандидата наук, а иногда даже превосходит его в различных тестовых испытаниях.
— O3 успешно прошла ARC-бенчмарк на 87,5%. Этот сложный тест используется для оценки потенциальных систем искусственного интеллекта общего назначения (AGI). В нём содержатся вопросы, напоминающие IQ-тесты или загадки. Средние результаты людей в этом тесте составляют около 85%, а предыдущий рекорд среди моделей составлял всего лишь около 50%. Таким образом, ARC-бенчмарк пройден на высоком уровне.
— Как и предыдущая модель o1, o3 поддерживает разные режимы работы: чем больше времени она тратит на размышления, тем качественнее получается ответ, однако при этом возрастает стоимость использования. Пользователи сами могут выбирать подходящий «думающий» пресет.
Планируется, что запуск o3-mini состоится в конце января, а следом за ней — и o3. Чем больше специалистов по безопасности примут участие в тестировании, тем скорее модели станут доступны для всех пользователей.
Это был последний день анонсов от OpenAI. Ждём полноценного релиза.