📌 Tencent выкатили HunyuanImage 3.0-Instruct- нативную мультимодальную модель, заточенную под
точное редактирование изображений.
И это уже не просто генератор картинок.
Это модель, которая
сначала понимает изображение, потом думает, и только потом рисует.
Архитектура серьёзная:
80B параметров MoE (13B активных) – баланс между мощностью и эффективностью.
Глубокое понимание + фотореалистичная генерация в одной системе.
🧠 Модель “с мышлением”
Она не просто выполняет команды.
Внутри используется нативный Chain-of-Thought и алгоритм MixGRPO – модель реально “прокручивает” инструкцию перед генерацией.
Это даёт:
– точное следование намерению пользователя
– согласованность с человеческими предпочтениями
– меньше странных артефактов и нелогичных решений
🎨 Точное редактирование и фьюжн изображений
Вот где начинается магия:
– добавление объектов
– удаление элементов
– изменение деталей
– при этом всё остальное остаётся нетронутым
Плюс продвинутый multi-image fusion – модель может брать элементы из нескольких изображений и собирать единую сцену так, будто она всегда так и выглядела.
🏆 SOTA по качеству
По качеству и точности выполнения инструкций модель выходит на уровень ведущих закрытых решений.
Tencent явно нацелены не просто на демку, а на создание экосистемы вокруг foundation-модели для image generation.
💻 Попробовать можно тут:
https://hunyuan.tencent.com/chat/HunyuanDefault?from=modelSquare&modelId=Hunyuan-Image-3.0-Instruct
View Source
Просмотры: 27