Новый релиз от Stepfun – Step-3.5-Flash.По сообщениям, модель обходит DeepSeek …

Новый релиз от Stepfun - Step-3.5-Flash.По сообщениям, модель обходит DeepSeek ...

🔥 Новый релиз от Stepfun – Step-3.5-Flash.

По сообщениям, модель обходит DeepSeek v3.2 на ряде бенчмарков, при этом она заметно компактнее по параметрам:

Step-3.5-Flash: 196B всего / 11B активных
DeepSeek v3.2: 671B всего / 37B активных

Почему это важно:
если при меньшем размере и меньшем числе активных параметров на токен модель держит или превосходит качество – это значит дешевле инференс, проще масштабирование и больше шансов увидеть такие модели в реальных продуктах.

Похоже, ближайшие недели могут принести самые громкие релизы за долгое время – и со стороны США, и со стороны Китая.

https://github.com/vllm-project/vllm/pull/33523

View Source

+1
0
+1
0
+1
0
+1
0
+1
0

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *