Phi-4-mini-flash-reasoning —новая компактная модель от Microsoft с мощной мате…

🧠 Phi-4-mini-flash-reasoning —новая компактная модель от Microsoft с мощной математической логикойМодель Phi-4-mini-flash-reasoning — это часть семейства Phi‑4 от Microsoft. Она специально создана для глубокого математического мышления, при этом остаётся лёгкой,…

Hugging Face показал, как ускорить обучение мультимодальных моделей, устранив г…

🎯 Hugging Face показал, как ускорить обучение мультимодальных моделей, устранив главное узкое место — неэффективную загрузку данных. Они представили Multimodal Data Pipeline (MMDP) — мощный, но простой пайплайн, который решает…

SemDiD: Семантическое разнообразие ответов для LLM.Исследователи из из Гонконгск…

📌SemDiD: Семантическое разнообразие ответов для LLM. Исследователи из из Гонконгского университета и инженеры Alibaba научили LLM генерировать семантически разные ответы, заставляя их «думать» в ортогональных направлениях. Наверняка каждый, кто работает…

LLM Speedrunning Benchmark: ИИ-ассистенты пока не способны улучшить код, написа…

🌟 LLM Speedrunning Benchmark: ИИ-ассистенты пока не способны улучшить код, написанный человеком. Пока одни восхищаются способностью ИИ писать код по текстовому описанию, в компании Марка Цукерберга решили устроить ему настоящее…

FlexTok: адаптивная 1D-токенизация изображений от Apple.FlexTok – метод токениз…

🌟 FlexTok: адаптивная 1D-токенизация изображений от Apple. FlexTok – метод токенизации изображений, который преобразует 2D-изображения в упорядоченные 1D-последовательности переменной длины. Его цель – сократить объем данных, необходимых для обучения генеративных…

Apple выложила исходники FlexTok — нового токенизатора изображений с гибкой дли…

🍏 Apple выложила исходники FlexTok — нового токенизатора изображений с гибкой длиной FlexTok — это токенизатор, который представляет изображение как последовательность токенов переменной длины, от самых грубых до самых детализированных.…

State of Foundation Models 2025 — краткое изложение отчёта Innovation Endeavors…

📌 State of Foundation Models 2025 — краткое изложение отчёта Innovation Endeavors Венчурный фонд Innovation Endeavors, основанный бывшим CEO Google Эриком Шмидтом, выпустил 126-страничный обзор о состоянии и тенденциях фундаментальных…

Парадигма меняется: локальные модели выходят на новый уровеньPolaris — это набо…

🚀 Парадигма меняется: локальные модели выходят на новый уровень Polaris — это набор простых, но мощных приёмов, который позволяет даже компактным LLM (4 B, 7 B) догнать и превзойти «тяжеловесов»…

BREAKING: MIT опубликовал первое исследование мозга пользователей ChatGPTРезуль…

🧠 BREAKING: MIT опубликовал первое исследование мозга пользователей ChatGPT Результаты звучат тревожно: > 🧪 У пользователей наблюдаются измеримые изменения в мозге > 🤖 Формируется зависимость от ИИ > 📉 Способность…

MiniMax-M1: открытя reasoning‑LLM с контекстом 1MMiniMax-M1 — первая в мире open…

🌟MiniMax-M1: открытя reasoning‑LLM с контекстом 1M MiniMax-M1 — первая в мире open-weight гибридная reasoning‑LLM c 1M контекстом (8× DeepSeek R1) и гибридной архитектурой MoE + lightning attention.• 456 млрд параметров…

Спор о будущем: Дженсен Хуанг против Дарио АмодеиCEO Nvidia Дженсен Хуанг и гла…

🧠 Спор о будущем: Дженсен Хуанг против Дарио АмодеиCEO Nvidia Дженсен Хуанг и глава Anthropic Дарио Амодеи — по разные стороны баррикад, когда речь идёт о будущем рабочих мест в…

cuOpt от NVIDIA стал open source!Теперь можно легко ускорять задачи оптимизации…

🎉 cuOpt от NVIDIA стал open source! Теперь можно легко ускорять задачи оптимизации — 🔸 линейное программирование (LP) 🔸 целочисленные задачи (MIP) 🔸 маршрутизацию транспорта (VRP) — с помощью GPU,…