Beyond-NanoGPT: лаконичные и аннотированные реализации ключевых идей глубокого о…

📌Beyond-NanoGPT: лаконичные и аннотированные реализации ключевых идей глубокого обучения. Если вы хотите не просто запускать готовые модели, а понять, как они работают «под капотом», репозиторий Beyond-NanoGPT — то, что нужно.…

Релиз Qwen 3 от AlibabaВ релиз вошли 2 MoE-модели и 6 Dense models (плотные мод…

🔥 Релиз Qwen 3 от Alibaba В релиз вошли 2 MoE-модели и 6 Dense models (плотные модели), размером от 0.6B до 235B параметров. 🏆 Флагманская модель Qwen3-235B-A22B демонстрирует конкурентные результаты…

Kimi-Audio: открытая модель для аудиозадач.Kimi-Audio — инструктивная модель с…

🌟 Kimi-Audio: открытая модель для аудиозадач. Kimi-Audio — инструктивная модель с 7 млрд. параметров, разработанная командой MoonshotAI, которая объединяет распознавание речи, анализ аудиоконтента и генерацию ответов в реальном времени в…

Обучение с подкреплением: как языковые модели учатся рассуждать.Объемная и интер…

📌Обучение с подкреплением: как языковые модели учатся рассуждать. Объемная и интересная статья Sebastian Raschka, автора книги “Build a Large Language Model From Scratch” о тенденциях и проблемах современных методов обучения…

7 “бесполезных” функций Python, которые на самом деле полезныИнструменты из ста…

🐍 7 “бесполезных” функций Python, которые на самом деле полезны Инструменты из стандартной библиотеки, которые могут удивить: 1. textwrap.dedent() — удаляет отступы у многострочного текста. import textwraptext = textwrap.dedent(\”\”\” Привет!…

OpenAi представлют новые модели o-серии (o3 и o4-mini)OpenAI утверждает, что э…

🖥 OpenAi представлют новые модели o-серии (o3 и o4-mini) OpenAI утверждает, что эти модели способны генерировать новые и полезные идеи. Обе будут добавлены с сегодняшнего дня в ChatGPT и API.…

Python на скорости RustНовый Function (fxn) — фреймворк, который компилирует Py…

🖥 Python на скорости Rust Новый Function (fxn) — фреймворк, который компилирует Python-функции в нативный код с производительностью, сравнимой с Rust. 🧠 Как это работает?– Использует символическое трассирование на CPython…

VL-Rethinker — новую парадигму мультимодального вывода, обучаемую напрямую с по…

🥇 VL-Rethinker — новую парадигму мультимодального вывода, обучаемую напрямую с помощью Reinforcement Learning.🌟 Новая SOTA на ключевых бенчмарках по vision + math: 🟢 MathVista: 80.3 → 🥇 (+6.4 vs GPT-o1…

OpenAI опубликовала новое руководство по промптингу для GPT-4.1. Это полезный …

🖥 OpenAI опубликовала новое руководство по промптингу для GPT-4.1. Это полезный ресурс для улучшения работы с моделью. В руководство включен подробный “агентный промпт” (Agentic Prompt). Именно этот промпт OpenAI использовала…

Начиная с сегодняшнего дня, память в ChatGPT стала намного продвинуть — теперь …

🖥 Начиная с сегодняшнего дня, память в ChatGPT стала намного продвинуть — теперь она может учитывать все прошлые чаты, чтобы давать более персонализированные ответы. • Помнит все интересы и стиль…