AutoRound: расширенный алгоритм квантования LLM от Intel.AutoRound – усовершенс…

🌟 AutoRound: расширенный алгоритм квантования LLM от Intel. AutoRound – усовершенствованный алгоритм квантования для малоразрядных LLM, основанный на методе “SignRound” исследования “Optimize Weight Rounding via Signed Gradient Descent for the…

LongLLaVA: MMLM, оптимизированная для обработки большого количества изображений…

🌟 LongLLaVA: MMLM, оптимизированная для обработки большого количества изображений. LongLLaVA – мультимодальная модель, предназначена для разработки приложений, требующих понимания длинных видеороликов, изображений высокого разрешения и сложных мультимодальных сценариев. В модели…

⚡️ OpenAI выпустили новую модель OpenAI o1, которая в разы мощнее GPT-4o.

⚡️ OpenAI выпустили новую модель OpenAI o1, которая в разы мощнее GPT-4o.

Модель o1 превосходит GPT-4o по различным показателям, включая соревновательное программирование, математические олимпиады и вопросы научного уровня PhD Главное отличие — перед тем как дать ответ, O1 думает и рассуждает через…

Nyuntam: Многофункциональный Toolkit для LLM и VLM.Nyuntam – это набор инструме…

🌟 Nyuntam: Многофункциональный Toolkit для LLM и VLM. Nyuntam – это набор инструментов для оптимизации, адаптации и ускорения моделей разной модальности в различных сферах применения. Nyuntam умеет обрезать (pruning), квантовать,…

OLMoE: Открытые языковые модели на основе Mixture-of-Experts.OLMoE (Open Mixtur…

🌟 OLMoE: Открытые языковые модели на основе Mixture-of-Experts. OLMoE (Open Mixture-of-Experts Language Models) – это метод создания языковых моделей, использующий разреженно активированные смеси экспертов (Mixture-of-Experts, MoE). Следуя этому методу была…

OLMoE: Открытые языковые модели на основе Mixture-of-Experts.OLMoE (Open Mixtur…

🌟 OLMoE: Открытые языковые модели на основе Mixture-of-Experts. OLMoE (Open Mixture-of-Experts Language Models) – это метод создания языковых моделей, использующий разреженно активированные смеси экспертов (Mixture-of-Experts, MoE). Следуя этому методу была…

Machine Learning:  Большой Медицинский дайджест  1.09-07.09 2024 г.

Machine Learning:  Большой Медицинский дайджест  1.09-07.09 2024 г.

В этом дайджесте за первую неделю сентября 2024 года мы собрали самые интересные и важные публикации. Пристегивайтесь, мы начинаем. Модели машинного обучения 🟩 CancerLLM: LLM для онкологии. CancerLLM – это…

LLaVaOLMBitNet1B: первая тернарная мультимодальная LLM от IntelLabs.LLaVaOLMoBi…

🌟 LLaVaOLMBitNet1B: первая тернарная мультимодальная LLM от IntelLabs. LLaVaOLMoBitnet1B – мультимодальная модель, способная принимать в качестве входных данных изображение + текст (запрос) и отдавать согласованные текстовые ответы на выходе. Архитектура…

TeleBot и aiogram: Руководство по созданию Telegram-бота на Python Урок 1

TeleBot и aiogram: Руководство по созданию Telegram-бота на Python Урок 1

В мире разработки Telegram-ботов на языке Python существуют две популярные библиотеки: telebot и aiogram. В этой статье мы рассмотрим, как создать Telegram-бота с использованием aiogram, подробно разберем код и рассмотрим…

MAPF-GPT: Имитационное обучение для многоагентного поиска путей.MAPF-GPT – это …

🌟 MAPF-GPT: Имитационное обучение для многоагентного поиска путей. MAPF-GPT – это метод решения задачи планирования движения агентов (MAPF) с помощью обучения с подкреплением. Он включает в себя четыре основных этапа:…

Свежайщая Бесплатня книга “Introduction to Machine Learning” Внутри множество в…

💻 Свежайщая Бесплатня книга “Introduction to Machine Learning” Внутри множество важных тем. – оптимизация с серьёзными математическими выкладками, – разборах метода главных компонент (PCA) с детальным анализом. Так же внутри…

Применение Few-Shot Learning в задачах сегментации изображений: Погружаемся в CoreML

Применение Few-Shot Learning в задачах сегментации изображений: Погружаемся в CoreML

Привет, коллеги! Сегодня мы затронем довольно узкую, но крайне интересную тему — Few-Shot Learning в контексте сегментации изображений. Это направление иногда остается в тени более популярных методов глубокого обучения, но…

Google DeepMind только что выпустили еще один крутой биотех инструмент с искусс…

😖 Google DeepMind только что выпустили еще один крутой биотех инструмент с искусственным интеллектом: AlphaProteoЭто AI для разработки новых белков. Он поможет в разработке лекарств, для лечения рака, аутоиммунных заболеваний,…

Telegram бот на JavaScript: Полное руководство Урок 1. ВВедение

Telegram бот на JavaScript: Полное руководство Урок 1. ВВедение

Telegram бот – это программа, автоматизирующая выполнение задач в мессенджере Telegram, может отвечать на сообщения пользователей и выполнять команды. Создание собственного бота может быть не только интересным занятием, но и…

Формат JSON в Javascript

Формат JSON в Javascript

JSON (JavaScript Object Notation) – это формат обмена данными, легкий для чтения и написания человеком, а также для парсинга и генерации машиной. JSON используется для передачи данных между сервером и…

ICRT : Внутриконтекстное обучение имитации действия с помощью предсказания след…

🌟 ICRT : Внутриконтекстное обучение имитации действия с помощью предсказания следующего токена. In-Context Robot Transformer (ICRT) – модель, которая позволяет роботу выполнять новые задачи, интерпретируя контекстную информацию, предоставленную во время…