Eagle-X5: Обновление семейства MMLM от NVIDIA Research Projects.Eagle – это сем…

🌟 Eagle-X5: Обновление семейства MMLM от NVIDIA Research Projects. Eagle – это семейство MLLM высокого разрешения, построенное на LLaVA. В обновленном до версии X5 наборе представлено 3 модели: 🟢Eagle-X5-7B 🟢Eagle-X5-13B…

Zamba2-mini: компактная и производительная модель с гибридной архитектурой.Zamba…

🌟Zamba2-mini: компактная и производительная модель с гибридной архитектурой. Zamba2-mini – гибридная модель c 1.2B параметров, построенная из блоков state-space Mamba (SSM) и transformer. Модель создана на общей архитектуре Zamba, но…

Aurora: Набор фундаментальных моделей ML от Microsoft Research for Science для …

🌟 Aurora: Набор фундаментальных моделей ML от Microsoft Research for Science для прогнозирования атмосферных явлений. Архитектура базовой Aurora построена на 3D Swin Transformer. Модель обучалась более миллиона часов на корпусе…

ProLLM: бенчмарк на компетентность языковых моделей в программировании.Разработ…

🌟 ProLLM: бенчмарк на компетентность языковых моделей в программировании. Разработчик и автор корпоративного code со-pilot Toqan и FinBERT pfgecnbk запустил публичный Leaderbord бенчмарка ProLLM, в котором языковые модели открытого и…

Weekly Tutorials DigestТуториал: очистка и предварительная обработка текстовых …

🔥 Weekly Tutorials Digest 🔘Туториал: очистка и предварительная обработка текстовых данных в Pandas для задач NLP. В туториале приведены практические примеры операций по удалению пропущенных значений, нормализации текста, удалению шумов,…

Jamba 1.5: Семейство моделей на архитектуре SSM-Transformer с большим контекстн…

🌟 Jamba 1.5: Семейство моделей на архитектуре SSM-Transformer с большим контекстным окном. AI21 Labs опубликовала в открытом доступе семейство моделей Jamba 1.5. Модели позиционированы для использования в бизнесе для задач…

Только что вышла модель Jamba 1.5. Архитектура SSM-Transformer сочетает в себе …

🌟 Только что вышла модель Jamba 1.5. ✨ Архитектура SSM-Transformer сочетает в себе качество Transformer и эффективность Mamba, меньший объем занимаемой памяти, более легкую тонкую настройку в длинных контекстах. 🚀…

iMESA:  распределенный алгоритм совместной одновременной локализации и картогра…

🌟 iMESA:  распределенный алгоритм совместной одновременной локализации и картографирования (C-SLAM) для групп рoботов. iMESA расширяет алгоритм MESA, используя согласованный метод множителей с переменным направлением (C-ADMM) для пакетных задач C-SLAM. Он…