Новостной дайджест Mistral AI: обновление набора моделей по API и Pixtral в Le C…
Новостной дайджест ✔️ Mistral…
Новостной дайджест ✔️ Mistral…
🌟 multi1: Имитация GPT-o1-подобных цепочек рассуждений с локальными и онлайн LLM. multi1 — это экспериментальный проект, вдохновленный моделью o1 от OpenAI, который позволяет использовать различные языковые модели: локальные (через ollama) и…
⚡️ XVERSE-MoE-A36B: большая я…
Новостной дайджест ✔️ CEO Has…
🌟 LLaMA-Factory: локальный файнтюн моделей с WebUI. LLaMA-Factory – это фреймворк, который объединяет в себе набор методов манипуляций с моделями и инструментов для гибкой настройки через веб-интерфейс Gradio. Фреймворк состоит…
🌟 PuLID+FLUX: перенос внешности на генерации в FLUX . PuLID (Pure and Lightning ID Customization) – метод генерации на основе внешности для диффузных моделей с управлением текстовым промптом. Ключевое преимущество…
🌟 AutoRound: расширенный алгоритм квантования LLM от Intel. AutoRound – усовершенствованный алгоритм квантования для малоразрядных LLM, основанный на методе “SignRound” исследования “Optimize Weight Rounding via Signed Gradient Descent for the…
🌟 LongLLaVA: MMLM, оптимизированная для обработки большого количества изображений. LongLLaVA – мультимодальная модель, предназначена для разработки приложений, требующих понимания длинных видеороликов, изображений высокого разрешения и сложных мультимодальных сценариев. В модели…
🌟 Nyuntam: Многофункциональный Toolkit для LLM и VLM. Nyuntam – это набор инструментов для оптимизации, адаптации и ускорения моделей разной модальности в различных сферах применения. Nyuntam умеет обрезать (pruning), квантовать,…
Новостной дайджест ✔️ Salesfo…
⚡️ Arcee-Llama-3.1-SuperNova …
🌟 SCIAGENTS : Автоматизация научных изысканий с помощью мультиагентных графовых рассуждений. SciAgents – фреймворк, который самостоятельно генерирует и уточняет исследовательские гипотезы, разъясняя лежащие в их основе механизмы, принципы проектирования и…
🌟 VEnhancer: Генеративное улучшение синтезированного видео. VEnhancer – генеративная система апсемлинга пространственно-временных характеристик, которая улучшает результаты существующих методов преобразования текста в видео путем добавления большего количества деталей в пространственной области…
Новостной дайджест ✔️ 3.7 мил…
🌟 OLMoE: Открытые языковые модели на основе Mixture-of-Experts. OLMoE (Open Mixture-of-Experts Language Models) – это метод создания языковых моделей, использующий разреженно активированные смеси экспертов (Mixture-of-Experts, MoE). Следуя этому методу была…
🌟 OLMoE: Открытые языковые модели на основе Mixture-of-Experts. OLMoE (Open Mixture-of-Experts Language Models) – это метод создания языковых моделей, использующий разреженно активированные смеси экспертов (Mixture-of-Experts, MoE). Следуя этому методу была…
🌟 LLaVaOLMBitNet1B: первая тернарная мультимодальная LLM от IntelLabs. LLaVaOLMoBitnet1B – мультимодальная модель, способная принимать в качестве входных данных изображение + текст (запрос) и отдавать согласованные текстовые ответы на выходе. Архитектура…
Новостной дайджест ✔️ Groq за…
🌟 MAPF-GPT: Имитационное обучение для многоагентного поиска путей. MAPF-GPT – это метод решения задачи планирования движения агентов (MAPF) с помощью обучения с подкреплением. Он включает в себя четыре основных этапа:…
💻 Свежайщая Бесплатня книга “Introduction to Machine Learning” Внутри множество важных тем. – оптимизация с серьёзными математическими выкладками, – разборах метода главных компонент (PCA) с детальным анализом. Так же внутри…