🌟 ToolOrchestra: буст ИИ-потенциала за счет координации моделей и инструментов.
NVIDIA совместно с Университетом Гонконга разработала ToolOrchestra – методику обучения дирижеров для ИИ-агентов, и выпустила на ее основе модель Orchestrator-8B.
Это модель, базирующаяся на архитектуре Qwen3 предназначена для оркестрации других моделей и инструментов. Вместо того чтобы решать задачу в одиночку, модель чередует этапы рассуждения с вызовом внешних инструментов.
В ее арсенале поисковые движки, интерпретаторы кода и другие LLM, от узкоспециализированных математических до универсальных гигантов Claude и Llama-Nemotron.
Обучение проводилось с помощью GRPO, который поощрял модель не только за точность, но и за экономическую эффективность.
В результате решение получилось в 2,5 раза быстрее и на 70% дешевле в эксплуатации, чем использование одной лишь флагманской модели для всех этапов задачи, а сама Orchestrator-8B набрала 37,1% в сложнейшем бенчмарке Humanity’s Last Exam , обойдя GPT-5 (35,1%).
📌Лицензирование кода : Apache 2.0 License.
📌Лицензирование модели: NVIDIA License.
🟡Страница проекта
🟡Модель
🟡Arxiv
🟡Датасет
🖥GitHub
@ai_machinelearning_big_data
#AI #ML #LLM #Orchestrator #NVIDIA
View Source
Просмотры: 106