Источник: Hugging Face
Краткая выжимка по источнику Hugging Face: JetBrains анонсировала Mellum2 - модель класса Mixture-of-Experts с заявленным размером 12B параметров. Публикация описывает запуск новой модели и показывает, что JetBrains продолжает развивать собственные ИИ-технологии, потенциально ориентированные на разработчиков и инструменты для работы с кодом.
Ключевые моменты
- JetBrains представила Mellum2, новую 12B модель с архитектурой Mixture-of-Experts.
- Анонс опубликован на Hugging Face, что делает релиз заметным для сообщества разработчиков ИИ.
- MoE-подход важен тем, что позволяет строить модели с более гибким распределением вычислений между экспертами.
Почему это важно
Релиз показывает усиление конкуренции в сегменте специализированных моделей для разработчиков и инструментов программирования.
Почему это важно
Релиз показывает усиление конкуренции в сегменте специализированных моделей для разработчиков и инструментов программирования.