Источник: huggingface.co Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

Источник: Hugging Face

Краткая выжимка по источнику Hugging Face: JetBrains анонсировала Mellum2 - модель класса Mixture-of-Experts с заявленным размером 12B параметров. Публикация описывает запуск новой модели и показывает, что JetBrains продолжает развивать собственные ИИ-технологии, потенциально ориентированные на разработчиков и инструменты для работы с кодом.

Ключевые моменты

  • JetBrains представила Mellum2, новую 12B модель с архитектурой Mixture-of-Experts.
  • Анонс опубликован на Hugging Face, что делает релиз заметным для сообщества разработчиков ИИ.
  • MoE-подход важен тем, что позволяет строить модели с более гибким распределением вычислений между экспертами.

Почему это важно

Релиз показывает усиление конкуренции в сегменте специализированных моделей для разработчиков и инструментов программирования.

Читать источник

Почему это важно

Релиз показывает усиление конкуренции в сегменте специализированных моделей для разработчиков и инструментов программирования.