технологии

Mistral представила Small 3: компактная ИИ-модель с высокой производительностью

Новая модель Mistral Small 3 обещает высокую производительность и компактность для различных ИИ-задач.

1 февр. 2025 г. — 2 min read

Mistral представила Small 3: компактная ИИ-модель с высокой производительностью

Европейский ИИ-стартап Mistral AI презентовал новую языковую модель, которая, по заявлению компании, соответствует производительности моделей втрое большего размера при значительно меньших вычислительных затратах. Mistral Small 3 имеет 24 миллиарда параметров и достигает 81% точности в стандартных тестах, обрабатывая 150 токенов в секунду. Модель выпущена под лицензией Apache 2.0, что позволяет бизнесу свободно модифицировать и развёртывать её.

Характеристики Mistral Small 3

Mistral Small 3 позиционируется как одна из самых эффективных моделей в своей категории. Она имеет 24 миллиарда параметров и демонстрирует высокую производительность, сопоставимую с моделями в три раза большего размера. По словам Гийома Лампля, научного директора Mistral, модель фактически не уступает Meta’s Llama 3.3 70B, выпущенной пару месяцев назад, которая в три раза больше.

Высокая производительность и низкие вычислительные затраты

Mistral Small 3 достигает 81% точности в тесте MMLU, обрабатывая 150 токенов в секунду. Это делает её одной из самых эффективных моделей в своей категории. Модель оптимизирована для минимальной задержки и локального развёртывания, что делает её практичной для использования в реальных условиях. Представьте себе: высокая точность и скорость обработки данных при минимальных затратах!

Оптимизация обучения

Mistral достигла улучшений в основном через оптимизацию обучения, а не наращивание вычислительной мощности. Модель обучена на 8 триллионах токенов (против 15 у конкурентов) и может работать на одном GPU, обрабатывая 80-90% типичных бизнес-задач. Это особенно важно для предприятий, требующих локального развёртывания по соображениям конфиденциальности и надёжности, включая финансовые услуги, здравоохранение и производство. Впечатляет, не правда ли?

Применение и возможности

Mistral Small 3 особенно интересна для предприятий, требующих локального развёртывания по соображениям конфиденциальности и надёжности. Она может быть использована в различных сферах, от медицины до робототехники, что открывает широкие возможности для её применения. Например:

Финансовые услуги: Выявление попыток мошенничества.
Здравоохранение: Направление пациентов к нужным специалистам.
Производство и робототехника: Функции управления и контроля.
Виртуальное обслуживание клиентов: Анализ настроений и отзывов.

Модель может быть запущена на системе с одной видеокартой Nvidia GeForce RTX 4090 или на актуальном Apple MacBook с 32 Гбайт оперативной памяти.

Доступность и лицензия

Mistral Small 3 доступна на платформе Hugging Face и нескольких других платформах. Компания утверждает, что их новая модель показывает лучшие результаты, чем GPT-4o mini от OpenAI, согласно внутренним тестам. Модель оптимизирована для минимальной задержки и выпускается с предобученной и настроенной на выполнение инструкций точками контроля, что позволяет использовать её для широкого спектра задач. Модель доступна по лицензии Apache 2.0, что позволяет её использование как в академических, так и в коммерческих целях.

Как вы думаете, сможет ли Mistral Small 3 стать новым стандартом для компактных ИИ-моделей, сочетая высокую производительность и низкие вычислительные затраты? Возможно, именно такие решения помогут снизить затраты на разработку ИИ и сделать эти технологии более доступными для широкого круга пользователей.

Для меня это важно, потому что я верю, что доступные и эффективные ИИ-модели могут значительно улучшить множество процессов в различных сферах, от финансовых услуг до здравоохранения и производства. В конечном счете, это может привести к более эффективному и безопасному использованию искусственного интеллекта в повседневной жизни.