Малы, да удалы: почему важны ИИ-модели, которые совсем не на слуху.

03.06.2026                                               Новости из мира ИИ давно выглядят как гонка количества нулей в отчетных цифрах: модели с триллионами параметров, приближающиеся к $1 трлн оценки ведущих ИИ-стартапов, многомиллиардные инвестиции, дата-центры размером с небольшой город и с гигаваттными потребностями в электроэнергии... На этом фоне тихо и не очень заметно происходит не менее важный фундаментальный процесс, рассуждает директор по стратегическому маркетингу «Яндекса» Андрей Себрант, — ИИ-модели учат помещаться к нам в карман Причем помещаться (и работать) отнюдь не в метафорическом смысле. Alibaba выпустила VLA Qwen 3.5, которая запускается локально на обычном смартфоне или старом ноутбуке — без подключения к серверам, без облака, без абонентской платы. Microsoft еще в прошлом году выкатила модель Phi-4 крошечного, по нынешним меркам, размера в 3,8 млрд параметров, которая обрабатывает документы объемом до 128 000 токенов и при этом превосходит по ряду тестов модели куда большего размера. Недавно опубликованный сравнительный анализ возможностей малых моделей всерьез впечатляет (а попутно демонстрирует, что популярные рейтинги моделей не очень годятся для оценки их пользы на реальных задачах). При этом рынок малых моделей как раз нельзя назвать малым. В прошлом году его объем составил $9,4 млрд, сильнее всего он развит в Азиатско-Тихоокеанском регионе, темпы его роста оцениваются очень оптимистично. Почему именно сейчас малые модели становятся так важны и популярны? Во-первых, квантование и дистилляция наконец-то заработали по-настоящему. На практике это значит, что большую модель можно «сжать» без критической потери качества, примерно как сжимают фотографию в формат JPEG так, чтобы она по-прежнему выглядела как хорошая четкая картинка, а не как пиксельная каша с артефактами. Еще пару лет назад потери качества в результате этих процедур были неприемлемы. Сейчас качество уже вполне годится для большинства практических задач. Во-вторых, в смартфоны и ноутбуки массово встраиваются NPU — нейросетевые процессоры, заточенные именно под инференс ИИ-моделей. Apple, Qualcomm, MediaTek делают это стандартом, а не премиум-опцией. В-третьих, появились открытые веса. Упомянутые Qwen, Gemma, Phi — это файлы, которые можно скачать, запустить, модифицировать. Никто извне не контролирует, что с ними происходит на устройстве.

Источник: https://www.forbes.ru/mneniya/562028-maly-da-udaly-pocemu-vazny-ii-modeli-kotorye-sovsem-ne-na-sluhu

Отправьте нам сообщение

Наш адрес

124365 МОСКВА, Г. ЗЕЛЕНОГРАД, УЛ. ЗАВОДСКАЯ, ДОМ 1Б, СТРОЕНИЕ 2

Наш телефон

+7 499-322-4526