Торговый эквайринг 0,99%Торговый эквайринг 0,99%Этот баннер поменяется, а условия останутся навсегда!Этот баннер поменяется, а условия останутся навсегда!Подробнее

РассылкиИдеи для бизнесаБизнес с нуляМаркетплейсыБухгалтерияЛайфстайлСправочникШаблоны документов
РассылкиИдеи для бизнесаБизнес с нуляМаркетплейсыБухгалтерияЛайфстайлСправочникШаблоны документов

Сегодня вокруг ИИ много шума: «новая модель побила все бенчмарки», «еще больше параметров», «еще дешевле токены». Но за этим шумом в работе Chaojun Xiao и коллег впервые аккуратно описан тренд, который напрямую касается предпринимателей: качество и экономичность моделей растут не хаотично, а по закону. Этот закон авторы называют densing law — законом уплотнения возможностей LLM.

Ниже — что это означает для бизнеса, но без формул и академических деталей.

Что такое «уплотнение возможностей» простыми словами

Классический подход к ИИ последние годы можно описать фразой: «Хотите лучше — делайте больше».

Больше параметров, больше данных, больше GPU — и модель действительно становится умнее. Это отражает так называемые скейлинговые законы: потери на тесте падают по степенному закону при росте размера модели и корпуса. Но есть обратная сторона — чудовищные затраты на обучение и инференс, сложность внедрения, зависимость от большого железа.

Авторы работы предлагают смотреть не только на «абсолютную силу» модели, а на ее эффективность: сколько полезной способности решать задачи приходится на один параметр. Это они называют плотностью возможностей (capability density).

Если совсем по‑человечески:

  • есть старый «эталонный» класс моделей;
  • мы знаем, как их качество растет при увеличении параметров и данных;
  • появляется новая модель — мы измеряем ее качество на стандартных задачах;
  • затем спрашиваем: «сколько параметров потребовалось бы старой школе моделей, чтобы достичь такого же качества?»;
  • это «виртуальное» число и есть эффективный размер, а отношение эффективного размера к реальному — плотность.

Если плотность больше 1, модель использует параметры лучше, чем эталон; если меньше 1 — хуже.

Дальше начинается самое интересное. Оказалось, что если брать не одну модель, а максимально эффективные открытые модели в каждый момент времени, то их плотность растет экспоненциально и удваивается примерно каждые 3,5 месяца. То есть через 3‑4 месяца можно добиться того же качества, используя модель примерно вдвое меньше и дешевле.

Авторы проверяли это на 51 открытой базовой модели и на нескольких независимых наборах задач (включая специально переписанные, чтобы исключить «утечку» в тренировочные данные) — картина сохраняется.

Аватар дайджеста

Бесплатная рассылка: как использовать ИИ в бизнесе

Узнайте, как писать эффективные промпты, создавать ИИ‑агентов для решения бизнес‑задач, и проходите мини‑практикумы в популярных сервисах. Всего — семь писем, которые помогут разобраться, как работать с нейросетями

Аватар дайджеста

Что это значит в деньгах и ресурсах

Для предпринимателя главный вывод здесь не о красоте графиков, а о динамике экономики.

Во‑первых, если плотность растет, а целевое качество одинаково, то необходимое число параметров падает экспоненциально. Авторы оценивают, что для того же уровня производительности размер моделей в среднем делится пополам каждые 3,5 месяца.

Во‑вторых, меньше параметров — это меньше вычислений на инференсе. А кроме чистой математики есть еще и прогресс инфраструктуры: оптимизация фреймворков, ускорение внимания, учет разреженности, лучшая работа с памятью и так далее. В результате авторы показывают, что минимальная цена за миллион токенов у лучших моделей падает еще быстрее.

Пример из статьи:

  • в декабре 2022 года GPT‑3.5 стоил около 20 долларов за 1 млн токенов;
  • к августу 2024 года модель уровня Gemini‑1.5‑Flash давала сопоставимое качество за 0,075 доллара;
  • общая разница — более чем в 260 раз.

В‑третьих, если сложить закон уплотнения с современным аналогом закона Мура (мощность чипов за ту же цену растет экспоненциально), получается еще более важная вещь: максимальный «эффективный» размер модели, которую вы можете запустить на фиксированном железе, растет очень быстро. Авторы оценивают, что при текущих темпах он может удваиваться примерно раз в три месяца.

Для бизнеса это значит, что ИИ все быстрее «спускается» с облака на обычные устройства. То, что вчера требовало мощного кластера, через несколько лет будет работать на обычном ноутбуке или даже смартфоне.

Почему «ставка на самый большой ИИ» больше не лучшая стратегия

До сих пор естественный рефлекс был такой: если уж внедрять ИИ, то брать самое большое и мощное, что есть на рынке. В логике densing law эта стратегия становится все менее рациональной.

Причина проста:

  • у каждой «модели‑флагмана» есть очень короткий период, когда она и самая качественная, и относительно экономичная;
  • через несколько месяцев появляются новые, более компактные модели, которые дают похожее качество, но с существенно меньшими затратами;
  • еще через несколько месяцев эта «компактная» модель превращается в нового динозавра на фоне еще более плотных решений.

Иными словами, гонка «кто купит самую большую модель» превращается в гонку «кто умеет работать с плотностью»:

  • кто лучше комбинирует большие и маленькие модели;
  • кто умеет выжимать максимум из open‑source‑решений;
  • кто строит архитектуру продукта так, чтобы легко менять модель под капотом, не переписывая все с нуля.

Внутри компании: как использовать уплотнение в операционке

Если отбросить технические термины, закон уплотнения говорит: каждые несколько месяцев вы можете решать те же задачи ИИ дешевле и на более легких моделях.

Практически это открывает три очевидных направления.

Документы, почта, внутренние коммуникации. Разбор договоров, писем, отчетов, протоколов, регламентов — один из самых прозрачных кейсов. Уже сегодня относительно скромные по размеру модели способны:

  • извлекать ключевые условия и риски из документов;
  • готовить краткие резюме и пояснения;
  • классифицировать обращения клиентов и предлагать варианты ответов.

С учетом densing law вы можете рассчитывать, что:

  • модель, которая сегодня требует облачного API, через 1‑2 года сможет работать на вашем собственном сервере или даже на edge‑устройствах, не покидая периметр компании;
  • стоимость такого анализа будет падать по мере уплотнения, и чем гибче выстроена архитектура, тем проще вам будет «пересаживаться» на более экономичные решения.

Аналитика и управленческие решения. Еще одна зона применения — интерпретация цифр: управленческая отчетность, финансы, продажи, операционные показатели. LLM не заменяет финансовый анализ, но может:

  • комментировать динамику показателей;
  • объяснять, почему просел тот или иной KPI;
  • генерировать текстовые комментарии к дашбордам и отчетам.

Закон уплотнения здесь работает как долгосрочный «дисконт» к будущим проектам: чем позже вы будете углублять автоматизацию аналитики, тем дешевле будет вычислительная основа, при том же уровне качества.

Обучение и поддержка сотрудников. Во многих отраслях есть огромный пласт внутренних знаний: инструкции, кейсы, ответы на частые вопросы. LLM позволяет сделать из этого живой справочник и тренажер.

С ростом плотности становится все реальнее сценарий, когда:

  • «умный помощник» по продукту или процедурам
  • работает прямо на рабочем месте сотрудника;
  • или встраивается в отраслевой софт как локальный модуль, а не как дорогой внешне вызываемый сервис.

Во внешних продуктах: новые окна возможностей. Закон уплотнения особенно интересен, если вы создаете B2B- или B2C‑продукты с ИИ внутри.

Во‑первых, появляются ниши, где раньше ИИ был слишком тяжелым и дорогим. Теперь можно думать о:

  • CRM, ERP, отраслевых платформах, где ИИ‑ассистент по документам, продажам, проектам становится частью базового функционала, а не премиальной опцией;
  • специализированных сервисах — для юристов, бухгалтеров, врачей, логистов — где «мозг» работает либо на умеренном облачном тарифе, либо локально.

Во‑вторых, вы можете строить ценовую политику с запасом на будущее. Если сегодня токены стоят условную «единицу», а тренд говорит, что через год их цена при сопоставимом качестве упадет многократно, это дает две опции:

  • сохранить цену и увеличить маржу;
  • или снизить цену и агрессивно расширить рынок, забирая долю у тех, кто привязан к менее гибкой архитектуре.

В‑третьих, можно думать о гибридных моделях: сегодня тяжелые части логики отдаются облаку, а по мере уплотнения вы переносите все больше функциональности «внутрь» продукта, уменьшая зависимость от внешних провайдеров.

Стратегия: как предпринимателю встроить densing law в план

Чтобы извлечь пользу из закона уплотнения, не нужно становиться исследователем ИИ. Достаточно встроить несколько принципов в свою стратегию.

Первый принцип — архитектурная гибкость. Интеграции с LLM лучше строить через свой слой абстракции, а не «зашивать» конкретный API в код продукта. Тогда замена модели — это замена конфигурации, а не переделка проекта.

Второй принцип — приоритет данных над «крутизной» модели. Плотность возможностей растет сама по себе, за счет прогресса индустрии. Значит, ваш уникальный вклад — это:

  • ваши собственные архивы переписки, примеры из практики и рабочие документы;
  • аккуратное удаление личных данных и удобная разметка этих материалов;
  • описанные по‑человечески сценарии работы и требования к тому, что вы хотите от ИИ.

Модели сменятся, а ваши данные и сценарии останутся ядром ценности.

Третий принцип — планирование во времени. Понимая, что вычислительная основа дешевеет и уплотняется, вы можете:

  • сейчас запускать пилоты и получать операционные выгоды;
  • а в среднесрочной перспективе — переносить часть логики на более дешевые и плотные модели, пересчитывая экономику проекта в свою пользу.

Четвертый принцип — отказ от «брака навсегда» с одним вендором. Чем больше вы завязаны на одну закрытую экосистему, тем хуже вы будете использовать эффект уплотнения. Важно оставлять себе возможность:

  • комбинировать облачные и open‑source‑модели;
  • выбирать модель под задачу: большая — для сложных кейсов, компактная — для массовых и дешевых операций.

Вместо вывода: закон уплотнения как новая реальность

Работа Xiao и коллег формализует то, что многие предприниматели уже чувствуют интуитивно: каждый квартал ИИ становится не только умнее, но и доступнее.

Скейлинговые законы объяснили, почему «больше параметров = лучше». Densing law добавляет вторую ось: с течением времени один параметр становится все ценнее.

Для бизнеса это означает не просто падение цен на токены, а смену логики:

  • уже недостаточно просто «подключить модный ИИ»;
  • нужно строить продукты и процессы так, чтобы использовать экспоненциальный рост плотности: уметь менять модели, дообучать их на своих данных, переносить нагрузку ближе к устройствам и пользователю.

Проще всего сформулировать это так:

Не нужно ждать «идеального ИИ через пять лет». Имеет смысл делать шаги уже сейчас — но закладывать в архитектуру то, что каждый год мозг вашего продукта можно будет выкинуть и заменить на более компактный, быстрый и дешевый, не ломая бизнес‑логику

Расчетный счет для бизнеса

Предложение от Т‑Банка

Расчетный счет для бизнеса
  • Бесплатное открытие, онлайн. Реквизиты — в день заявки
  • Первые два месяца — бесплатное обслуживание
  • Любые платежи ИП и юрлицам внутри банка — 0 ₽
Узнать больше

АО «ТБанк», лицензия №2673


Больше по теме
Новости

Подпишитесь на рассылки

Собираем самые полезные материалы, интересные мероприятия и важные новости в коротких письмах. Вы можете подписаться на одну из рассылок или на все сразу.

62K подписчиков

Дважды в неделю

Как вести бизнес в России

Важные новости, бизнес‑кейсы, разборы законов и практические советы для предпринимателей

15K подписчиков

Раз в неделю

Как зарабатывать на маркетплейсах

Новости торговых площадок, инструкции для селлеров и лайфхаки успешных продавцов

20K подписчиков

Раз в две недели

Мероприятия для бизнеса

Анонсы вебинаров, конференций и других событий для предпринимателей

3K подписчиков

Раз в две недели

Рассылка для бухгалтеров

Новости и советы, которые помогут упростить работу и больше зарабатывать