Инструменты искусственного интеллекта отлично помогают в клиентском сервисе — ускоряют ответы, работают круглосуточно и обрабатывают тысячи запросов. Но дьявол кроется в деталях: нужно иметь в виду, что привычные показатели, вроде среднего времени обработки запросов, вводят в заблуждение, особенно когда в дело вступает искусственный интеллект. Они маскируют настоящие проблемы: задачи остаются нерешёнными, ответы неточны, а цели клиентов недостигнутыми.
Почему «успешный» AHT не гарантирует качества
В большинстве проектов задача по внедрению ИИ формулируется так: необходимо снизить нагрузку на первую линию и сократить расходы контакт‑центра без ухудшения качества сервиса.
Для оценки эффекта от автоматизации традиционно используют привычные метрики:
- AHT (average handling time) — среднее время обработки обращения;
- % эскалаций — доля передач на вторую линию или живому оператору;
- % автоматизации — доля обращений, обработанных системой.
Изначально они разработаны для оценки работы оператора, например: в стандартных случаях AHT показывает, как быстро человек решил задачу ту или иную задачу клиента. Но когда аналогичную задачу решает робот или агент — есть подвох. Звонок может закончиться быстрее: но точно ли потому, что клиент получил решение проблемы?
Недавний разбор команды Coval показал показательный пример: при «зелёном» дашборде 6 из 10 разговоров по факту оказались провальными — пользователи получали неточную или противоречивую информацию. Формально диалог был завершён, но задача клиента — не решена.
И если компания строит стратегию масштабирования ИИ, опираясь только на AHT и процент эскалаций, она рискует оптимизировать не то, что действительно важно.
Главный источник проблемы: перенос человеческих метрик успеха на ИИ
Контакт‑центр десятилетиями жил в парадигме управления людьми. Отсюда логика измерений:
- сколько длится разговор;
- передали ли оператору;
- сколько звонков обработано;
- сколько стоил контакт.
Для человека эта модель логична: оператор ограничен временем на линии, нормами нагрузки и стоимостью рабочего часа. Чем быстрее он закрывает обращение, тем ниже себестоимость контакта.
ИИ‑агент работает иначе:
- говорит устно и письменно;
- работает 24/7;
- параллельно обрабатывает тысячи диалогов;
- не устаёт.
Поэтому метрики скорости и «удержания на линии» перестают быть показателями качества. Более того, иногда они маскируют проблему.
Снижение AHT может означать:
- более точные ответы;
- или преждевременное завершение диалога.
Высокий containment rate может означать:
- грамотную автоматизацию;
- или то, что клиент просто не понял, как попасть к оператору.
Containment rate — это доля обращений, завершённых без передачи оператору, и её часто используют как показатель автономности ИИ.
Но без контекста CJM эта метрика может вводить в заблуждение. Перевод на оператора не всегда означает провал — в сложных или чувствительных сценариях это корректная маршрутизация.
Поэтому важно оценивать не сам факт эскалации, а была ли она обоснованной и решена ли задача клиента в итоге.В отчётах это выглядит как рост эффективности, но в реальности, как перенос нагрузки в повторные обращения.
Какие метрики нужно применять с ИИ на самом деле
Если генеративный ИИ становится частью инфраструктуры клиентского сервиса, его нужно оценивать как автономную систему принятия решений, работающую в рамках бизнес‑правил, регламентов и требований, с учётом обратной связи от клиентов.
Именно степень корректной автономности, а не просто скорость ответа, определяет реальную эффективность системы.
Это означает переход от абстрактных формулировок к измеряемым показателям, которые можно проверить.

Вот примеры метрик результата и способы их фиксации:
Доля фактически решённых обращений (Task Resolution Rate).
Что измеряем: процент диалогов, в которых задача клиента действительно закрыта.
Как измеряем:
- сопоставление завершённого диалога с событием в CRM (создано обращение, оформлено продление, отправлена карточка статуса);
- отсутствие повторного обращения по той же теме в течение X дней;
- выборочный аудит диалогов с ручной разметкой «решено / не решено».
Важно отличать «диалог завершён» от «задача решена».
Точность предоставленной информации (Answer Accuracy).
Что измеряем: процент ответов, содержащих корректные данные.
Как измеряем:
- автоматическая проверка ответов на соответствие данным в CRM / базе знаний;
- выборочный аудит диалогов (например, 3–5 % потока);
- фиксация случаев корректировки информации оператором после эскалации.
Эта метрика особенно критична для страхования, финтеха и любых регламентированных отраслей.
Обоснованность эскалации (Valid Escalation Rate).
Что измеряем: долю передач оператору, которые действительно требовали участия человека.
Как измеряем:
- классификация эскалаций по типам (сложный кейс / техническая ошибка / некорректный сценарий);
- анализ «возвратов» после передачи (если оператор повторяет тот же ответ — эскалация была избыточной);
- выборочная оценка диалогов перед переводом.
Важно рассматривать эту метрику в связке с containment rate и долей автоматизации: высокий containment без анализа обоснованности эскалаций может скрывать недомаршрутизацию, а низкий — наоборот, избыточные передачи.
Только баланс автономности и корректной передачи на оператора показывает реальное качество маршрутизации, а не просто уровень автоматизации.
Индикаторы фрустрации (Friction Signals).
Что измеряем: сигналы раздражения, снижения доверия и потери вовлеченности в диалоге.
Как измеряем:
- повтор одного и того же вопроса;
- рост длительности без продвижения к решению;
- резкий запрос оператора;
- анализ тональности речи (для голосовых каналов);
- повторное обращение в короткий срок.
Это ранний индикатор скрытых провалов, которые не отражаются в AHT, но напрямую влияют на CSI, контактность и NPS.
Достижение целевого действия (Goal Completion).
Что измеряем: фактическое выполнение целевого действия, ради которого клиент обратился.
Как измеряем:
- оформление продления полиса;
- регистрация обращения;
- подтверждённая запись;
- отправка корректного пакета документов;
- успешная транзакция.
В отличие от Task Resolution, где задача может считаться решённой на уровне диалога, Goal Completion фиксируется через событие в бизнес‑системе и отражает реальный бизнес‑результат.
Каждая метрика результата должна быть связана с проверяемым источником данных: CRM‑событие, лог диалога, повторное обращение, ручной аудит или аналитика базы знаний.
Если способ проверки не определён, метрика остаётся декларацией.
И именно эти показатели позволяют понять, усиливает ли решение на базе ИИ клиентский сервис — или просто сокращает длительность звонков.
Типовые управленческие ошибки при внедрении ИИ в клиентский сервис
Часто компании, внедряя ИИ в клиентский сервис, сталкиваются с неожиданными провалами, даже если на старте всё кажется гладким. Проблемы возникают не из‑за самой технологии, а из‑за типичных ошибок в подходе. Давайте разберём основные ловушки: от завышенных ожиданий мгновенной автоматизации до слабого мониторинга и отсутствия интеграций.
Ожидание мгновенной «идеальной» автоматизации. Без калибровки на реальных звонках точность всегда ниже ожиданий. Внедрение должно быть поэтапным — с проработкой отдельных этапов CJM и оценкой влияния на ключевые метрики. Иначе автоматизация масштабируется быстрее, чем подтверждается её качество.
Отсутствие интеграции с внутренними системами. Без доступа к актуальным данным ИИ не может обеспечивать корректность ответов.
Управление результатами по одной метрике. Снижение AHT или рост FCR не гарантируют качества. Отсутствие повторного обращения не равно решённой проблеме — без проверки точности и результата это может быть лишь иллюзией эффективности.
Отсутствие системного мониторинга в первые недели. В кейсах с масштабом 90 000 минут в месяц даже небольшая ошибка быстро становится системной.

Как избежать основных управленческих ошибок
Чтобы успешно внедрить ИИ‑агентов в клиентский сервис и избежать типичных провалов, нужны чёткие правила масштабирования и контроля. Предлагаем 4 шага корректного построения метрик — с фокусом на реальные результаты, а не иллюзорные цифры.
1‑й шаг: Стройте систему метрик, а не одну цифру. Разделите показатели на три уровня:
- операционные — нагрузка, длительность, объём;
- качественные — точность ответа, корректность маршрутизации;
- результативные — достижение цели клиента, выполнение действия в системе.
Только связка этих уровней даёт реальную картину эффективности.
2‑й шаг: Масштабируйте поэтапно. Выводите агента в промышленную эксплуатацию постепенно: 10 % → 30 % → 50 % → 100 % потока.
На каждом этапе оценивайте влияние на ключевые показатели CJM, а не только рост доли автоматизации.
3‑й шаг: Контролируйте скрытые риски. Отслеживайте:
- повторные обращения по одной теме;
- причины эскалаций (обоснованные, технические, вызванные фрустрацией);
- динамику точности и достижения цели.
Закладывайте 1–1,5 месяца на ежедневную калибровку. По нашим данным, именно первые недели формируют до 70 % итогового качества автоматизации.
4‑й шаг: Главное отличие: агент ≠ сценарный робот. Этот подход применим к автономному агенту.
Сценарный робот оценивается по выполнению скрипта. Автономный агент — по результату принятого решения. В этом его ключевое преимущество и сила с точки зрения реальной автоматизации сервиса.
Именно поэтому нужна комплексная система показателей — интегральный agent success score, отражающий:
- уровень автономности;
- корректность решений;
- бизнес‑эффект.
Когда компания начинает измерять не «процент автоматизации», а реальный результат, кейсы перестают быть витриной технологии и становятся инструментом управляемости сервиса.
В обозримом горизонте нескольких лет кейсы будут оцениваться не по «проценту автоматизации», а по:
- устойчивости сервиса при росте нагрузки;
- снижению операционных рисков;
- точности ответов;
- влиянию на повторные обращения;
- влиянию на фактическое решение задач клиентов.
AHT останется вспомогательной метрикой. Но он перестанет быть главным аргументом.
Потому что главный вопрос уже не «сколько длился звонок», а «получил ли клиент правильный результат».
И именно через эту призму стоит пересобирать не только аналитику, но и сам формат кейсов, чтобы они отражали бизнес‑эффект, а не только улучшение операционных показателей.

Бесплатная рассылка: как использовать ИИ в бизнесе
Узнайте, как писать эффективные промпты, создавать ИИ‑агентов для решения бизнес‑задач, и проходите мини‑практикумы в популярных сервисах. Всего — семь писем, которые помогут разобраться, как работать с нейросетями

Чему мы научились на собственной практике
На примере кейсов из реальной жизни мы хотим показать, как можно измерять результативность ИИ в клиентском сервисе выходя за рамки простых цифр вроде времени ответа. Компании из примеров автоматизировали тысячи звонков, но фокусировались не на доле автоматизации, а на реальных результатах: решённых задачах, снижении фрустрации и целях клиентов. Давайте разберём полученный нами опыт — от роста закрытых обращений до круглосуточной устойчивости без лишних операторов.
Пример страховой компании: рост автоматизации — это не только доля обработанных звонков. Одна из ведущих страховых компаний обрабатывает около 90 000 звонков в месяц. Изначальная задача была типовой: снизить нагрузку на операторов и автоматизировать первую линию.
Какие метрики дополнительно отслеживались:
Доля фактически решённых обращений (Task Resolution Rate). Этот показатель измерялся через параметры отсутствия повторного обращения по той же теме в течение контрольного периода, а также за счет сопоставления диалога с действием в системе (создание обращения, отправка карточки, регистрация случая). Позитивный эффект автоматизации сопровождался ростом именно фактически закрытых задач, а не просто завершённых диалогов.
Обоснованность эскалаций. Часть обращений передавалась оператору. Важно было понять, оправдана ли передача. Это позволило сократить избыточные эскалации и не перегружать операторов искусственно.
Индикаторы фрустрации. На старте до 60% клиентов отказывались от диалога с агентом. После корректировки формулировок показатель снизился до 30 %. Если бы ориентировались только на AHT и процент автоматизации, этот риск остался бы незаметным. Но именно снижение фрустрации стало фактором устойчивого роста автоматизации.
Формально:
- AHT мог оставаться стабильным;
- доля автоматизации росла.
По сути:
- росла доля фактически решённых задач;
- снижались повторные обращения;
- улучшалась корректность маршрутизации.
При росте доли обращений через агента с 5 % до 100 % в потоке, доля фактически закрытых задач увеличивалась пропорционально, без роста повторных обращений.
Пример финансового маркетплейса: работа 24/7 как фактор устойчивости. Контакт‑центр получал около 5000 звонков в месяц. Задача — обеспечить поддержку 24/7 без расширения штата. Классические показатели в таком случае 55 % обращений агент закрывает полностью, а 75 % клиентов продолжают диалог без запроса оператора. Но если смотреть через метрики результата, то классические показатели не отражают реальной картины.
Дополнительно измеряемые параметры:
Goal Completion. Закрытием обращения считались случаи, когда по итогам взаимодействия с клиентом была оформлена консультация, переданы корректные данные или создано обращение по факту мошенничества.
Повторные обращения по ночным кейсам. Анализировали два ключевых параметра: долю клиентов, которые после ночного обращения перезванивают днём, и то, были ли их задачи решены уже при первом контакте.
Отдельная эскалация VIP‑клиентов. Для сегментов по значимости настраивалась особая маршрутизация, где измерялось, были ли передачи оператору обоснованными или вызваны недоработкой сценария.
Управленческий эффект автоматизации заключается в том, что ночью ИИ‑агент берёт на себя большую часть потока, за счёт чего нагрузка распределяется равномернее, снижается зависимость от смен и текучести персонала и уменьшается риск провалов доступности. И это уже не оптимизация AHT, а снижение операционного риска и повышение устойчивости сервиса.
Инструменты ИИ уже доказали эффективность в клиентском сервисе, но успех проекта внедрения в немалой степени зависит от правильной его оценки. Переходите от единственной метрики вроде времени обработки запроса к системе из трёх уровней: операционные (объём, длительность), качественные (точность ответов, правильность маршрутизации) и результативные (достижение целей клиента, действия в системах).


















