Голосовой бот для бизнеса: обзвон, приём звонков и запись клиентов
Разбираю на практике, как устроен голосовой бот, в каких сценариях он реально окупается, где буксует, сколько стоит и какие юридические нюансы придётся закрыть до запуска.
Когда мне говорят «поставьте нам голосового бота», я первым делом уточняю, о чём вообще речь. Потому что под одним словом люди понимают три совершенно разные вещи: умную колонку дома, IVR-меню в духе «нажмите 1 для отдела продаж» и нормального ИИ-собеседника, который ведёт живой диалог по телефону. В этой статье я говорю только про третье и только про бизнес. Никаких потребительских ассистентов, никаких колонок на кухне.
Я Эдвард Гришин, основатель Futura AI. До этого тринадцать лет проработал в Яндексе, Купере, Sunlight, Технопарке и BORK, управлял командами до 200 человек в компаниях с оборотами под 200 млрд рублей в год. Сейчас мы внедряем ИИ-продавцов и ИИ-агентов под ключ, и за плечами у меня больше тридцати внедрений. Так что пишу не по чужим пресс-релизам, а по тому, что вижу в реальных проектах. Где голос работает — скажу честно. Где он пока спотыкается — скажу тоже, мне нечего тут продавать поверх правды.
Что такое голосовой бот и чем он отличается от текстового
Голосовой бот для бизнеса — это программа, которая разговаривает с человеком по телефону голосом. Не текстом в чате, а именно вслух, в реальном времени. Звонит сама или принимает входящие, понимает речь, отвечает осмысленно, при необходимости что-то делает в вашей CRM.
Разница с текстовым чат-ботом не косметическая, и это важно понять сразу. В чате у пользователя есть время подумать, перечитать, поправить опечатку. Бот может отвечать с задержкой в секунду-две, и это нормально, никто не возмутится. В голосе всё иначе. Человек ждёт ответа здесь и сейчас. Пауза в три секунды по телефону тянется как вечность — собеседник начинает говорить «алло, вы тут?» или просто кладёт трубку. Поэтому голосовой ИИ-бот технически куда более тяжёлая задача, чем текстовый. Об этом ниже подробнее.
Есть и второе отличие, про которое часто забывают. В тексте легко показать варианты, кнопки, ссылку. В голосе ничего этого нет. Только речь, интонация и порядок, в котором бот задаёт вопросы. Плохо написанный сценарий в чате раздражает. Тот же сценарий в голосе бесит вдвойне, потому что от него нельзя отмотать назад глазами.
И сразу разведу понятия, которые путают почти все. Голосовой ИИ-робот в старом смысле — это автодозвон с записанным сообщением: «Здравствуйте, у нас акция, нажмите 1». Это не то, о чём я говорю. Современный голосовой помощник ИИ для звонков понимает свободную речь, отвечает на неожиданные вопросы и держит контекст разговора. Технологически между ними пропасть, хотя на словах звучит почти одинаково.
Два базовых сценария: входящие и исходящие
Всё многообразие задач сводится к двум режимам работы. Устроены они по-разному, окупаются по-разному, и провалить можно каждый по отдельности.
Приём входящих звонков с помощью ИИ
Сюда звонят клиенты. Бот снимает трубку, выясняет, что человеку нужно, и либо решает вопрос сам, либо передаёт оператору с уже собранным контекстом. Классика жанра: запись на услугу, ответ на типовой вопрос, оформление заявки, уточнение статуса заказа.
Сильная сторона входящих в том, что человек уже хочет с вами говорить. Он сам набрал номер. Терпимость к боту здесь выше, чем при холодном обзвоне: у клиента есть своя цель, и он готов потратить минуту, чтобы её достичь. По моему опыту, приём входящих звонков ИИ лучше всего закрывает проблему пропущенных вызовов. В салоне красоты или клинике звонок в нерабочее время, или в тот момент, когда администратор занят с посетителем, — это потерянный клиент. А бот не уходит на обед и не берёт больничный.
Голосовой бот для обзвона базы
Здесь инициатива у бизнеса. Бот сам звонит по списку: подтвердить визит, напомнить о записи, реактивировать старого клиента, провести опрос, дожать тёплый лид. Это голосовой бот для обзвона в чистом виде.
Исходящие тяжелее психологически. Вы вторгаетесь в чужой день. Человек не ждал звонка, и первые пять секунд решают всё — будет он слушать или бросит трубку. Поэтому к сценарию обзвона требования жёстче. Бот должен коротко представиться, назвать понятную причину звонка и быстро выйти на суть, без раскачки. И ещё здесь сильнее юридическая нагрузка — к ней я вернусь в конце.
Разница между двумя сценариями в одной таблице.
| Параметр | Входящие звонки | Исходящий обзвон |
|---|---|---|
| Кто инициирует | Клиент | Бизнес |
| Настрой собеседника | Заинтересован, сам позвонил | Не ждал звонка |
| Главная метрика | Доля решённых без оператора | Дозвон и конверсия в целевое действие |
| Терпимость к боту | Выше | Ниже, первые секунды критичны |
| Юридическая нагрузка | Согласие на запись разговора | Согласие на звонок и обработку данных |
| Типичные задачи | Запись, заявка, статус заказа | Подтверждение визита, реактивация, опрос |
Где голосовой бот реально окупается
Я видел много пилотов, которые красиво смотрелись на демо и тихо умирали через два месяца. И видел внедрения, которые приносили деньги уже на первой неделе. Разница почти всегда в одном — в выборе задачи. Голос окупается там, где разговор повторяющийся, короткий и с понятной целью. Всё остальное лотерея.
Запись на услуги
Самый честный кейс. У салона, клиники, автосервиса, фитнес-студии поток однотипных звонков «хочу записаться». Имя, услуга, удобное время, мастер. Бот собирает это за минуту и кладёт запись в систему. Здесь ИИ силён, потому что вариантов в диалоге мало, а цена ошибки невелика: если что-то пошло не так, человек просто переспросит.
В сети салонов красоты, с которой мы работали, после запуска количество записей выросло вдвое. И не потому, что бот лучше администратора уговаривает. А потому, что он не теряет звонки в часы пик и не забывает перезвонить. Медицинская клиника на похожем сценарии получила втрое больше записей. Эффект в обоих случаях дала не магия ИИ, а закрытая дыра в пропущенных обращениях. Звучит буднично, но так и есть.
Подтверждение визитов
Скучный, но прибыльный сценарий. Бот за день до визита обзванивает записавшихся и подтверждает. Кто не придёт — освобождает слот, и его можно отдать другому. В услугах с дорогим временем специалиста это прямые деньги. Сценарий короткий, предсказуемый, эмоций минимум. Голосу тут раздолье.
Реактивация базы
У большинства компаний лежит мёртвый груз контактов: люди, которые однажды что-то купили и пропали. Менеджеры до них не доходят, потому что обзвон холодной базы — самая нелюбимая работа на свете. А бот делает её без выгорания. Конверсия тут низкая по определению, но при нулевой альтернативе даже 3 процента отклика — это деньги из ничего. Главное не выдавать желаемое за действительное. Реактивация не превращает спящую базу в очередь покупателей. Она просто возвращает часть тех, кого иначе не вернули бы вовсе.
Первая линия фильтрации
Бот снимает первый контакт, отсеивает нецелевые обращения, квалифицирует лид и передаёт человеку только то, что стоит внимания живого менеджера. Тут голос работает как фильтр, экономящий дорогое время людей. В агентстве недвижимости, которому мы настраивали такую первую линию, количество квалифицированных контактов выросло в 3,3 раза. Менеджеры перестали тратить часы на пустые звонки и занялись теми, кто реально готов смотреть объекты.
Если вам интереснее именно про дожим и продажу по телефону, у нас есть смежный материал про голосовые ИИ-продавцы в телефонных продажах — там я разбираю, куда движутся телефонные продажи. Здесь же намеренно держусь практики: что работает, как устроено и сколько стоит.
Где голос пока буксует
Теперь та часть, которую в рекламе обычно прячут. Голосовой бот не универсален, и есть задачи, где я сам отговариваю клиентов его ставить. Да, иногда против собственной выручки.
Сложные эмоциональные диалоги. Когда человек звонит раздражённым, расстроенным, в конфликте, ему нужен не безупречный сценарий, а ощущение, что его слышат. Бот может имитировать сочувствие, но в по-настоящему напряжённой ситуации это считывается как фальшь и злит ещё сильнее. Разбор претензии, удержание уходящего клиента, тонкие переговоры о цене я отдаю людям. Не потому что технология не дотягивает по точности. А потому что эмпатия здесь — это не текст, а присутствие.
Длинные многоходовые консультации с кучей развилок. Если правильный ответ зависит от десятка условий и человек сам не до конца понимает, что ему нужно, бот начинает путаться или загонять собеседника в рельсы сценария. На бумаге дерево диалога выглядит красиво. В живом разговоре оно рассыпается.
Всё, что требует подлинного суждения и ответственности. Бот не должен принимать решения, за которые потом отвечать деньгами или репутацией: согласовывать скидку сверх правил, обещать сроки, давать юридически значимые гарантии. Это зона человека, и точка.
И отдельно про общий фон, чтобы вы не строили иллюзий. Сбер в январе 2026 года оценил, что ИИ в бизнес-процессах используют 39 процентов компаний в России. McKinsey в State of AI 2025 насчитал 88 процентов компаний в мире, применяющих ИИ хотя бы в одной функции. Цифры внушительные, но за ними прячется неприятная правда. Gartner прогнозирует, что больше 40 процентов агентных ИИ-проектов будут свёрнуты к 2027 году из-за раздутых ожиданий. RAND давно показывает, что около 80 процентов ИИ-проектов в принципе проваливаются. Я привожу это не чтобы напугать, а чтобы вы трезво смотрели на цифры. Голосовой бот — это инструмент с узкой зоной эффективности. Воткнуть его всюду — значит почти гарантированно попасть в те самые 40 процентов свёрнутых проектов.
Как это устроено технически
Чтобы понимать, за что вы платите и почему оно иногда «тормозит», полезно знать, из чего собран голосовой ИИ-бот. Под капотом три блока плюс связка телефонии. Разберу по очереди.
Первый блок, ASR, распознавание речи. Звук с линии превращается в текст. Тут свои засады: акцент, шум в фоне, кафе за спиной у звонящего, плохая связь в маршрутке. Качество ASR напрямую бьёт по всему остальному — если бот неправильно расслышал, он неправильно ответит, и никакой ум его уже не спасёт.
Второй блок, LLM, языковая модель. Это мозг. Она понимает, что человек имел в виду, держит контекст разговора и формирует ответ. От её настройки зависит, будет бот тупить или попадать в суть.
Третий блок, TTS, синтез речи. Текст ответа превращается обратно в голос. Современный TTS звучит почти как человек, но это «почти» иногда выдаёт робота на сложных словах, числах, именах.
А теперь главное слово в голосе. Латентность. Это суммарная задержка от момента, когда человек закончил говорить, до момента, когда бот начал отвечать. Звук надо распознать, прогнать через модель, синтезировать ответ и протолкнуть обратно через телефонную линию. Каждый шаг добавляет миллисекунды. Если в сумме набегает больше секунды-полутора, разговор ощущается неживым. Именно борьба за латентность отличает приличного голосового бота от поделки, которая раздражает паузами. И именно поэтому голос дороже в разработке, чем текстовый чат-бот: вы платите за инженерную работу по ужиманию задержки.
Отдельная боль — перебивания. Живой человек перебивает собеседника, это нормально. Хороший бот должен уметь замолчать, когда его перебили, и перестроиться на ходу. Плохой договаривает свою реплику в пустоту, пока человек уже задал новый вопрос. На демо мелочь. В реальном звонке провал.
Интеграции: без них бот — это игрушка
Голосовой бот, который красиво поговорил и ничего не записал, бесполезен. Вся ценность в том, что после разговора в системе что-то меняется: появилась запись, создалась заявка, обновился статус сделки. Без этого вы просто купили говорящую игрушку.
Поэтому мы первым делом смотрим, куда бот будет писать. На российском рынке это обычно amoCRM, Битрикс24 или 1С. Бот должен класть данные туда, где их видят менеджеры, а не в отдельную базу, которую никто не открывает. Нет интеграции — получаете разговорный аттракцион без бизнес-результата.
И ещё момент про каналы, важный. Телефон редко живёт в одиночку. Клиент звонит, потом пишет в WhatsApp, потом приходит на сайт. Мы строим так, чтобы голос был частью общей картины, а не изолированным островом. Каналы, которые мы обычно подключаем, — это сайт, Telegram, WhatsApp, ВКонтакте и Авито, и голосовая линия садится в тот же контур. Сам по себе ИИ-агент для голоса у нас живёт на странице голосовой ИИ-продавец, а как часть общей системы продаж он стыкуется с нашим ИИ-продавцом.
Если вам ближе картина именно колл-центра, где бот закрывает первую линию массовых обращений, посмотрите наш разбор про ИИ-оператора колл-центра.
Сколько это стоит
Самый частый вопрос и самый мутный рынок. По данным vc.ru, ценник на «ИИ-агента» в России гуляет от 50 тысяч до 15 миллионов рублей. Разброс в триста раз. И дело не в том, что кто-то наглеет. Просто за одним словом скрываются совершенно разные вещи.
За 50 тысяч вы, скорее всего, получите готовый шаблон с минимальной настройкой под один простой сценарий. За миллионы строится система с глубокой интеграцией, кастомной логикой, обучением на ваших данных и поддержкой. Это как спросить «сколько стоит автомобиль». Зависит от того, нужна вам «Лада» под одну задачу или производственная линия.
Что реально влияет на цену:
- Сложность сценария. Запись на услугу и многоступенчатая квалификация лида с десятком развилок — это разный объём работы.
- Глубина интеграции. Просто записать в CRM или двусторонне синхронизировать с 1С и телефонией — это разные деньги.
- Объём звонков. Помимо разработки есть стоимость минут разговора: распознавание, модель, синтез, телефония тоже стоят денег и зависят от трафика.
- Поддержка и доработка. Бот не настраивается раз и навсегда. Сценарий живёт, его правят по реальным разговорам.
Мой совет простой. Не гонитесь за самым дешёвым и не верьте самому дорогому на слово. Спросите, что конкретно входит в цену, кто отвечает за результат и как считается окупаемость. Хороший подрядчик назовёт метрику, по которой вы поймёте, окупился бот или нет, ещё до старта, а не задним числом. У нас запуск занимает от семи дней, и это нормальный срок для адекватного по сложности сценария. Обещают «включим завтра» под серьёзную интеграцию — это блеф. Хотят полгода разрабатывать простую запись на услугу — тоже повод задуматься. Крайности с обеих сторон одинаково подозрительны.
Юридические нюансы: согласие и 152-ФЗ
Этот раздел люди обычно пролистывают, а потом получают претензию. Так что коротко и по делу.
Запись разговора. Если вы записываете звонок — а голосовой бот почти всегда его пишет — собеседника нужно об этом уведомить. Фраза о записи в начале разговора — это не вежливость, а требование. И лучше, чтобы она звучала с первых секунд, до того как человек начал что-то рассказывать о себе.
Обработка персональных данных. Имя, телефон, детали заказа — это персональные данные, и работа с ними подпадает под 152-ФЗ. Нужно законное основание на обработку и понимание, где эти данные хранятся. Мы держим данные в российском контуре именно поэтому: так проще выполнять требования закона и не объяснять потом, почему персональные данные клиентов уехали на иностранный сервер.
Согласие на звонок при обзвоне. С исходящими строже. Холодный обзвон людей, которые не давали согласия на звонки, — это зона риска по закону о рекламе и о персональных данных. Обзванивать свою базу, давшую согласие, — это одно. Покупать списки и таранить незнакомцев — совсем другое, и чревато штрафами. Я честно отговариваю клиентов от серых схем: репутационный и юридический риск перевешивает любую сиюминутную выгоду.
Сухой остаток по юридической части: уведомляйте о записи, имейте основание на обработку данных, держите данные в российском контуре и не звоните тем, кто не давал согласия. Это не бюрократия. Это страховка от штрафа и от испорченной репутации.
Что в итоге
Голосовой бот для бизнеса — это не замена живым людям и не волшебная кнопка «больше продаж». Это точный инструмент для повторяющихся коротких разговоров с понятной целью. На записи, подтверждении визитов, реактивации и первой линии он окупается быстро и предсказуемо. На сложных эмоциональных диалогах и тонких переговорах он проигрывает человеку, и пытаться засунуть его туда — значит зря потратить деньги.
В наших проектах эффект всегда давала не технология сама по себе, а закрытая конкретная дыра в процессе. Магазин мебели получил рост конверсии из обращения в заявку на 38 процентов, потому что перестал терять входящие. Салоны удвоили записи, потому что бот не пропускал звонки в час пик. Клиника утроила записи по той же причине. За каждой цифрой стоит скучная операционная работа, а не магия.
Если вы думаете про голосового бота, начните не с вопроса «какой выбрать», а с вопроса «какую конкретную задачу я закрываю». Найдёте узкое место с понятной метрикой — голос окупится. Будете внедрять «потому что у всех ИИ» — попадёте в статистику свёрнутых проектов. Я за первый путь.