IP-телефония на базе Asterisk
Введите свой номер телефона
и мы перезвоним вам
Решаем Ваши бизнес-задачи с помощью IT-технологий. Знаем, как сделать лучше, быстрее и дешевле. Наш опыт – на службе Вашего бизнеса.
База знаний Не все герои носят плащи. Сотни техических статей, написанных инженерами нашей компании. Делимся опытом и своими знаниями со всем сообществом.
Сотни функций и возможностей Asterisk помогут вывести коммуникации в Вашей компании на принципиально новый уровень. Технические ограничения – фантазия Заказчика.
IP-АТС Вы платите за систему, которая будет полностью соответствовать Вашим ожиданиям, требованиям и будет драйвером роста Вашего бизнеса
Идти в ногу со временем или оставаться на старых технологиях? Такой вопрос не стоит перед нашими клиентами. Решаем самые смелые задачи для Колл-Центров. Строим с нуля или работаем с существующими.
Поместите свой бизнес в эпицентр продаж. Интеграция IP-телефонии и CRM даст новый и мощный импульс Вашему Отделу Продаж и выведет компанию на три шага впереди конкурентов.
Подбираем для клиентов такие тарифы, которые ему редко получится найти на рынке самостоятельно. Работаем с 100+ операторов связи в интересах клиента.
Разработки, созданные нашей командой под запросы клиентов. Не отказывайтесь от инноваций. Мы поможем идти с ногу со временем.
Умные всю жизнь учатся, а остальные всегда все и так знают. Мы проводим обучение более 8 лет и выпустили более 1000 специалистов по Asterisk и Mikrotik. Проводим ежегодную конференцию Asterisk.
Купить наш опыт дешевле, чем набивать свои шишки. Мы реализовали более 800 проектов и накопили экспертизу для того, чтобы идеально выполнить Ваш проект.
Оборудование Правильный выбор оборудования позволяет сэкономить от 20 до 50% бюджета телефонии. Мы предельно внимательно подойдем к выбору «железа» в Ваш проект.
Наши цены доступны не только для Москвы, но и для регионов. А вложения в нашу экспертизу обычно окупаются за несколько месяцев.
О нас Работаем с 2011 года. Собрали отличную команду реальных фанатов своего дела. Подходим к работе с душой и ответственностью.
Ежедневно в мире генерируются колоссальные объемы аудиоданных. Крупные корпорации записывают сотни часов разговоров в сутки, а если просуммировать записи малого и среднего бизнеса, получится гигантский массив информации. В этих данных скрыта огромная ценность для аналитики, но обрабатывать их вручную — задача за гранью реальности. Первое решение, которое обычно приходит в голову, — купить готовый инструмент у крупных игроков рынка, вроде Google, Amazon или отечественных ИТ-гигантов.
Такая стратегия имеет право на жизнь, но она сразу упирается в серьезные ограничения. Самое очевидное — конфиденциальность. Для банков, медицинских центров или госсектора передача данных во внешние облака часто просто запрещена. Кроме того, облачные API — это всегда «черный ящик». Если система ошиблась и приписала мат оператору вместо клиента, исправить это внутри закрытого сервиса практически невозможно. Именно поэтому построение собственной речевой аналитики на базе открытых решений (Open Source) — это не просто экономия, а вопрос контроля и качества. Особенно актуально это становится, когда в компании активно используется Ip-телефония для удаленных сотрудников, генерирующая постоянный поток звонков.
Главная проблема готовых сервисов — их универсальность. Они обучаются на «усредненных» данных и часто пасуют перед специфической лексикой, профессиональным сленгом или плохим качеством связи. Открытые решения позволяют залезть «под капот» и адаптировать систему под конкретные задачи. Перед внедрением таких инструментов полезно провести Предпроектный аудит, чтобы точно понимать требования к инфраструктуре и объемы данных.
Основные преимущества собственного решения:
Когда в компании уже выполнена Установка Asterisk, логичным следующим шагом становится настройка глубокого анализа разговоров. Это позволяет не просто хранить записи «на всякий случай», а превращать их в понятные отчеты и инсайты для бизнеса.
Процесс обработки звука — это не одна большая программа, а цепочка (пайплайн) из нескольких специализированных модулей. Каждый из них отвечает за свой участок работы. Если один компонент устаревает, его можно заменить на более современный, не переделывая всю систему целиком.
Типовой процесс выглядит так:
На выходе мы получаем размеченный файл, где четко указано: с 10-й по 15-ю секунду говорил Менеджер, с 15-й по 20-ю — Клиент. Чтобы такая система работала без сбоев, важно предварительно провести Аудит IP-ATC, чтобы исключить проблемы с качеством записи на уровне телефонии.
VAD — это фундамент. Если на этом этапе ошибиться и принять шум за речь (или наоборот), вся дальнейшая аналитика «поплывет». Старые методы, работавшие просто по уровню громкости, сегодня уже не актуальны — они слишком часто ошибаются в шумных офисах. Современный стандарт — это нейросетевые VAD-системы.
Существует несколько популярных решений, но у каждого есть свои особенности. Например, Silero VAD — очень быстрый инструмент, который работает практически везде, но на некоторых данных может выдавать нестабильный результат. Библиотека Pyannote часто грешит избыточной фильтрацией, из-за чего могут пропадать короткие реплики спикеров.
Одним из лучших решений сегодня считается модель FunASR VAD от Alibaba. Ее фишка в архитектуре со сверточной памятью. Она умеет работать в двух режимах:
Чтобы компьютер мог отличить одного человека от другого, голос нужно перевести на язык чисел. Для этого используются специальные нейросети-эмбеддеры. Они сжимают кусок аудио в вектор (обычно это 256 чисел), в котором зашифрованы тембр, высота и другие уникальные характеристики голоса.
Сейчас в топе открытых решений находится архитектура CAM++. Если говорить просто, это нейросеть из 100 слоев, внутри которой работают механизмы «внимания». Она умеет фокусироваться на самых важных акустических признаках, игнорируя посторонние шумы. Это позволяет создавать очень точные «цифровые слепки» голосов. Полученные данные можно использовать не только для разделения спикеров, но и для биометрии — например, чтобы система сразу узнавала VIP-клиента по голосу.
Разделение записи на голоса называется диаризацией. Это самая сложная часть процесса. Если у нас есть стереозапись телефонного звонка, где оператор и клиент в разных каналах, задача решается легко. Но в моно-записях или конференциях всё гораздо интереснее.
Если мы заранее знаем количество участников, можно использовать простую кластеризацию, например, K-means. Система просто раскидывает все голосовые фрагменты на две кучки. Но в реальности мы редко знаем число спикеров заранее, да и условия записи могут меняться. Здесь на помощь приходит спектральная кластеризация.
Она работает сложнее: выстраивается матрица схожести всех кусочков аудио друг с другом. Чтобы повысить точность, применяют PLDA (вероятностный линейный дискриминантный анализ). Это математическая модель, которая помогает системе понять: «Этот человек звучит немного по-другому, потому что он злится или в трубке шум, но это все еще тот же самый спикер».
Для самых сложных случаев используется VBx-кластеризация:
Инженеры, которые проходят Курсы по Asterisk, часто начинают именно с таких задач — как автоматизировать разбор сотен звонков, не тратя на это ресурсы живых людей.
Часто звучит скепсис: «Разве открытое решение может быть лучше, чем сервис от Google?». Статистика говорит, что может. Качество диаризации измеряется метрикой DER (Diarization Error Rate) — чем она ниже, тем лучше.
Тесты на независимых наборах данных показывают, что связка из хорошего VAD (например, FunASR), эмбеддера CAM++ и алгоритма VBx показывает результат на 2–5% лучше, чем облачные API крупнейших мировых и российских компаний. При этом по скорости такая система может обрабатывать аудио в десятки раз быстрее, чем оно длится в реальности. На одном современном сервере с хорошей видеокартой можно анализировать потоки данных в режиме 24/7 без каких-либо задержек.
Речевая аналитика — это не только расшифровка текста. Когда у вас есть разделение по ролям и идентификация спикеров, открываются новые возможности для автоматизации:
Подводя итог, можно сказать, что Open Source технологии в речевой аналитике достигли того уровня, когда они не просто догоняют коммерческие продукты, а часто их превосходят. Для компании это означает возможность построить мощный инструмент, который полностью принадлежит ей, работает быстро и не требует ежемесячных выплат сторонним провайдерам. Это инвестиция в собственные технологии и безопасность данных, которая окупается за счет прозрачности и качества аналитики.
Билеты уже в продаже!
Я - Игорь Кондрашин, менеджер компании Voxlink. Хотите уточнить детали или готовы оставить заявку? Укажите номер телефона, я перезвоню в течение 3-х секунд.