Запись звука в видеонаблюдении

Опубликовано: Скачать статью в формате pdf (необходимо зарегистрироваться или авторизоваться)

Скажем сразу – это статья не о профессиональной аудиоаппаратуре, которую можно встретить в студиях вещания и звукозаписи, а о возможностях работы со звуком именно в сфере видеонаблюдения.

Вообще, в теме звука в охранном видеонаблюдении ситуация, скажем так, неясная. Производители аудиосистем (для конференций, студий, телефонии) практически не соприкасаются с системами CCTV. А вендоры камер, регистраторов и программного обеспечения мало уделяют внимания теме звука. В итоге ассортимент аудиоустройств очень невелик (по сравнению с теми же камерами), и информационное сопровождение (разного рода документация, статьи, примеры проектов) так же очень скромное. Информация же о профессиональном звуке мало применима в типовых задачах систем видеонаблюдения.

При этом работать со звуком не проще, а даже сложнее, чем с видео! На самом деле, видя «картинку» с камеры, можно с высокой степенью вероятности предположить («додумать») свойства и поведение даже плохо видимых объектов. Например, можно определить марку машины, не видя ее обозначений, понять траекторию движения, отличить человека от животного. А если нужно какие-то детали рассмотреть внимательно, можно сделать стоп-кадр.

А вот со звуком (без «картинки» т.е.) ситуация совершенно иная. Описать источник незнакомого звука, не видя его, практически невозможно. Сделать же «стоп-кадр» нельзя даже в теории: звук- это всегда динамика, любое звуковое явление - это всегда событие определенной длительности.

Запись звука в видеонаблюдении

В этой статье мы собрали и упорядочили имеющуюся информацию, а также сформулировали советы и рекомендации для проектировщиков и инженеров, столкнувшихся с работой со звуком в сфере охранного IP-видеонаблюдения.

Актуальность звука

Прежде стоит разобраться, для каких задач и целей нужно звуковое сопровождение. Для этого классифицируем задачи видеонаблюдения, в которых используется аудиоконтроль.

  1. Наблюдение общего плана
    Здесь нет каких-то конкретных «звуковых» задач и источников звука, которые надо контролировать. Есть просто желание повысить эффективность видеонаблюдения, дополнив её аудиоконтролем. Просто «на всякий случай». Предполагается, что звуковое сопровождение позволяет лучше понять, что происходит на объекте. При этом заказчик обычно желает более-менее разборчиво слышать звуки и шумы, сопутствующие всем событиям, происходящим в поле зрения камер.
  2. Бизнес процессы
    Имеется в виду прослушивание и запись разговоров. Это могут быть переговоры сотрудников либо общение с клиентами. Основной задачей здесь является качественная запись человеческой речи для дальнейшего воспроизведения с целью анализа или разбора конфликтных ситуаций. При этом другие звуки, не относящиеся к собственно прослушиваемым разговорам, не должны присутствовать в аудиозаписях (и это зачастую является основной проблемой связанной с аудио).
  3. Производственные процессы
    При контроле работающего в заводских условиях оборудования звук может играть роль даже более важную, чем изображение (особенно если учесть наличие кожухов, щитков, панелей и т.д.). Какие-то изменения или неполадки зачастую вообще невозможно увидеть оперативно – но вполне реально определить на слух (наступившая тишина, например, может означать, что какой-нибудь станок или насос прекратил свою работу).
  4. Голосовая связь
    Задачи голосовой связи могут возникать при установке системы видеонаблюдения в зданиях и помещениях, на входе в которые используются домофоны. Современное ПО видеонаблюдения вполне позволяет организовать двустороннюю аудиосвязь между вызывной панелью IP-домофона и оператором поста охраны. Аналогичным образом может быть устроена связь между операторами системы видеонаблюдения и колоннами экстренных вызовов типа «гражданин <-> полиция». Также в распределенных системах видеонаблюдения может быть востребована голосовая связь между самими операторами системы. В задачах такого рода на первое место выходит не столько звук, сколько возможность совершать вызовы на конкретное устройство или конкретному человеку, передавать DTMF-сигналы для управления замками дверей, возможность оператора работать одновременно с несколькими вызовами.

Частным случаем голосовой связи является задача подключения IP-домофонов к системе видеонаблюдения, обзор решений этой задачи можно увидеть в нашем видео «Подключение IP домофона в разном ПО видеонаблюдения».

Итак, мы рассмотрели типы задач, в которых востребованы функции аудионаблюдения. Далее перейдем к устройствам, которые непосредственно занимаются преобразованием звуковых колебаний в электрические. То есть речь пойдёт о микрофонах.

Технологии микрофонов

Существует несколько технологий, на базе которых производятся микрофоны. Не вдаваясь в принципы работы, перечислим отличительные свойства микрофонов исходя из технологии преобразования звуковых волн в электрические сигналы:

  • Динамические микрофоны
    Достаточно известный и распространенный (но не в отрасли охранного видеонаблюдения) тип. Диапазон воспринимаемых частот сравнительно невелик (особенно высоких частот), зато присутствует хороший запас устойчивости к перегрузкам. Также отличается сравнительно низким уровнем собственных шумов.
  • Конденсаторные микрофоны
    Более распространённый тип микрофонов. Конденсаторная технология позволяет создавать довольно миниатюрные модели микрофонов, сохраняя при этом широкий диапазон воспринимаемых частот. Отличительная особенность данного типа – необходимость подведения отдельного питания на сам микрофон.
  • Электретные микрофоны
    По сути является упрощённым вариантом конденсаторного типа. Вследствие этого электретные микрофоны очень распространены. Питание для самого микрофона уже не требуется, физические размеры могут быть очень небольшими. Однако качество получаемого аудиосигнала также уступает конденсаторному типу.
  • MEMS-микрофоны
    Наиболее распространенный тип на базе т.н. микромеханических (MEMS) устройств. Микрофоны этого типа не уступают (и даже превосходят) по широте диапазона конденсаторным, а по динамическому диапазону – (извините за тавтологию) динамическим. Также технология позволяет создавать очень миниатюрные (порядка единиц миллиметров) модели. Минусом является сравнительно более высокая цена.

Технология преобразования звуковых волн в электрические сигналы – не единственный тип классификаций микрофонов. Также микрофоны могут быть встроенными или внешними.

Исполнение микрофонов

Независимо от технологии микрофон может располагаться или в корпусе самой камеры, или подключаться к ней как отдельное, самостоятельное устройство. Давайте приглядимся к обоим вариантам.

Видеокамера со встроенным микрофоном

Видеокамера со встроенным микрофоном

Встроенный микрофон

В подавляющем большинстве случаев - это электретный микрофон, расположенный недалеко от объектива. Решение, с одной стороны, простое, понятное и удобное - потребитель получает звуковое сопровождение «в одном флаконе» с изображением, почти не замечая увеличения стоимости камеры по сравнению с безмикрофонным аналогом. Плюсом также можно считать возможность управления параметрами микрофона из интерфейса самой камеры. С другой стороны, решение ограниченное - изменить расположение и ориентацию микрофона в принципе невозможно, характеристики самого микрофона зачастую попросту неизвестны.

Внешний микрофон

Вариант, противоположный предыдущему. Здесь камера и микрофон – два разных устройства, подключённые друг к другу. Такой вариант имеет ряд достоинств:

  • микрофон можно располагать независимо от места расположения камеры
  • возможность произвольно выбирать модель микрофона, вне зависимости от модели выбранной камеры (и наоборот – выбирать камеру без оглядки на параметры микрофона)
  • возможность использования нескольких микрофонов совместно с одной и той же камерой

Ну и, естественно, отрицательные моменты тоже есть:

  • практически всегда необходимо предусмотреть источник питания для микрофона, и, соответственно, требуется прокладка кабелей линий питания и сигнала к каждому микрофону
  • удаленное управление микрофоном невозможно
  • возникают вопросы по способу монтажа микрофона

Демонстрация работы встроенного и внешнего микрофона с точки зрения места установки в коротком видео:

На канале VIDEOМАХ регулярно публикуются обучающие видео, демонстрации работы технологий, записи мероприятий.
Подпишитесь, чтобы быть в курсе новых технологий видеонаблюдения.Подпишись на канал

По отношению к внешним микрофонам часто применяют термины «пассивный» и «активный». Давайте рассмотрим эти термины.

Пассивные и активные микрофоны

Микрофон, независимо от технологии, может быть пассивным или активным. Пассивным принято называть собственно микрофон, активным же – изделие, состоящее из микрофона и дополнительного усилителя звуковых частот. Суть в том, что на выходе любого микрофона сигнал довольно слабый, непригодный для передачи на сколь-нибудь значительное расстояние (более нескольких метров). При этом усложняется задача борьбы с помехами и наводками, т.к. малая амплитуда сигнала будет сопоставима с уровнем наведенных помех. Для увеличения длины кабеля (и для борьбы с наводками) как раз и устанавливают дополнительный усилитель. Разумеется, при этом возрастает стоимость устройства, и появляется надобность подведения питания для усилителя.

Обратить внимание

Наличие или отсутствие усилителя влияет на требования к аудиовходу камеры. Для подключения пассивного микрофона камера должна иметь в себе именно микрофонный вход, для активного - т.н. линейный вход. Нередко камера имеет аудиовход, способный работать в обоих режимах (переключение производится в настройках камеры).

Часто усилители активных микрофонов имеют возможность регулировки их параметров, например, уровня усиления. Наиболее сложные и дорогие модели позволяют регулировать уровни усиления определенных частот и даже менять направленность микрофона (о направленности речь пойдет немного ниже).

Также встроенный предусилитель используется для реализации функции автоматической регулировки усиления сигнала (АРУ).

Автоматическая регулировка усиления (АРУ)

Назначение функции – автоматически увеличивать усиление в тихой обстановке (с целью услышать самые слабые звуки) и автоматически же уменьшать при увеличении громкости, чтобы не допустить перегрузки аудиотракта слишком большим выходным сигналом микрофона. В идеале на выходе микрофона должна быть одна и та же громкость слышимого звука независимо от реальной громкости источников звуков.

Работа АРУ

На практике же применение АРУ не всегда полезно, а иногда даже вредно. Потому что:

  1. В реальных условиях источников звука сразу несколько, на какой именно будет «ориентироваться» АРУ при установке уровня – спрогнозировать сложно.
  2. Резкая и притом нерегулярная смена уровня усиления лишает звук естественности.
  3. В те моменты, в которые непосредственно происходит смена уровня усиления, звук может быть искажен вплоть до полной недостоверности.

Справка

Очень часто сами производители микрофонов с АРУ не рекомендуют использовать эту функцию по вышеописанным причинам.

Тем не менее функция АРУ продолжает встречаться в оборудовании. Поэтому при анализе заявленных характеристик того или иного микрофона стоит обращать внимание – используется ли АРУ для достижения указанных значений или нет (на бумаге параметры, указанные с учётом работы АРУ, всегда выглядят лучше «не-АРУшных» показателей).

Для лучшего понимания сходства и отличия пассивных и активных микрофонов приведены в таблице ниже.

Свойства Пассивный микрофон Активный микрофон
Длина кабеля Несколько метров Несколько сотен метров
Амплитуда сигнала Несколько микровольт (мкВ) От сотен милливольт (мВ) до единиц вольт (В)
Требование питания Нет Да
Наличие АРУ Нет Да (опционально)
Возможность регулировки выходного сигнала Нет Да (опционально)
Чувствительность к помехам Высокая Низкая
Стоимость Низкая Высокая
Требования к аудиовходу Микрофонный либо совмещенный Линейный либо совмещенный

Теперь, после рассмотрения технологических аспектов, перейдем к параметрам, описывающим качество получаемого с помощью микрофона звука.

Технические данные микрофонов

Разумеется, микрофоны, как и все остальное оборудование, имеют определённые технические характеристики и параметры. Давайте посмотрим на характерные для микрофонов параметры и попробуем понять, как они могут пригодиться при выборе микрофона.

Параметр Смысл Единицы измерения Правило выбора
Диапазон частот Иногда называется «Полоса пропускания». Эта характеристика указывает, какой диапазон звуковых колебаний может быть преобразован микрофоном в электрический сигнал. Герцы (Гц) Чем больше, тем лучше слышны оттенки и тембр голоса, но также возрастает спектр слышимых шумов.
Акустическая дальность Параметр, показывающий, на каком максимальном расстоянии может находиться источник звука. Метры (м) Значение не должно намного превышать фактическое расстояние до объекта, в противном случае величина шумов и помех может значительно возрасти.
Глубина АРУ Этот параметр – максимальная величина усиления сигнала, которая обеспечивается функцией АРУ. Децибелы (дБ) Чем больше значение, которое может обработать АРУ, тем больше диапазон громкостей.
Максимальное звуковое давление Значение максимальной силы звука, которое микрофон может преобразовывать в электрический сигнал. Децибелы (дБ) либо вольты на паскаль (В/Па) Чем больше значение, тем выше предельный уровень громкости, который будет воспринят микрофоном без искажений.
Чувствительность Параметр, характеризующий величину сигнала на выходе микрофона при определенном уровне звукового давления на его входе. Децибелы (дБ) Чем больше значение, тем чувствительнее микрофон к звуку малой громкости.
Динамический диапазон Способность микрофона воспринимать без искажений звуки разного уровня громкости. Децибелы (дБ) Чем больше, тем лучше.
Коэффициент нелинейных искажений Здесь речь об искажениях аудиосигнала, неизбежно возникающих в электронной схеме. Проценты (%) Чем меньше значение, тем меньше искажения.
Соотношение сигнал/шум Параметр, показывающий разницу между уровнями собственно звукового сигнала и фонового шума, производимого самим микрофоном. Децибелы (дБ) Чем больше, тем лучше.
Время срабатывания АРУ Этот параметр говорит о быстродействии АРУ – времени, в течение которого электроника успеет отреагировать на изменение громкости звука (в противном случае возможны «провалы» громкости либо искажения звука). Этот параметр указывается только для микрофонов с АРУ. Секунды (с) Чем меньше, тем лучше.
Амплитудно-частотная характеристика (АЧХ) Представляет собой график, на котором отражена зависимость чувствительности микрофона от частоты. Одна из ключевых характеристик, показывающая чувствительность микрофона к конкретной частоте звука. Только АЧХ дает возможность понять, насколько хорошо будут восприниматься низкие, средние и высокие частоты. График зависимости частоты от уровня сигнала Чем ближе график к прямой, тем лучше.
Неравномерность АЧХ Параметр, показывающий максимальные отклонения графика АЧХ в пределах объявленной полосы пропускания. Децибелы (дБ) Чем меньше значение, тем лучше.

Справка

Минимально допустимым частотным диапазоном для человеческого голоса считается диапазон от 80 Гц 8000 Гц.

Имея представления о смысле технических параметров, можно переходить непосредственно к выбору микрофона. И тут можно столкнуться с серьезным «подводным камнем» - в связи с тем, что разные частоты воспринимаются микрофонами неодинаково, большинство параметров микрофонов (кроме АЧХ) являются зависимыми друг от друга.

Это значит, что:

  • исходной характеристикой является АЧХ;
  • для каждого параметра должны быть указаны условия его измерения. Для диапазона частот должна быть указана неравномерность АЧХ. Для чувствительности или для коэффициента искажений должна указываться частота (или диапазон частот);
  • если условия не указаны, то по тому или иному параметру можно сравнивать микрофоны только в пределах данной марки, но не микрофоны разных марок;

Немного остановимся на смысле графика АЧХ. Эти графики показывают относительную разницу выходных сигналов микрофонов на разных частотах. Поясним это на примере.

Анализируя графики двух разных микрофонов, можно сделать следующие выводы:

АЧХ микрофона 1

  • все звуковые частоты воспринимаются равномерно (график почти прямой)
  • все звуки будут услышаны одинаково хорошо (ну или одинаково плохо)
  • чувствительность лучше (график выше)*

АЧХ микрофона 2

  • голос слышен лучше, чем низкочастотные посторонние звуки (график имеет спад в начале)
  • высокочастотные шумы будут более заметны, чем голос (график имеет подъем в конце)
  • отношение «сигнал/шум» должно быть хуже, т.к. хуже чувствительность (часть графика ниже)*

* справедливые утверждения при условии, если графики получены в одних и тех же условиях, по одной и той же методике (даже не важно по какой именно).

К сожалению, АЧХ не дает представления о динамическом диапазоне микрофона. Остается полагаться на указываемые производителем значения и уточнять условия получения (измерения) этих данных.

Направленность микрофона

Отдельно поговорим о такой интересной и важной характеристике, как направленность микрофона (иногда говорят – «диаграмма направленности»). Под этими словами подразумевается зависимость чувствительности микрофона к звуковому сигналу от места расположения источника этого звукового сигнала. Основные типы направленности микрофона:

Тип и название диаграммы направленности Особенности
Круговая диаграмма направленности микрофона Микрофон чувствителен к сигналам, идущих со всех сторон.
Диаграмма направленности микрофона типа Кардиоида Микрофон практически не воспринимает звук, идущий сзади
Диаграмма направленности микрофона типа Гиперкардиоида Микрофон с такой направленностью имеет спереди более узкую зону захвата звука, чем микрофон с кардиоидой. При этом частично захватывается звук, идущий сзади, по бокам присутствуют «мёртвые» (непрослушиваемые) зоны.
Диаграмма направленности микрофона типа Суперкардиоида Микрофон с такой направленностью имеет ещё более узкую зону спереди и более широкую зону сзади, чем микрофон с гиперкардиоидой.
Диаграмма направленности микрофона типа Двойная кардиоида («Восьмёрка») Микрофон одинаково чувствителен к сигналам, идущим как спереди, так и сзади. Также абсолютно не чувствителен к звуку по бокам.

В отрасли охранного видеонаблюдения наиболее массово используются микрофоны с круговой направленностью, но это не значит, что они одинаково хорошо подходят ко всем задачам наблюдения. Если контролируемый объект размещается в конкретном, заранее известном месте, стоит использовать микрофоны с кардиоидой или «восьмеркой». Это, прежде всего, позволит эффективно отсечь посторонние шумы и фоновые звуки, мешающие эффективному аудионаблюдению.

Обратить внимание

В документации, как правило, указывается направленность по горизонтали и ничего не говорится о направленности в вертикальной плоскости. Это не имеет значения для всенаправленного микрофона, но очень важно для микрофонов других типов. Обязательно следует уточнять направленность микрофона в обеих плоскостях!

Размещение микрофона

Итак, мы узнали, какие бывают микрофоны, чем они отличаются друг от друга. Теперь можно выбрать подходящий тип, отталкиваясь от поставленной задачи. Что делать дальше? Где физически должен быть расположен микрофон?

Вопрос на самом деле очень непрост. Микрофон, в отличие от камеры, не имеет каких-то «полей зрения», «зон обзора» и т.п. Также отсутствует эквивалент понятию «плотность пикселей». Да, есть диаграмма направленности, показывающая зависимость чувствительности от расположения и расстояния и которая вроде бы должна решать все вопросы, но есть существенный момент, который принципиально разделяет видео и аудио - микрофон воспринимает не объекты, а приходящие звуковые волны. Звуковые волны же, в свою очередь, могут приходить не напрямую от источников звука, а отражаться от стен, потолков, мебели и т.д. и т.п.

Выбор места установки - ключевой фактор получения качественного звука

Проблема выбора места установки в том, что предсказать акустическую обстановку практически невозможно. Всегда существует риск того, что в аудиосигнале помимо полезных данных могут оказаться посторонние звуки и шумы. Звуки, исходящие от смежных помещений, постоянно работающего оборудования, окон, вентиляции после многократного переотражения могут не просто мешать, но и вообще сделать аудиоконтроль неэффективным. Исходя из этого, перед выработкой проектного решения может потребоваться не только предпроектный осмотр, но и пробное размещение аудиооборудования на объекте.

В качестве ориентира можно использовать рекомендации производителей микрофона, выработанные на основе практического опыта:

  • Для задач общего контроля оптимальным будет размещение микрофонов на стене на высоте человеческого роста;
  • Для аудиоконтроля переговоров оптимальным является расположение ниже уровня говорящих людей, но выше поверхности рабочих столов, перегородок, касс и т.д.;
  • Не рекомендуется монтаж микрофонов непосредственно на твердые поверхности, необходим промежуточный изолирующий слой из мягкого материала;

  • Микрофон должен располагаться как можно дальше от постоянных источников шума, особенно это касается микрофонов с круговой направленностью и микрофонов с автоматической регулировкой усиления (АРУ);
  • Наихудшим вариантом является расположение микрофона на потолке, т.к. именно в этом случае посторонние звуки и шумы будут наиболее громкими.
  • Если контролируемый объект не перемещается по помещению, а находится постоянно в одном и том же месте, то лучше использовать узконаправленные микрофоны. Это позволит «отсечь» ненужный шум и ослабить эффект «эха» (переотражения от стен).
  • Если характер объекта не позволяет применять узконаправленные микрофоны, стоит поднять вопрос об отделке стен и потолков. Твердые поверхности являются хорошим «зеркалом» для звуковых волн – и может быть даже, что для устранения эха придётся отделывать помещение звукопоглощающим материалом на основе поролона или ворса.

Отраженный от стены звук приходит на микрофон

Звукопоглощающее покрытие не отражает звук

Микрофон типа «кардиоида» одинаково воспринимает все звуки из передней полусферы

Микрофон типа «суперкардиоида» приходящий сбоку звук воспринимает хуже, чем приходящий спереди

Здесь же отметим, что поскольку микрофон является источником аналогового сигнала, то для передачи аудио потребуется экранированный кабель. В идеале необходимо использовать специализированный 2-х жильный кабель с экранированием. Допустимо использовать кабель для аналогового видеосигнала (при этом экран будет также выполнять роль «общего» проводника), наихудшим же выбором будет использование витой пары.

Питание микрофонов

Итак, следующий разбираемый вопрос – питание микрофонов. Вопрос особенно актуален в охранном IP-видеонаблюдении в случаях, когда используется отдельный, не встроенный в камеру микрофон. Давайте перечислим все способы организации подачи питания.

  1. От выделенного БП
    При данном способе для питания микрофона используется отдельный блок питания. Для микрофона обычно требуется напряжение 12 вольт и выходной ток не менее 100 мА.
    Питание микрофона от блока питания
  2. От PoE-сплиттера
    Если камера получает питание по PoE, то возможна установка специального устройства (т.н. сплиттера) в линию связи между коммутатором и IP-камерой. Выбранный сплиттер должен обеспечивать выходное напряжение и ток согласно требованиям микрофона, а так же поддерживать стандарт PoE, используемый для питания данной IP-камеры.
    Питание микрофона от PoE-сплиттера
  3. От IP-камеры
    Суть в том, что некоторые модели камер имеют выход питания для каких-либо дополнительных устройств. Камера должна обеспечивать выходное напряжение и ток согласно требованиям микрофона.
    Питание микрофона от камеры
  4. Фантомное питание
    При фантомном питании по одному и тому же кабелю передается и звук, и питание микрофона. Способ очевидно удобный, но малораспространенный по ряду причин:
    • микрофон должен иметь функцию приема фантомного питания;
    • камера должна иметь функцию подачи фантомного питания, либо должен использоваться т.н. инжектор фантомного питания;
    • камера либо инжектор должны обеспечивать выходное напряжение и ток согласно требованиям микрофона.

    Питание от камеры с фантомным выходом
    Питание от инжектора фантомного питания

Какой же вариант питания предпочтителен? Ответ: тот, который удобнее в реализации. Прямой связи между качеством звука, количеством помех и наводок с типом питания нет. У всех источников питания на выходе присутствуют пульсации напряжения, величина которых определяется добросовестностью производителя оборудования, но не выбором технологии. Более важно проложить подключаемые к микрофонам кабели наиболее коротким путем, но ни в коем случае не рядом с силовыми линиями и электрическими приборами. В противном случае кабель питания может стать этакой «антенной» для помех и наводок. Можно также заложить специальные фильтры питания, позволяющие «погасить» наводки и помехи, попадающие в схему активного микрофона по кабелю питания. Ставятся они непосредственно перед вводом питания в микрофон.

Кодирование

Итак, с самими микрофонами разобрались, звуковой сигнал получили, подали его на IP-устройство и теперь требуется его «оцифровать», т.е. закодировать каким-то образом. И оказывается, что если в случае с видео с выбором формата кодирования вопросов практически не возникает (h.264 можно считать стандартом «де-факто»), то с аудио все сложнее. Используемых для сжатия звука кодеков гораздо больше и выбор их не так очевиден. И, как видно в таблице ниже, в разных ПО видеонаблюдения поддержка аудиокодеков устроена по-разному.

ПО Интеллект Axxon Next Macroscop Milestone XProtect Trassir
Поддерживаемые аудиоформаты PCM, ADPCM, G.711U, G.711A, G.726, AAC, MP2L2 PCM, ADPCM, G.711U, G.711A, G.726, AAC, MP2L2 PCM, G.711U, G.711A, G.722.1, G.726, G.729A, GSM-AMR, AAC PCM, G.711, G.721, G.723, G.726, MPEG1, ААС PCM, G.711, G.722.1, G.723, G.726, AAC, MP2L2

Неизбежен вопрос: какой кодек и из каких соображений следует выбирать? Чтобы ответить на вопрос, следует, прежде всего, рассмотреть свойства и параметры кодеков. И здесь мы сталкиваемся с не совсем корректным представлением характеристик производителями. А именно:

  1. G.711, G.721 (и прочее семейство G.7xx), AAC, OPUS, MPEG1, MPL2, GSM-AMR – это действительно кодеки, описанные существующими конкретными стандартами.
  2. PCM и ADPCM (а также LPCM) – это методы преобразования аналогового звукового сигнала в цифровой формат. Это не кодеки и даже не алгоритмы сжатия – это разновидности алгоритмов перевода «аналога» в «цифру».

В итоге к ПО от камеры может приходить либо звук, оцифрованный по одному из указанных алгоритмов и затем сжатый каким-либо кодеком, либо звук, также оцифрованный одним из алгоритмов, но без сжатия.

Теперь перейдем непосредственно к кодекам. Как и в случае изображения, параметрами кодека определяется качество сжатым этим кодеком звука. Понятие «качество звука» можно описать терминами «Частота дискретизации» и «Разрядность». Смысл этих терминов:

  • Частота дискретизации определяет максимальную верхнюю частоту, которая может быть передана данным кодеком.
  • Разрядность определяет динамический диапазон, т.е. диапазон громкостей (разницу между тихим и громким звуками), который может быть передан данным кодеком.

Упрощенно можно сказать, что верхняя граница частотного диапазона, передаваемого кодеком, равна примерно половине частоты дискретизации. А вот с разрядностью сложнее – многие кодеки обрабатывают звук по довольно сложному алгоритму, в результате чего невозможно говорить о какой-то фиксированной разрядности и однозначно судить по доступному диапазону громкостей. Отчасти здесь может помочь приводимое в описании кодека значение величины потока – чем больше значение, тем бОльший динамический диапазон должен передавать кодек. Практически, опять из-за сложности алгоритмов, чёткой прямой зависимости нет.

Путаницу привносит и тот факт, что многие кодеки поддерживают несколько профилей сжатия – и, соответственно, могут формировать аудиопоток разной величины.

Так на что же все-таки смотреть при выборе кодека? Давайте взглянем на свойства наиболее распространенных кодеков:

Кодек Разрядность, бит Дискретизация, кГц Величина потока, кбит/с
G.711 8 8 64
G.722.1Переменная1624,32
G.723 Переменная 8 24, 40
G.726 Переменная 8, 16 16, 24, 32, 40
G.729 16 8 8
GSM-AMR 8, 13 8 1,8 12,2
MP2L2 Переменная 32, 44.1, 48 32-384
AAC 16, 24 8, 16, 32, 48, 96 до 512
OPUS Нет данных 8, 12, 16, 24, 48 6-510

Исходя из величины потока, кодеки аудио можно разделить на две группы:

  • Кодеки с потоком в несколько десятков кбит/с. Сюда относятся, прежде всего, кодеки G.7xx. Это – кодеки, разработанные в основном для телефонной связи. Назначение – передать человеческую речь понятно. Т.е. переданный человеческий голос должен быть разборчив, но не более того.
  • Кодеки с потоком порядка сотен кбит/с. Это AAC, MP2L2 и подобные. В отличие от «телефонных» изначально предназначены для работы не только с речью, но и с музыкой, поэтому обеспечивают более высокое качество звука.

Вот теперь, исходя из назначения кодека величины потока и частоты дискретизации, можно сформулировать рекомендации по выбору:

  • Для работы с человеческим голосом пригоден практически любой кодек.
  • При прочих равных условиях следует выбирать кодек с а) бОльшей частотой дискретизации и б) бОльшей величиной потока.
  • Если помимо человеческого голоса важно слышать и другие звуки (шум мебели, оборудования, транспорта), следует отказаться от применения G.7xx и им подобных и ориентироваться на кодеки с а) максимально возможной дискретизацией и б) максимально возможной величиной потока.

Более конкретные рекомендации (по выбору каких-то промежуточных параметров) дать невозможно, т.к. акустическая обстановка на конкретном объекте, в отличие от изображения, заранее неизвестна и не предсказуема. Поэтому во многих случаях требуется либо проводить предпроектные эксперименты, либо искать данные о подобных экспериментах на аналогичных (в звуковом плане) объектах.

Справка

Согласно п. 5.3.9 ГОСТ Р 51558-2014 для кодирования звука должны использоваться кодеки с частотой дискретизации не менее 32 кГц и разрядностью не менее 8 бит.


О том как кодеки влияют на качество звука в коротком видео:

На канале VIDEOМАХ регулярно публикуются обучающие видео, демонстрации работы технологий, записи мероприятий.
Подпишитесь, чтобы быть в курсе новых технологий видеонаблюдения.Подпишись на канал

Итак, оцифрованный звук приходит на видеосервер в ПО видеонаблюдения. Какие вопросы могут возникнуть теперь и на что обратить внимание? Всё существующее сегодня ПО видеонаблюдения позволяет работать с аудиоканалами, но реализация этой работы в разном ПО отличается между собой. Далее мы рассмотрим особенности работы со звуком в продуктах разных производителей.

Лицензирование аудиоканалов в ПО видеонаблюдения

Прежде всего скажем, что для работы со звуком камера должна не просто присутствовать в списке интегрированных в данном ПО.

Поддержка аудиоканала IP-камер в ПО в общем случае является опциональной и не обязательной. Всегда необходимо уточнять поддержку аудио данной конкретной камеры в выбранном ПО (в т.ч. поддержку реализованных в камере кодеков)

Специалисты, конечно, в курсе, что звук можно получить и при подключении неинтегрированных камер по ONVIF, по RTSP и PSIA – но такие способы не дают твердой, 100%-ной гарантии, что звук действительно будет. Все-таки «прошивки» (которые и реализуют работу указанных протоколов) IP-камер делают не по одним и тем же стандартам. Узнать заранее о возможности работы со звуком для неинтегрированных камер не получится - необходимо проверять с реальной камерой.

Ну а теперь посмотрим на политику лицензирования. Вопрос простой - нужно ли «закладывать» дополнительные лицензии на аудиоканал? Ответ на вопрос так же прост – нет, для работы со звуком в наиболее распространенных на российском рынке программных продуктах видеонаблюдения никакие дополнительные лицензии не нужны (Интеллект, Axxon Next, Macroscop, Milestone XProtect, TRASSIR).

Функции и возможности работы со звуком в ПО

Работа со звуком в современном ПО это не только лишь прослушивание и запись – по аналогии с видео существуют и различные детекторы, автоматизирующие обработку звуковых событий. Подробное рассмотрение всей существующей аудиоаналитики выходит за рамки данной статьи, поэтому ограничимся перечислением функционала, который можно найти в списке, так сказать, базового набора функций ПО:

ПО
Функционал
Интеллект Axxon Next Macroscop Milestone XProtect Trassir
Детектор превышения заданного порога громкости Да* Да Да Нет Да
Детектор отсутствия звука Нет Да Нет Нет Нет
Детектор фонового шума Нет Да Нет Нет Нет

*детектор (т.н. акустопуск) изначально предназначен для записи звука в архив при срабатывании детектора. Эту функцию отключить нельзя.

Да, набор действительно скромный (что подтверждает справедливость тезисов в начале статьи).

Составные видео-аудио каналы

Следующий момент касается возможности комбинирования аудио- и видеоканалов. Работать (записывать, воспроизводить, передавать на УРМ) с полученными с камеры звуком и изображением как с одним целым каналом умеют все существующие ПО. На практике же может возникнуть вопрос объединения аудио- и видеоканалов в произвольном сочетании в следующих случаях:

  • Размеры помещения достаточны чтобы «накрыть» его одной камерой, но слишком велики чтобы «накрыть» его одним микрофоном;
  • Необходимо одновременно наблюдать один и тот же объект и крупным планом, и на фоне общей обстановки (например, нужно видеть кассу вместе с проходом и крупно – зону денежного ящика). Звуковая дорожка требуется на всех камерах. При этом микрофон камеры общего плана не «ловит» переговоры за кассой из-за большого расстояния.

Можно ли к одной камере «привязать» микрофон с другой камеры? А можно ли к одной камере «привязать» не один, а несколько микрофонов? Все ли камеры должны иметь аудиоканал? Или как-то можно «разделить» один микрофон на несколько камер? А как все эти привязанные микрофоны будут слышны при воспроизведении видеоархива – все одновременно или выборочно? И снова: в разных ПО – разные возможности. И снова мы покажем это в таблице.

Функционал Интеллект Axxon Next Macroscop Milestone XProtect Trassir
«Привязка» к одной камере микрофона с другой камеры Да Да Нет Нет Да
«Привязка» одного и того же микрофона к нескольким камерам Да Нет Нет Нет Да
«Привязка» к одной камере нескольких микрофонов Да Да Нет Нет Нет
Одновременное воспроизведение всех «привязанных» микрофонов Да Нет Нет Нет Нет
Выборочное воспроизведение одного из «привязанных» микрофонов Нет Да Нет Нет Нет

В общем, проектировщику будет о чем задуматься при проектировании видеосистемы с аудиофункциями.

Расчеты потоков и архивов при работе со звуком

Важность вопросов расчёта архива сложно переоценить. Тем удивительнее, что подавляющее большинство онлайн-калькуляторов дает возможность рассчитывать потоки и архивы для изображения, но не для звука. Объяснение этому дается простое: размеры аудиопотоков на порядки меньше чем размеры потоков видео и не играют особой роли. Это утверждение верно для кодеков типа G7XX (когда действительно достаточно запаса в 2-3 % от потока видео), но при использовании кодеков AAC так бывает не всегда (как мы показывали выше, поток аудио может исчисляться сотнями килобит).

Поэтому перед выполнением расчётов следует определиться с выбором кодека и оценкой потока аудиоданных. Если будут использоваться кодеки G7XX, то можно выполнять расчёты как обычно. Но если цель – получить звук в хорошем качестве, то следует «накинуть» хотя бы четверть мегабита на каждый канал.

Настройка аудиоканала

Аудиооборудование (как и видео) в процессе пусконаладки требуется настраивать. И, хотя настроек обычно немного, вопросы тоже могут возникнуть. Даже вопрос настройки уровня сигнала может поставить в тупик: у микрофона – свой регулятор, у IP-камеры - тоже какие-то собственные «ползунки», да в ПО есть свои регулировки, да и «Виндосовские» параметры звука покрутить придётся. Как же сделать это правильно?

Регуляторы уровня сигнала от микрофона до динамиков оператора

Считая целью получить максимальную чувствительность с минимальным уровнем шумов, приведем рекомендуемы алгоритм настройки звукового тракта.

Перед настройкой рекомендуется подготовить систему следующим образом:

  • Произвести все необходимые подключения оборудования. Подать питание на все устройства, кроме микрофона.
  • Включить акустическую систему (колонки или наушники), через которую будет прослушиваться звук. Установить регулятор громкости Windows на максимальный уровень, при котором фоновые шумы остаются незаметными.
  • Подключить акустическую систему к ПК, в настройках звука на ПК отключить прослушивание всех аудиовходов. Установить регулятор громкости на максимальный уровень, при котором фоновые шумы остаются незаметными.
  • Подключиться к веб-интерфейсу камеры, включить воспроизведение звука. Установить регулятор уровня в настройках камеры на максимальный уровень, при котором фоновые шумы остаются незаметными.
  • Подать питание на микрофон. Обеспечить тишину в месте нахождения микрофона.

Далее можно производить саму настройку. Ниже приведен алгоритм корректной настройки уровней сигнала в IP-камере и (если микрофон регулируемый) на самом микрофоне:

Алгоритм настройки уровней усиления

Выводы и рекомендации

Что в итоге можно посоветовать в итоге специалистам видеонаблюдения для решения задач аудиоконтроля? Прежде всего, разумеется, отталкиваться от поставленной задачи. Конкретно же – исходить из нижеследующих рекомендаций.

  1. При выборе места расположения микрофона следует размещать его поближе к контролируемым источникам звука.
  2. Использование кодеков семейства G7XX оправдано лишь в случае организации SIP-подключения к IP-домофонам.
  3. Если требуется контролировать конкретные объекты, расположенные в определенном месте (а не просто слушать все что происходит), следует выбирать направленные микрофоны, «покрывающие» именно контролируемые объекты.
  4. Камеры и ПО выбирать с поддержкой хотя бы одного «музыкального» кодека (AAC, MP2L2 и т.п.);
  5. При расчёте потоков и архивов учитывать выбор кодека и делать соответствующие поправки - оставлять запас порядка 40-320 кбит/с на каждый микрофон (точная цифра зависит от кодека в выбранных камере и ПО).
  6. При определении количества и расположения камер и микрофонов в одном помещении – уточнять возможность создания комбинированных каналов и микширования звука.
  7. При выборе внешних микрофонов и способов их питания – исходить из соображения минимизации длины подключаемых к микрофонам кабелей.

В нашем вебинаре мы рассказали о типовых сложностях, с которыми сталкиваются проектировщики систем видеонаблюдения при выборе решений для записи звука вместе с видеоизображением.

На канале VIDEOМАХ регулярно публикуются обучающие видео, демонстрации работы технологий, записи мероприятий.
Подпишитесь, чтобы быть в курсе новых технологий видеонаблюдения.Подпишись на канал

Обратить внимание

Наша компания бесплатно осуществляет услуги консалтинга по проектированию, в том числе и по вопросам аудио функций в системах IP-видеонаблюдения, а также проводит аудит спецификаций проекта, который избавит вас от рисков совершить ошибку при выборе проектного решения.

Прислать запрос можно на email: info@videomax.ru либо связаться с нами по бесплатному телефону 8 800 302-55-46.



Возврат к списку


pro-ip-video
pro-ip-video

Хотите обсудить эту тему с коллегами или задать вопрос напрямую вендору?

Присоединяйтесь к Телеграмм-группе "Клуб экспертов систем безопасности". В сообществе уже более 1000 участников и 36 вендоров
перейти в клуб
Комментарии к статье:
Загрузка комментариев...
Рекомендуем прочитать

Мы собираем статистику о посещениях сайта, cookie, данные об IP-адресе и местоположении. Если Вы не хотите, чтобы эти данные обрабатывались нами, Вы должны покинуть сайт.