MEMS-микрофон XENSIV от Infineon – новый уровень производительности аудиосистемы

16 апреля

телекоммуникациисистемы безопасноститерминалы продажавтомобильная электроникапотребительская электроникаавтоматизацияинтернет вещейInfineonстатьяпассивные ЭК и электромеханикасредства разработки и материалы

MEMS-микрофон XENSIV™ производства компании Infineon обеспечивает высококачественную запись звука и высокий уровень распознавания голосового сигнала для любого устройства.

Популярность голосовых пользовательских интерфейсов и использование аудиозаписей для обмена информацией набирает обороты, однако недостаточно высокие технические параметры микрофонов часто ограничивают возможности современных устройств. Компания Infineon выпустила новый MEMS-микрофон XENSIV™ IM69D130, который открывает новый уровень производительности и преодолевает существующие ограничения аудиосистем. IM69D130 разработан для приложений, где требуются малый уровень собственных шумов (высокий SNR), широкий динамический диапазон, малые искажения и высокая перегрузочная способность. Все эти характеристики обеспечивают точное распознавание голоса на недоступном ранее уровне.

Рынок микрофонов на основе микроэлектромеханических систем (MEMS) в последние годы значительно вырос. MEMS-микрофоны используются в таких приложениях как мобильные телефоны, камеры, системы безопасности, цифровые голосовые помощники, роботы, телевизоры, ноутбуки, наушники, умные бытовые приборы и автомобильная техника. Они обладают многими уникальными преимуществами по сравнению с традиционными электретными конденсаторными микрофонами (ECM). Микрофоны на основе MEMS имеют меньший размер при той же производительности, в них предусмотрено согласование амплитуды и фазы между аудиосигналами нескольких микрофонов. Кроме того, технология MEMS устойчива к высоким температурам и пайке, что позволяет автоматизировать процесс сборки печатных плат.

Оптимальное качество звука для распознавания речи в голосовых пользовательских интерфейсах

Звук улавливается цифровыми системами совсем не так, как его воспринимают человеческие уши, и, следовательно, оптимальное качество звука для цифровых систем также отличается от такового для человека. Оптимальный сигнал для алгоритмов не обязательно должен звучать естественно, но, независимо от варианта использования, всегда важно, чтобы в сигнале не было помех, искажений и шума.

Автоматическое распознавание речи (ASR) – это процесс автоматического преобразования речевого сигнала в письменные слова. Точность транскрипции ASR уже максимально приближена к человеческому уровню, который в настоящее время составляет примерно 95%. Однако в случае ASR данного уровня удалось достичь только в лабораториях, где условия окружающей среды являются благоприятными.

Необходимо стремиться к тому, чтобы голосовой пользовательский интерфейс работал безошибочно, был простым и удобным для конечного пользователя. Разработчики системы должны учитывать реальные условия использования. Например, как далеко пользователь может находиться от микрофона и каков ожидаемый уровень фонового шума. Только в этом случае можно спроектировать устройство с максимально возможной производительностью.

Распознавание речи в реальных условиях, особенно когда микрофон находится на значительном расстоянии от пользователя, обычно связано с такими проблемами как фоновый шум, реверберация и эхоподавление. По этой причине недостаточно иметь хороший механизм распознавания речи – каждый элемент в системе должен работать на максимально возможном уровне. Задача микрофона – обеспечить систему распознавания речи наилучшим входным сигналом. Высокое качество входного сигнала помогает системе ASR анализировать входящий звук и находить в нем характеристики, которые позволяют распознавать речевой контент. Критическими параметрами для системы являются шум, искажение, частотная и фазовая характеристики.

Системы распознавания речи в шумной обстановке становятся более совершенными, если микрофон имеет высокую точку акустической перегрузки (AOP). Иногда сам речевой сигнал негромкий, и есть другие звуки, вызывающие помехи. Например, акустические системы, стоящие рядом с микрофонами в управляемых речью домашних развлекательных комплексах, или цифровые помощники, транслирующие громкую музыку или произносимую информацию.

Высокая AOP помогает снизить искажения и улучшить подавление шума и эхо-сигналов. Чем больше расстояние до источника речи, тем ниже будет отношение «сигнал/шум» (SNR) для сигнала, подаваемого в алгоритм ASR. Следовательно, SNR микрофона должно быть выше, если предполагаемый радиус захвата звука больше.

Качество захвата аудио и видео, а также аудиосвязь можно улучшить, исключив из сигнала нежелательные звуки. Цель состоит в том, чтобы увеличить SNR, который в этом случае является отношением полезного звукового сигнала к любым нежелательным окружающим звукам или шуму. Шумоподавление может быть реализовано при использовании нескольких микрофонов в сочетании с алгоритмами цифровой обработки.

Направленные микрофонные системы могут концентрировать чувствительность микрофонов в нужном направлении и выделять необходимые источники звука. Нежелательные звуки можно исключить, используя разность уровня сигнала между двумя микрофонами. Более сложной системой шумоподавления является слепое разделение источников. Эта система позволяет подавлять шум, независимо от ориентации в пространстве, расстояния и местоположения. Все методы шумоподавления работают более точно при лучшем качестве входного сигнала. Микрофон должен иметь высокое SNR, малые искажения, плоскую частотную характеристику, которая также улучшает фазовые показатели, и малые значения групповой задержки.

Сравнительный анализ распознавания голосовых команд

Технология MEMS от Infineon (рисунок 1) основана на миниатюрной симметричной конструкции микрофона, аналогичной тем, которые используются в студийных конденсаторных микрофонах. Такая конструкция приводит к высокой линейности выходного сигнала в динамическом диапазоне 105 дБ. Минимальный уровень шума микрофона составляет 25 дБ [A] (69 дБ [A] SNR), а искажения не превышают 1% даже при уровнях звукового давления 128 дБ SPL (AOP 130 дБ SPL). Это означает, что захват голосовых команд без искажений возможен даже во время воспроизведения музыки через громкоговоритель.

Рис. 1. Технология Infineon с двумя задними панелями основана на миниатюрной симметричной конструкции

Рис. 1. Технология Infineon с двумя задними панелями основана на миниатюрной симметричной конструкции

Плоская частотная характеристика (низкочастотный спад 28 Гц) и малые производственные допуски приводят к точному согласованию фаз микрофонов, что необходимо при использовании их массива.

Благодаря одинаковой чувствительности (±1 дБ) и согласованию фазы (±2°@1 кГц) IM69D130 поддерживает сверхточное формирование звукового сигнала, что позволяет использовать усовершенствованные аудиоалгоритмы с высокопроизводительными пользовательскими интерфейсами для захвата аудиосигнала на больших расстояниях (рисунок 2).

Рис. 2. Точность аудиосигнала IM69D130 даже при высоких уровнях звукового давления

Рис. 2. Точность аудиосигнала IM69D130 даже при высоких уровнях звукового давления

Его цифровой интерфейс PDM (модуляция плотности импульса) отменяет необходимость в использовании аналоговых компонентов. Также не требуется защита от РЧ-сигналов на печатной плате и уменьшается количество необходимых линий данных в конструкциях с несколькими микрофонами.

В сочетании с продвинутыми алгоритмами обработки аудиосигнала IM69D130 обеспечивает первоклассный цифровой поток входных необработанных данных и может справиться даже с такими сложными случаями как распознавание голоса на больших расстояниях или распознавание шепота (рисунок 3).

Рис. 3. IM69D130 устанавливает новый эталон для захвата звука (показан типичный фазовый отклик IM69D130)

Рис. 3. IM69D130 устанавливает новый эталон для захвата звука (показан типичный фазовый отклик IM69D130)

Краткий словарь/Принципы работы микрофона

В качестве датчика микрофон преобразует волны звукового давления в электрические сигналы. Однако не все микрофоны имеют одинаковую производительность, и несколько параметров являются ключевыми в определении их пригодности для применения.

Отношение «сигнал/шум» (SNR)

Шум на выходе микрофона – это любые посторонние сигналы, которые не поступают от предполагаемого источника входного сигнала. Шум может возникать в окружающей среде или генерироваться внутри самого микрофона, и чем выше его уровень, тем ниже качество аудиосигнала.

Есть несколько разных способов выражения шума:

  • собственный шум – это шум, создаваемый самим микрофоном, когда отсутствует звуковой сигнал, обычно выражается в Vrms, dBV или dBFS;
  • эквивалентный входной шум (EIN) – это предполагаемый уровень акустического шума, который соответствует уровню электрического шума на выходе микрофона, выраженный в dBSPL;
  • отношение «сигнал/шум» (SNR) – это мера собственного шума микрофона относительно предполагаемого или желаемого входного сигнала, выраженная в дБ;
  • суммарный коэффициент гармонических искажений (THD) – это отношение энергии в гармониках с добавленным искажением (обычно со второй по пятую) к энергии в фундаментальной гармонике, выраженное в процентах. Поскольку микрофоны, как и любые другие датчики реального мира, являются нелинейными, это означает, что они вносят искажения. THD;
  • точка акустической перегрузки (AOP) обычно определяется как точка, в которой THD не превышает 10%, хотя в более требовательных приложениях AOP иногда может определяться как точка, в которой THD не превышает 1%.
•••

Наши информационные каналы

О компании Infineon

Компания Infineon является мировым лидером по производству силовых полупроводниковых компонентов, а также занимает ведущие позиции по производству автомобильной полупроводниковой электроники и смарт-карт.  В 2015 году компания Infineon приобрела компанию International Rectifier, тем самым значительно усилив свои лидирующие позиции в области силовой электроники. Это сочетание открывает новые возможности для клиентов, так как обе компании превосходно дополняют друг друга благодаря высокому уровню ...читать далее

Товары
Наименование
IM69D120V01XTSA1 (INFIN)
IM69D130V01XTSA1 (INFIN)
IM69D130V01 (INFIN)
EVAL_IM69D120_FLEXKIT (INFIN)
EVALIM69D120FLEXKITTOBO1 (INFIN)
EVAL_IM69D130_FLEXKIT (INFIN)
EVALIM69D130FLEXKITTOBO1 (INFIN)
S2GOMEMSMICIM69DTOBO1 (INFIN)
EVALAUDIOHUBV01TOBO1 (INFIN)