Области применения инновационных МЭМС-микрофонов компании Infineon

14 марта 2022

системы безопасностипотребительская электроникаинтернет вещейInfineonстатьяпассивные ЭК и электромеханикаIoTУмный домМикрофоны

Джулиан Корнпробст, Сому Госвами (Infineon)

МЭМС-микрофоны XENSIV производства Infineon, имеющие меньший уровень шума и больший динамический диапазон, уже сейчас являются практически идеальным выбором во многих приложениях, требующих надежного и качественного распознавания аудиосигналов – системах дистанционного общения, слуховых аппаратах нового поколения, приборах для контроля состояния здоровья.

Платформы для телеконференций и системы с голосовым управлением очень сложно создать без высококачественных преобразователей акустических волн в электрические сигналы. На сегодняшний день микрофоны используются все в большем количестве оборудования, а к их характеристикам предъявляются все более специфические требования, начиная от размеров, стоимости, чувствительности и уровня искажений и заканчивая устойчивостью к воздействию влаги и пыли. В этой статье рассмотрены основные области применения МЭМС-микрофонов XENSIV, разработанных компанией Infineon. Ключевой особенностью этого семейства является развитый модельный ряд, содержащий как недорогие модели, предназначенные для оборудования общего назначения, так и высококачественные дорогие устройства, используемые в системах, критичных к качеству звука.

Голосовое управление все чаще используется вместо традиционных интерфейсов на основе кнопок и переключателей. И это неудивительно, ведь подобный вид взаимодействия для человека является естественным и интуитивно понятным. Микрофоны уже давно перестали быть специфическими компонентами аудиотехнических систем – сегодня они встраиваются в оборудование, не имеющее никакого отношения к обработке звука. Согласно прогнозам компании SAR Insight [1], в 2023 году в мире будет использоваться более 6 миллиардов устройств с интегрированными микрофонами, в том числе – техника, предназначенная для обработки биометрических данных, оборудование с голосовым управлением и разнообразные цифровые помощники. А продолжающаяся пандемия коронавируса Covid-19 открыла две новые области применения микрофонов: платформы для дистанционного общения и системы контроля здоровья людей, находящихся в общественных местах.

Потребность в дистанционном общении возникла вследствие перехода многих людей на удаленную форму работы. С началом действия карантинных ограничений виртуальные площадки во многих случаях становились единственным способом встреч с коллегами, друзьями и родственными (рисунок 1). В этом случае обеспечение высококачественного звука и использование расширенных алгоритмов обработки аудиосигналов стало эффективным способом уменьшения ощущаемой дистанции и снижения уровня дискомфорта, что является очень важным в период ограниченного количества личных встреч.

Рис. 1. Использование высококачественных микрофонов позволяет значительно улучшить качество видеоконференций

Рис. 1. Использование высококачественных микрофонов позволяет значительно улучшить качество видеоконференций

Для платформ дистанционного общения обеспечение хорошего качества звука во многих случаях является более приоритетным, чем формирование четкого изображения. Вспоминая опыт общения с использованием таких платформ как Zoom или Skype, можно заметить, что низкое качество звука раздражает намного больше, чем размытое изображение, в то время как качественный звук воспринимается как само собой разумеющееся. Таким образом, основная цель аудиосистемы любой платформы для дистанционного общения заключается в обеспечении естественного звучания, что при использовании некачественных микрофонов реализовать просто невозможно.

Однако возможности современного оборудования для видеоконференций уже давно не ограничиваются только передачей аудио- и видеосигналов. Новые модели интеллектуальных видеокамер могут автоматически масштабировать изображения, приближая людей или объекты, находящиеся в фокусе общения. Они также могут поворачиваться вслед за говорящим человеком и удерживать в поле зрения объектива группу людей. Современные алгоритмы позволяют выделить и усилить человеческий голос даже на фоне достаточно сильного шума. Новые технологии обработки сигналов, получаемых одновременно с нескольких источников, могут сформировать из микрофонов фазированную антенную решетку с узкой диаграммой направленности, что позволит выделить голос нужного человека, даже если несколько человек в одном помещении будут говорить одновременно. Таким образом, современные платформы дистанционного общения являются высокоинтегрированными системами, содержащими не только камеры, микрофоны и громкоговорители, но и большой набор программного обеспечения, основанного на сложных алгоритмах.

Приложения с потребностью в высококачественных микрофонах

Видеоконференции уже давно вышли из категории инструментов для делового мира. На сегодняшний день не является экзотикой виртуальный сбор членов семьи на праздники или в рамках ежедневного общения. Современные социальные сети, например, портал Facebook, позволяют размещать аудио- и видеоматериалы, аудиоряд которых должен иметь, как минимум, хорошее качество, не говоря уже об использовании специализированных эффектов.

Однако кроме развлечений, хороший звук нужен и для других, более насущных, приложений. Например, уже сейчас в больницах и домах престарелых используются роботы, понимающие человеческую речь. В совокупности с использованием множества других датчиков, такая техника может обеспечить качественный уход за людьми с ограниченными возможностями, требующими повышенного внимания.

Еще одной категорией устройств, имеющих непосредственное отношение к интеллектуальной обработке аудиосигналов, являются беспроводные наушники, использующие технологию True Wireless Stereo (TWS), ставшую основой для слуховых аппаратов нового поколения. На сегодняшний день кроме своей прямой функции – воспроизведения речевых и музыкальных потоков – эти устройства обеспечивают множество других сервисов, в реализации которых компактные высокочувствительные микрофоны играют ключевую роль.

Беспроводные наушники TWS соединяются друг с другом и ведущим устройством, например, смартфоном, через интерфейс Bluetooth. Однако из-за малых размеров, не позволяющих обеспечить качественную звукоизоляцию от внешнего мира, при их использовании в шумных местах приходится увеличивать уровень громкости, что негативно влияет на слух. Для предотвращения этого во многих моделях наушников TWS реализована функция активного шумоподавления (Active Noise Cancellation, ANC), первоначально разработанная для снижения шума двигателей внутри салонов самолетов. Использование наушников с функцией ANC позволяет значительно уменьшить уровень фонового шума, существующего как в помещениях, так и на открытых пространствах. Кроме того, специализированная обработка сигналов, поступающих со встроенных в каждый наушник массивов микрофонов, позволяет сфокусировать аудиоканал в определенном направлении, что дает возможность нормально разговаривать с собеседником даже в очень шумных местах.

Однако полная акустическая изоляция от внешнего мира в некоторых случаях может быть нежелательной и даже опасной. Поэтому сейчас многие производители беспроводных наушников TWS кроме сервиса активного шумоподавления реализовывают в них специализированные режимы «прозрачного прослушивания», в которых звуки внешнего мира, воспринимаемые микрофоном, переизлучаются динамиками наушников вместе с воспроизводимой музыкой, а иногда и вместо нее. Режимы прозрачного прослушивания являются настраиваемыми, поэтому пользователь может сам выбирать, какие из звуков окружающего мира ему необходимо слышать: шум приближающегося автомобиля, разговоры других людей или объявления на вокзалах. Реализованы даже алгоритмы, автоматически активизирующие режимы прозрачного прослушивания при произнесении имени владельца наушников. На сегодняшний день многие из этих функций пока еще находятся на стадиях разработки и тестирования, однако в будущем подобная техника, скорее всего, будет интегрироваться и с другими интеллектуальными системами, например, с информационной системой вокзалов или аэропортов, что позволит прослушивать сообщения даже без объявления их по громкой связи.

Еще одной областью использования высококачественных компактных микрофонов, установленных в беспроводных наушниках, является поддержка функции записи в формате 360⁰. Эта технология позволяет создавать аудиозаписи, полностью погружающие человека в записанную обстановку, и ощутить себя на настоящем концерте. Очевидно, что для этого должны использоваться только высококачественные микрофоны, обладающие характеристиками, не уступающими человеческому уху.

Таким образом, микрофоны являются важным компонентом современных устройств. Ключевыми требованиями, предъявляемыми к приборам этого класса, являются малый уровень шума, низкий уровень искажений, а также малые размеры и вес, поскольку в современных приложениях для больших микрофонов просто не будет места (рисунок 2). Именно такую комбинацию характеристик и обеспечивают компактные МЭМС-микрофоны XENSIV, производимые компанией Infineon.

Рис. 2. Примеры функций, реализуемых с помощью малогабаритных микрофонов

Рис. 2. Примеры функций, реализуемых с помощью малогабаритных микрофонов

Контроль состояния здоровья

Контроль основных показателей жизнедеятельности человека, в первую очередь – температуры тела, позволяет выявить инфекционные заболевания на ранних стадиях и, за счет своевременного начала лечения, значительно снизить риск появления осложнений и длительной утраты работоспособности. В большинстве случаев температуру тела человека можно измерить бесконтактным способом с помощью датчиков, чувствительных к инфракрасному излучению. Однако такие приборы могут иметь достаточно большие размеры, поэтому их применение в компактных приложениях не всегда возможно.

Одним из вариантов сокращения размеров измерительной системы устройств, позволяющих контролировать состояния здоровья человека, является комбинация нескольких датчиков в одном корпусе. В данном случае компания Infineon объединила в одном корпусе высокочувствительный МЭМС-микрофон и датчик температуры, что позволило еще больше расширить функциональность беспроводных TWS-наушников с функциями активного шумоподавления. Теперь, прослушивая музыку или общаясь с другими людьми, пользователь будет уверен, что его состояние здоровья находится под контролем, и если температура его тела вдруг начнет повышаться, то смартфон сгенерирует необходимое сообщение еще до появления первых симптомов простуды.

Контроль состояния здоровья людей в общественных местах

Ученые из Массачусетского университета, расположенного в городе Амхерсте, США, разработали инновационную систему, позволяющую обнаруживать в общественных местах людей, больных инфекционными заболеваниями. Система FluSense (дословно – «Детектор гриппа») состоит из трех компонентов: камеры, микрофона и компьютера (рисунок 3). Она способна определить приблизительное количество людей, имеющих повышенную температуру и кашель, что позволит заблаговременно выявлять вспышки гриппоподобных заболеваний без применения лабораторных исследований, требующих длительного времени и дорогих реактивов.

Рис. 3. Основные компоненты системы FluSense (Источник: Массачусетский университет)

Рис. 3. Основные компоненты системы FluSense (Источник: Массачусетский университет)

На сегодняшний день система FluSense была успешно испытана в медицинских учреждениях, где она распознавала неречевые звуки, издаваемые пациентами, в первую очередь – кашель, сопоставляя полученную информацию с количеством людей, имеющих повышенную температуру, выявленных с помощью инфракрасной камеры. Кроме этого, система была интегрирована с базой данных медицинских учреждений, из которой она получала информацию о количестве зарегистрированных больных. Использование систем, аналогичных FluSense, позволяет выполнять прогнозирование эпидемиологической ситуации в разных демографических группах населения крупных городов и своевременно принимать меры для предотвращения массового распространения инфекционных заболеваний.

Источниками первичной информации для системы FluSense являются массив недорогих микрофонов и камера, чувствительная к инфракрасному излучению, информация с которых обрабатывается с помощью одноплатного компьютера Raspberry Pi. Основной анализ полученных данных производится с помощью блока нейронных сетей Intel Movidius. Система FluSense не использует персональную информацию – все данные являются обезличенными и не привязаны к конкретным людям.

Выявление кашля производится с помощью специализированных алгоритмов и программного обеспечения, поддерживающих технологию глубокого обучения. На сегодняшний день система FluSense способна распознать звуки кашля в реальном времени с вероятностью 87%. Следующим этапом станут испытания ее в неклинических условиях – в помещениях ресторанов, учебных классов и общественном транспорте, а для этого, возможно, потребуется установить более чувствительные микрофоны.

Основные параметры микрофонов

Одним из основных параметров любого микрофона является динамический диапазон (Sound Pressure Levels, SPL), нижний порог которого ограничен уровнем собственных шумов, а верхний – точкой акустической перегрузки (Acoustic Overload Point, AOP). Уверенно распознать звук можно только при условии, что его уровень будет больше уровня шума. Это значит, что при использовании микрофона с уровнем собственного шума 30 дБ, распознать человеческий шепот с уровнем, не превышающим 25 дБ, будет крайне тяжело. Таким образом, использование микрофонов с высоким отношением сигнал-шум (Signal-to-Noise Ratio, SNR) является обязательным условием для работы со слабыми акустическими сигналами.

Отношение сигнал-шум SNR и уровень акустической перегрузки AOP являются ключевыми параметрами любого микрофона. Однако в современных устройствах уже давно в качестве датчика акустических сигналов используются несколько микрофонов, объединенных в микрофонный массив. Например, в смартфонах обычно используются массивы из трех или четырех микрофонов, а в беспроводных TWS-наушниках может быть установлено до шести микрофонов – по три в каждом приборе. Еще большее количество микрофонов может использоваться в системах, предназначенных для телеконференций – там их общее число может достигать 32. При таком подходе общие свойства микрофонного массива уже становятся зависимыми не только от параметров единичных микрофонов, а еще и от их отклонения из-за естественного технологического разброса. Для обеспечения хороших характеристик микрофонного массива необходимо, чтобы все микрофоны имели приблизительно одинаковую чувствительность и одинаковую фазо-частотную характеристику. Использование микрофонных массивов позволяет ощутимо повысить чувствительность, уменьшить уровень нелинейных искажений и собственных шумов. Хорошим сравнением для понимания разницы между использованием одного микрофона и микрофонного массива, является просмотр фильма в обычном разрешении (один микрофон) и качестве Full HD (микрофонный массив). 

Качество первичного сигнала

Виртуальные помощники, такие как Siri и Alexa, являются примерами голосовых интерфейсов управления (Voice User Interfaces, VUI), используемых, например, в интеллектуальных акустических колонках. Типовой голосовой интерфейс состоит из массива микрофонов, формирующих аудиоданные, которые потом распознаются процессором. Таким образом, первичный сигнал, полученный от микрофонов с высоким отношением сигнал-шум, будет содержать больше полезной информации, что сделает его последующую обработку более эффективной и качественной. Для систем VUI это эквивалентно увеличению числа распознанных команд и меньшему количеству ложных пробуждений системы. Таким образом, при установке в умные колонки более качественных микрофонов пользователю придется меньше повторяться.

Каждый из параметров микрофона имеет свое значение и может быть критичным для определенных приложений (рисунок 4). Использование микрофонов с высоким отношением «сигнал-шум» позволяет, например, лучше распознавать человеческий шепот, поэтому этот параметр является критичным для приложений с голосовым управлением, в том числе и для интеллектуальных колонок, а также для систем, используемых для дистанционного общения. Результаты исследований, проведенных компанией Infineon, показали, что использование микрофонов с высоким отношением сигнал-шум позволяет на 40% лучше распознавать слова, сказанные шепотом, чем в случаях применения для этой цели обычных микрофонов.

Рис. 4. Ключевые параметры микрофонов, критичные для различных приложений

Рис. 4. Ключевые параметры микрофонов, критичные для различных приложений

Широкий динамический диапазон является ключевым параметром для микрофонов, предназначенных для записи концертной музыки. Подобные аудиосистемы должны также иметь возможность подавления эха и акустической положительной обратной связи, возникающей из-за близкого расположения микрофона и динамика. А вот для микрофонных массивов важным является идентичность характеристик микрофонов, входящих в их состав, особенно для систем с регулируемой диаграммой направленности. Таким образом, для высокоизбирательных систем с высокой чувствительностью, способных подавлять эхо и нежелательные акустические связи, необходимы самые лучшие микрофоны, существующие в каталогах производителей.

Помимо обеспечения требуемых акустических и электрических параметров, микрофоны еще должны быть устойчивы к воздействию пыли и влаги. Не следует забывать также и о необходимости их надежной работы в требуемых диапазонах рабочих температур, влажности, давления и прочих параметров окружающей среды.

В идеальном случае микрофоны не должны создавать никаких собственных шумов и иметь чувствительность не хуже, чем у человеческого уха. Однако в реальности существуют определенные технические ограничения, определяемые физическими законами. В МЭМС-микрофонах различают четыре источника шума: микроэлектромеханическая (МЭМС) система, корпус микрофона, звуковой порт и специализированная микросхема, выполняющая усиление и обработку первичного сигнала (Application-Specific Integrated Circuit, ASIC). В современных микрофонах наибольший шум создает МЭМС-элемент, поэтому технология его изготовления является ключевым фактором, обеспечивающим высокие технические характеристики. Понимая это, компания Infineon разработала инновационные МЭМС-элементы с герметичной двойной мембраной, параметры которых значительно превосходят лучшие в своем классе системы с двумя неподвижными обкладками.

Устройство МЭМС-микрофона

Типовой МЭМС-микрофон состоит из МЭМС-элемента и микросхемы ASIC. МЭМС-элемент преобразовывает колебания давления воздуха в электрический сигнал, который затем обрабатывается электронными узлами ASIC, формирующей выходной электрический сигнал в аналоговом или цифровом виде. Первая проблема, с которой сталкиваются производители МЭМС-микрофонов, заключается в обеспечении требуемого уровня нелинейных искажений, которые могут возникнуть при большой амплитуде колебаний МЭМС-элемента, возникающей при громких звуках. Вторая проблема заключается в микросхеме ASIC, которая должна обеспечить обработку сигнала в широком динамическом диапазоне при уровне нелинейных искажений, не превышающем 1%, поскольку более высокий уровень искажений может привести к некорректной работе последующих узлов аудиосистемы.

До недавнего времени лучшие модели микрофонных МЭМС-элементов состояли из одной подвижной мембраны, расположенной между двумя неподвижными пластинами (Dual-Backplate Technology, DBP). Такая конструкция имеет минимальный уровень искажений во многом благодаря ее симметричности. Однако тот же эффект может быть получен и при использовании двух подвижных мембран, расположенных по обеим сторонам неподвижной пластины.

Использование технологии DBP позволило значительно улучшить характеристики МЭМС-микрофонов, по крайне мере, по сравнению с использовавшейся в то время технологией с одной мембраной и одной неподвижной пластиной. Дальнейшим развитием микрофонных МЭМС-элементов стала технология с герметичной двойной мембраной (Sealed Dual-Membrane Technology, SDM) (рисунок 5). Герметизация внутренней полости МЭМС-системы позволила значительно уменьшить уровень собственных шумов – с 70 до 75 дБ. Это позволило также увеличить до 135 дБ максимальный уровень сигнала, способного восприниматься таким элементом без искажения. Первые прототипы МЭМС-микрофонов нового поколения уже прошли тестирование в приложениях с расширенными аудиофункциями, а в конце 2020 года компания Infineon представила несколько микрофонов нового поколения, рассчитанных для использования в ультракомпактных приложениях с ограниченным объемом.

Рис. 5. Устройство МЭМС-микрофона, изготовленного по технологии Sealed Dual-Membrane

Рис. 5. Устройство МЭМС-микрофона, изготовленного по технологии Sealed Dual-Membrane

Заключение

Количество используемых микрофонов будет расти с каждым годом, а требования, предъявляемые к ним, будут только ужесточаться. Рано или поздно наступит момент, когда характеристик даже самых лучших микрофонов, построенных по традиционным технологиям, уже окажется недостаточно для обеспечения требуемого качества звука на очередной видеоконференции или для обеспечения требуемого уровня понимания новой версии интеллектуального холодильника. Поэтому МЭМС-микрофоны XENSIV, имеющие меньший уровень шума и больший динамический диапазон, уже сейчас являются практически идеальным выбором для многих приложений, требующих для своей работы надежного и качественного распознавания аудиосигналов.

Источники информации

  1. Digital and Voice Interface Forecast, October 2018

Оригинал статьи

Перевел Александр Русу по заказу АО Компэл

•••

Наши информационные каналы

О компании Infineon

Компания Infineon является мировым лидером по производству силовых полупроводниковых компонентов, а также занимает ведущие позиции по производству автомобильной полупроводниковой электроники и смарт-карт. В 2015 году компания Infineon приобрела компанию International Rectifier, тем самым значительно усилив свои лидирующие позиции в области силовой электроники. Это сочетание открывает новые возможности для клиентов, так как обе компании превосходно дополняют друг друга благодаря высокому уровню р ...читать далее

Товары
Наименование
IM73A135V01XTSA1 (INFIN)
IM69D130V01XTSA1 (INFIN)
IM69D130 (INFIN)
IM69D130V01 (INFIN)
IM69D120V01XTSA1 (INFIN)