№8 / 2018 / статья 3

Микроконтроллеры STM32 теперь работают с голосовым сервисом Alexa

Пакет X-CUBE-VS4A, представленный компанией STMicroelectronics, стал первым на рынке примером ПО, позволяющим использовать в портативных устройствах на базе микроконтроллеров STM32 популярный голосовой сервис Alexa.

X-CUBE-VS4A – это первый пакет программного обеспечения, позволяющий использовать голосовой сервис Алекса (Alexa Voice Service, AVS) совместно с микроконтроллерами (МК). Популярные голосовые сервисы от Amazon, Apple или Google сегодня реализованы в умных аудиоколонках. Их последние и наиболее известные модели, схожие по дизайну, используют для связи с внешним миром беспроводной интерфейс. Такая схожесть часто связана с использованием мощного процессора приложений, который подключается к облачным сервисам и обрабатывает пересылаемые сообщения, но все-таки ограничивает реальные возможности разработчика. Поэтому X-CUBE-VS4A стал серьезным прорывом: этот пакет делает AVS доступным для использования в портативных устройствах и открывает для разработчиков возможность создания совершенно нового типа интеллектуальных устройств.

Компания STMicroelectronics сотрудничает с Amazon во многих сферах деятельности, и акцент на голосовой сервис Alexa выявляет новый этап партнерских отношений. Благодаря новому SDK – набору разработки программного обеспечения, производимому компанией Amazon, – разработчики смогут воспользоваться преимуществами API Amazon для добавления своим устройствам функции голосового управления и использования целого ряда преимуществ инфраструктуры, которая делает столь уникальными аудиоколонки Amazon Echo. AVS предлагает возможности, устанавливающие новый стандарт для всей отрасли. Голосовой сервис позволит управлять бытовой техникой, узнать прогноз погоды или срочно получить ответ на насущный вопрос в любое время суток. Благодаря использованию X-CUBE-VS4A станет намного проще реализовать AVS на небольших устройствах, так как для реализации приложений не нужны процессоры повышенной мощности.

Голосовой сервис Alexa: От МК к облаку

Пожалуй, наиболее заметное достижение X-CUBE-VS4A заключается в том, что она портирует для микроконтроллеров семейства STM32 протоколы, необходимые для подключения проектируемого устройства к облачной AVS, и все это оптимизировано некоторыми особенностями конфигурации аппаратных блоков микроконтроллеров ST. Например, библиотеки в X-CUBE-VS4A используют фирменные криптоядра для ускорения криптографических операций, что позволяет экономить энергию и увеличивать производительность. В настоящее время с этим пакетом программного обеспечения совместимы лишь компоненты STM32F7 и STM32H7, потому что текущая реализация AVS требует значительного объема памяти и вычислительных ресурсов. В будущем можно ожидать дальнейшей оптимизации AVS Amazon, а X-CUBE-VS4A в любом случае представляется серьезным достижением, так как впервые позволяет голосовому сервису эффективно работать на МК.

Очень часто разработчики предпочитают создавать свои системы на основе Linux, потому что там уже есть такие важные инструменты как стеки TCP/IP, что значительно упрощает разработку, в то время как выбор микроконтроллера иногда может означать создание проекта с нуля. Однако X-CUBE-VS4A предоставляет разработчикам все библиотеки, драйверы и стандартные подпрограммы, необходимые для выбранного компонента ST. Кроме того, в отличие от конкурирующих решений для популярных операционных систем, пакет программного обеспечения ST поможет группам разработчиков быстрее получить сертификационные права на AVS. Прежде чем компания сможет продавать продукт, который подключается к AVS, Amazon должен удостовериться, что эта система учитывает, помимо прочего, специфические запаздывания и протоколы, а X-CUBE-VS4A помогает продукции соответствовать этим требованиям.

От STM32F7 в AVS и обратно

Для того чтобы позволить разработчикам быстрее освоить некоторые из особенностей X-CUBE-VS4A, компания демонстрирует примеры применения на основе типового комплекта STM32F769 Discovery (рисунок 1). На этой плате размещен микроконтроллер STM32F769NIH6 с 512 кбайт ОЗУ и 2 Мбайт Flash-памяти. Ее также можно подключить к интернету через расширительную плату с доступом к Wi-Fi или через порт Ethernet. Наконец, STM32F769 Discovery имеет аудиоинтерфейс, необходимый для использования совместно с простым демонстрационным приложением. Плата Discovery контролирует звук в окружающем пространстве, используя для этого один из встроенных MEMS-микрофонов с круговой диаграммой направленности, и предварительно обрабатывает аудиосигнал, используя алгоритмы из пакета Sensory для распознавания речи и определения ключевых слов. Подобный принцип называют также аудиоинтерфейсом для взаимодействия с внешними объектами (audio front-end).

Рис. 1. Демонстрационный комплект STM32F769 DISCOVERY

Рис. 1. Демонстрационный комплект STM32F769 DISCOVERY

Если система определяет, что пользователь произнес ключевое для ее пробуждения слово (в данном случае – “Alexa”), библиотеки и инструменты из X-CUBE-VS4A отправляют чистый аудиобуфер к AVS в облаке и получают ответ от Amazon. Облачные серверы отправляют подтверждение того, что AVS понимает вопрос, а затем передают ответ в файле формата MP3. Разработчикам остается только добавить медиаплеер для воспроизведения ответа от Alexa или любого другого музыкального файла из потоковых сервисов, если они хотят предложить эту функцию  пользователям.

Что еще нужно?

Важно отметить, что X-CUBE-VS4A только портирует SDK аудиосервиса Alexa для микроконтроллеров семейства STM32. Следовательно, как и при использовании традиционных SDK AVS, инженерам, применяющим фирменный пакет программного обеспечения, по-прежнему будут требоваться дополнительные технологии для внешнего аудиоинтерфейса. Однако поскольку решение ST использует лицензированные алгоритмы Sensory, удастся сократить время этапов разработки и макетирования. Стоит учесть, что плата STM Discovery, использующая лишь один всенаправленный микрофон, не будет работать в зашумленной обстановке. Имеющийся вариант вполне подойдет для лабораторных условий, а компании, стремящиеся создать коммерческий продукт, будут использовать сторонние решения для интеграции технологий формирования диаграммы направленности, что поможет фиксировать голос пользователя даже при достаточно высоком уровне шумов.

X-CUBE-VS4A предлагает огромное преимущество при совместном использовании с микроконтроллерами голосового сервиса Alexa, гарантируя инженерам удобные стартовые условия и все функции, доступные из SDK AVS. Предоставленные ST примеры способны помочь разработчикам определить направления создания перспективных голосовых аудиоинтерфейсов. Добавление умного помощника в устройства с малым энергопотреблением никогда еще не было столь простым и удобным.

Оригинал статьи

Наши информационные каналы

О компании ST Microelectronics

Компания STMicroelectronics является №1 производителем электроники в Европе. Компоненты ST широко представлены в окружающих нас потребительских товарах – от iPhone до автомобилей разных марок. Лидеры индустриального рынка выбирают компоненты ST за их надежность и выдающиеся технические параметры. В компании ST работает 48 000 сотрудников в 35 странах. Производственные мощности расположены в 12 странах мира. Более 11 тысяч сотрудников заняты исследованиями и разработками – инновационное лидерство ...читать далее