Categories: NoticiasTecnología

Los SoCs de audio son vitales para las plataformas de activación por voz siempre activa y el dispositivo Edge AI

A medida que los dispositivos de asistente digital activados por voz continúan ganando popularidad, los SoC centrados en la inteligencia artificial y el audio evolucionan.

Los diseños inteligentes de procesamiento y detección están proliferando con la adopción de aplicaciones habilitadas para voz, como asistentes inteligentes, que incluyen funciones como comandos de voz y búsqueda por voz. Desde los teléfonos inteligentes, dispositivos portátiles, hasta una variedad de dispositivos de Internet de las cosas (IoT), las interfaces activadas por voz se están convirtiendo en estándar.

Con la creciente demanda de una mejor administración de energía y procesamiento de audio en estos dispositivos de asistente inteligente, los SoC (sistema en chips) necesitan mantenerse al día.

Crecimiento continuo del mercado de asistentes virtuales

Los asistentes virtuales han estado ganando terreno durante los últimos años. Parece que la mayoría de los gigantes de la tecnología han invertido en algún tipo de asistente: Apple tiene a Siri, Google tiene a Google Assistant, Microsoft tiene a Cortana y Samsung a Bixby. Algunas plataformas son de financiación colectiva, como la desarrollada por MATRIX Labs y, entre ellas, algunas son incluso de código abierto, como Mycroft. También hay jugadores internacionales, como la rusa Alice by Yandex y la china Duer by Baidu, ambas grandes y centradas en Internet de sus respectivos países.

Un caso más reciente es el del fabricante chino de teléfonos inteligentes OPPO, que ha integrado un asistente digital con capacidad de voz en su teléfono Reno recientemente lanzado. El nuevo teléfono inteligente está empleando un asistente inteligente llamado "Breeno" para acceder a servicios basados en inteligencia artificial (AI), computación en la nube y tecnologías de realidad virtual (AR). Breeno, que OPPO lanzó en su conferencia de desarrolladores en Beijing en diciembre de 2018, está dirigido a los escenarios de aplicaciones de la era 5G.

La funcionalidad de voz siempre activa en el nuevo teléfono inteligente de OPPO es impulsada por el SoC de audio DBMD4 de DSP Group que permite la activación y operación del dispositivo a través de comandos de voz mientras mantiene un consumo de energía ultra bajo. El procesador de audio / voz permite que el teléfono Reno acceda a Breeno a través de algoritmos de voz bidireccionales y de campo lejano de alta precisión para una experiencia de usuario natural.

El DBMD4. Imagen del resumen de datos.

Sin embargo, si bien las plataformas de activación de voz siempre activas abren muchas puertas a dispositivos equipados con micrófono, como un teléfono inteligente, al mejorar la interacción entre el hombre y la máquina, también puede ser un desgaste de la vida útil de la batería. Del mismo modo, ejecutar las capacidades de voz de campo lejano es más fácil decirlo que hacerlo. Aquí es donde, para todas las funciones de usuario final que se ofrecen en estos dispositivos, el hardware real se vuelve importante.

La necesidad de baja potencia y alta precisión en audio SoC

Ya hay un buen número de SoC disponibles para AI en dispositivos móviles. Desde la colección de hardware Snapdragon de Qualcomm hasta el chipset Kirin 980 de Huawei, hay muchos jugadores grandes trabajando para un procesamiento más inteligente en el dispositivo.

Sin embargo, la situación cambia cuando se habla específicamente de dispositivos de audio que funcionan con la interfaz de comandos de voz. Los problemas como el procesamiento de audio, el aprendizaje automático de reconocimiento de idiomas y la distribución de audio de baja latencia se convierten en consideraciones importantes para los diseñadores de dispositivos. Al agregar los desafíos de la funcionalidad y la movilidad siempre activas, se presentan los problemas de uso de energía y tamaño físico del chip.

Veamos el ejemplo de Breeno, que utiliza la plataforma de diseño SmartVoice construida alrededor del procesador de audio siempre activo DBMD4. El dispositivo DBMD4 incorpora las tecnologías Sensory Handsfree y Google hotword de Sensory para una implementación optimizada de las funciones de voz siempre activas.

Un gráfico visual de cómo Sensory ve el camino hacia la interacción precisa de voz con un dispositivo. Imagen de sensorial

De acuerdo con DSP Group, DBMD4 es el primer DSP con bloque de hardware de escucha de baja potencia de Sensory y que le permite brindar eficiencia de procesamiento para plataformas de activación de voz de baja potencia. En consecuencia, el chip de audio permite que los dispositivos operados por batería escuchen y detecten activamente la actividad de voz y los comandos en el modo de potencia ultra baja.

A continuación, DBMD4 incorpora un conjunto de algoritmos de mejora de voz que mejoran significativamente la experiencia del usuario y la precisión de las aplicaciones dirigidas por voz, particularmente en entornos de alto ruido. Aprovecha estos algoritmos para lograr un aislamiento más efectivo de la voz de los sonidos ambientales circundantes.

El chip DBMD4 también utiliza algoritmos de preprocesamiento para realizar tareas como la cancelación de eco acústico (AEC), el control automático de ganancia (AGC) y la formación de haces. Eso, a su vez, permite que el procesador de audio garantice la reducción de ruido en entornos ruidosos y proporcione precisión en los entornos de escucha de palabras.

El chip de audio de DSP Group viene con un marco de software complementario y un conjunto completo de controladores de Android para Lollipop 5.x. También es compatible con micrófonos digitales y analógicos y facilita una variedad de interfaces de procesador como SPI, I²C, UART, y SLIMbus.

Con un factor de forma de 1,8 x 2,1 mm, DSP Group afirma que su procesador de audio y voz siempre activo y de potencia ultra baja puede facilitar una amplia gama de servicios inteligentes personalizados en diseños móviles, portátiles e IoT.

Otro ejemplo de SoC para este espacio es el QCS400 de Qualcomm, anunciado en marzo. Donde el QCC5100 SoC de Qualcomm (anunciado en enero de 2018 en CES) se centró en los auriculares de bajo consumo, el QCS400 está diseñado específicamente para la inteligencia artificial y la calidad de sonido en el dispositivo para altavoces inteligentes.

El QCS400 de Qualcomm. Imagen de Qualcomm

Otras opciones de SoC de audio han incluido el SoC de audio BM94803AEKU de ROHM. En el pasado, también se ha ejecutado el SoC de audio digital TAS3308 de casi una década de TI, que TI recomienda a los diseñadores reemplazar con el códec estéreo TLV320AIC3256 cuando sea posible, ya que el TAS3308 solo está en producción para los clientes existentes.

¿Con qué otros SoC de audio estás familiarizado? ¿Estás de acuerdo en que la inteligencia artificial en el dispositivo será la próxima gran cosa? ¿Cuál es tu experiencia con el diseño de sistemas de audio de alta precisión? Comparte tus pensamientos en los comentarios a continuación.

Maria Montero

Me apasiona la fotografía y la tecnología que nos permite hacer todo lo que siempre soñamos. Soñadora y luchadora. Actualmente residiendo en Madrid.

Next Samsung podría estar trabajando en un nuevo teléfono con una pantalla envolvente »

Previous « Informe semanal de Tron: adopción de BitTorrent, aumento de Tron a medida que reina el mercado bajista

Published by

Maria Montero

7 years ago

Las principales noticias tecnológicas del lunes: la prohibición de clientes de terceros de Twitter parece no ser un accidente

Ilustración de Alex Castro / The Verge Plus nuevos rumores sobre el quinto Galaxy Fold.…

3 years ago

AirPods Max 2: aquí están las características más solicitadas

Se rumorea que los auriculares premium de próxima generación de Apple, los AirPods Max 2,…

3 years ago

El remake de Dead Space continúa luciendo terriblemente genial en el nuevo tráiler de la historia

El desarrollador Motive Studio y el editor EA han lanzado un nuevo tráiler de la…

3 years ago

Los SoCs de audio son vitales para las plataformas de activación por voz siempre activa y el dispositivo Edge AI

Crecimiento continuo del mercado de asistentes virtuales

El DBMD4. Imagen del resumen de datos.

La necesidad de baja potencia y alta precisión en audio SoC

Un gráfico visual de cómo Sensory ve el camino hacia la interacción precisa de voz con un dispositivo. Imagen de sensorial

El QCS400 de Qualcomm. Imagen de Qualcomm

Recent Posts

Máquina de mano Lean, Green, Raspberry Pi

Cómo pronosticar series de tiempo usando autorregresión

Aquí están todas las formas en que puede cargar su AirPods Pro

Las principales noticias tecnológicas del lunes: la prohibición de clientes de terceros de Twitter parece no ser un accidente

AirPods Max 2: aquí están las características más solicitadas

El remake de Dead Space continúa luciendo terriblemente genial en el nuevo tráiler de la historia

Los SoCs de audio son vitales para las plataformas de activación por voz siempre activa y el dispositivo Edge AI

Crecimiento continuo del mercado de asistentes virtuales

El DBMD4. Imagen del resumen de datos.

La necesidad de baja potencia y alta precisión en audio SoC

Un gráfico visual de cómo Sensory ve el camino hacia la interacción precisa de voz con un dispositivo. Imagen de sensorial

El QCS400 de Qualcomm. Imagen de Qualcomm

Related Post

Recent Posts

Máquina de mano Lean, Green, Raspberry Pi

Cómo pronosticar series de tiempo usando autorregresión

Aquí están todas las formas en que puede cargar su AirPods Pro

Las principales noticias tecnológicas del lunes: la prohibición de clientes de terceros de Twitter parece no ser un accidente

AirPods Max 2: aquí están las características más solicitadas

El remake de Dead Space continúa luciendo terriblemente genial en el nuevo tráiler de la historia