Los próximos años verán cómo la automatización de voz se apodera de muchos aspectos de nuestras vidas. Aunque la voz no cambiará todo, será parte de un movimiento que anuncia una nueva forma de pensar acerca de nuestra relación con los dispositivos, pantallas, nuestros datos e interacciones.

Seremos más específicos para cada tarea y menos orientados hacia el programa. Pensaremos menos en los elementos y más en la experiencia colectiva del ecosistema de dispositivos del que forman parte. Disfrutaremos de las experiencias que hacen posible, no de las especificaciones que celebran.

En el nuevo mundo, espero que renunciemos a nuestro papel de los esclavos que hoy somos para volver a tener el control.

La voz no mata nada

La forma estándar en que llega la tecnología es aumentar más que reemplazar. La televisión no mató a la radio. VHS y luego las películas en streaming no mataron el cine. El microondas no destruyó la cocina.

La voz, más que cualquier otra cosa, es una forma para que las personas obtengan salidas y aporten entradas a las máquinas; Es un tipo de interfaz de usuario. Con el diseño de IU hemos tenido la era de las tarjetas perforadas en la década de 1940, los teclados de la década de 1960, el ratón de la computadora de la década de 1970 y la pantalla táctil de la década de 2000.

Los cuatro de estos mecanismos están disponibles hoy en día y, con la excepción de la tarjeta perforada, nos movemos libremente entre todos los tipos de entrada según el contexto. Las pantallas táctiles son terribles en los automóviles y en los equipos de gimnasia, pero son excelentes para hacer aplicaciones táctiles. Los ratones de computadora son excelentes para apuntar y hacer clic. Cada entrada hace cosas muy diferentes brillante y mal. Hemos aprendido a saber cuál es el mejor uso para cada uno.

La voz no matará a las marcas, no afectará las ventas de teclado ni los dispositivos con pantalla táctil, se convertirá en una forma adicional de hacer cosas; Es incremental, no canibalístico.

Necesitamos diseñar a su alrededor.

Nadie quería el ratón de la computadora antes de que fuera inventado. De hecho, muchos quedaron perplejos porque no tenía sentido en la era anterior, donde usábamos líneas de comando, no íconos visuales, para navegar. Al trabajar con Nokia en las pantallas táctiles antes del iPhone, la experiencia del usuario fue mala porque el sistema operativo no fue diseñado para ser táctil. 3D Touch sigue siendo patético porque pocos diseñadores de software se entusiasmaron y crearon para ello.

Lo que es emocionante de la voz es no usar formas de agregar la interacción de voz a los sistemas actuales, pero considerando nuevas aplicaciones / interacciones / casos de uso que nunca hemos visto.

En este momento, la carga recae sobre nosotros para ajustarse a las limitaciones de la voz, en lugar de que la voz trabaje en torno a nuestras necesidades.

Una gran nueva fachada.

¿Alguna vez has notado que la mayoría de los sitios web de computadoras de empresa son su peor interfaz digital? su sitio móvil es probablemente mejor y la aplicación móvil será la mejor. La mayoría de las aplicaciones de líneas aéreas, hoteles o bancos no ofrecen experiencias reducidas (como una vez fue el caso), sino su experiencia más rápida y elegante con la mejor funcionalidad. Lo que suele suceder es que las cosas nuevas se vuelven nuevas, las mejores personas y la mayor capacidad para generar cambios.

Sin embargo, la mayoría de las interfaces digitales todavía están diseñadas alrededor de los silos, flujos de trabajo y estructuras de la compañía que los creó. Los bancos pueden ofrecer ocho formas diferentes de enviar dinero a alguien o algo basado en sus departamentos; las cadenas hoteleras pueden pedirle que navegue por su marca de hotel, no por ubicación.

La realidad es que las personas están orientadas a la tarea, no a los procesos. Quieren un resultado y no les importa cómo. ¿Doy una mierda si es Amazon Grocery o Amazon Fresh o Amazon Marketplace? Ni un poco. La voz permite a las empresas crear una nueva interfaz sobre la basura heredada que heredaron. Puedo "enviar dinero a Jane hoy", no presionar 10 botones alrededor de su organigrama.

Requiere repensar

La primera vez que les mostré un ratón a mis padres y les dije que hicieran doble clic en él, pensé que estaban teniendo un ataque. El cursor se movería en sacudidas y a menudo se perdería. La misma consternación y desdén que una vez tuve por ellos, ahora siento cada vez que trato de usar la voz. Tengo que reprogramar mi cerebro para pensar en la información de una manera nueva y reconsiderar cómo funciona mi cerebro. Mientras esto suceda, tomará tiempo.

Lo que se vuelve interesante es lo que les sucede a los niños de 8 años que crecen pensando primero en la voz, lo que sucede cuando los países en desarrollo adoptan tabletas con voz y no computadoras de escritorio para educar. Cuando las personas crecen con algo, su comprensión nativa de lo que significa y lo que hace posible los cambios. Será fascinante ver qué será de este lienzo.

La voz como capa conectiva.

Seguimos siendo tontos y pensando en la voz como la forma de interactuar con la máquina "a" y no como un pegamento entre todas las máquinas. La voz es una forma intrínsecamente mala de obtener salidas; Si una imagen vale más que mil palabras, ¿cuánto tiempo tomará comprar una camiseta? El valor real de la voz es como una interfaz de usuario en todos los dispositivos. La publicidad en revistas debe ofrecer comandos de voz para obtener más información. Debería poder gritar en el carrusel de Netflix o en los anuncios de televisión para agregar productos a su lista de compras. La voz no será como "hacemos" cosas completas, será cómo disparamos o terminamos cosas.

Proactividad

Solo hemos asumido que hablamos con dispositivos primero. ¿Realmente quiero recordar el comando para encender las luces en el hogar y pronunciar seis palabras para que esto suceda? ¿Quiero estar siempre preguntando? Suponiendo que los dispositivos se seleccionan cuando hablan primero, es divertido ver qué sucede cuando la voz es proactiva. Imagina las posibilidades:

  • "Bienvenido a casa, ¿quieres que seleccione la iluminación de la noche?"
  • "Llegas tarde a una reunión, ¿debo ordenar a un Uber que te lleve allí?"
  • "Tu estación normal de bicicletas Citi no tiene bicicletas en este momento".
  • "Si bien parece soleado ahora, va a llover más tarde".

Automatización

Si bien muchos piensan que no queremos compartir información personal, hay suficientes indicios de que si obtenemos algo a cambio, confiamos en la compañía y hay transparencia, está bien. La voz no se desarrollará sola, avanzará junto con Google sugiriendo respuestas de correos electrónicos, Amazon sugiriendo cosas para comprar, Siri sugiriendo contextualmente aplicaciones para usar. Poco a poco nos acostumbraremos a la idea de subcontratar nuestro pensamiento y decisiones en parte a las máquinas.

Ya hemos subcontratado mucho no podemos recordar los números de teléfono, las direcciones, los cumpleaños, incluso confiamos en las imágenes para recordar nuestras experiencias, por lo que es natural que subcontratemos algunas decisiones.

El futuro a medio plazo a mis ojos es uno donde permitimos que se utilicen más datos para automatizar lo mundano. Muchos piensan que la voz le está pidiendo a Alexa que ordene baterías Duracell, pero es más probable que nunca piense en baterías o detergentes para la ropa u otros artículos de baja consideración ni en las suscripciones que se repondrán.

Hay una expresión de que una computadora nunca debe hacer una pregunta para la cual razonablemente puede deducir la respuesta. Cuando una tecnología está realmente aquí, no la vemos, ni notamos ni pensamos en ella. Los próximos años verán cómo la automatización de voz se apodera de muchos más aspectos de nuestras vidas. El futuro de la voz puede ser algunas oraciones largas y algunos comandos inteligentes, pero en su mayoría quizás sean simples gruñidos de sí.

Dejar respuesta

Please enter your comment!
Please enter your name here