Amazon, al igual que muchas otras empresas de tecnología que invierten mucho en inteligencia artificial, siempre ha sido sincero acerca de que su asistente de Alexa es un trabajo en progreso. “Cuantos más datos usamos para entrenar estos sistemas, mejor funciona Alexa y capacitar a Alexa con grabaciones de voz de una amplia gama de clientes ayuda a garantizar que Alexa funcione bien para todos”, lee la sección de Preguntas frecuentes de Alexa de la compañía.

Lo que la compañía no le dice explícitamente, como se destaca en una investigación en profundidad de Bloomberg publicado esta noche, es que una de las únicas, y a menudo las mejores, formas en que Alexa mejora con el tiempo es haciendo que los seres humanos escuchen las grabaciones de sus solicitudes de voz. Por supuesto, todo esto está enterrado en términos de productos y servicios que pocos consumidores leerán, y Amazon a menudo minimiza las implicaciones de privacidad de tener cámaras y micrófonos en millones de hogares en todo el mundo. Pero las preocupaciones acerca de cómo se capacita a la IA a medida que se convierte en una fuerza cada vez más generalizada en nuestra vida cotidiana solo continuarán generando alarmas, especialmente porque la mayoría de cómo funciona esta tecnología sigue siendo más allá de las puertas cerradas y mejora el uso de métodos que Amazon odia revelar.

En este caso, el proceso se conoce como anotación de datos, y se convierte silenciosamente en la base de la revolución del aprendizaje automático, que ha generado avances en el procesamiento del lenguaje natural, la traducción automática y el reconocimiento de imágenes y objetos. La idea es que los algoritmos de inteligencia artificial solo mejoran con el tiempo si los datos a los que tienen acceso se pueden analizar y clasificar fácilmente, no necesariamente pueden entrenarse para hacerlo. Quizás Alexa te escuchó incorrectamente, o el sistema cree que no estás preguntando por la ciudad británica de Brighton, sino por el suburbio en el oeste de Nueva York. Cuando se trata en diferentes idiomas, hay muchos más matices, como la jerga regional y los dialectos, que pueden no ser considerados durante el proceso de desarrollo del soporte de Alexa de ese idioma.

En muchos casos, los seres humanos hacen esas llamadas, escuchando una grabación del intercambio y etiquetando correctamente los datos para que puedan volver a ingresar al sistema. Ese proceso se conoce en términos generales como aprendizaje supervisado, y en algunos casos se combina con otras técnicas más autónomas en lo que se conoce como aprendizaje semiprotegido. Apple, Google y Facebook utilizan estas técnicas de manera similar, y tanto Siri como Google Assistant mejoran con el tiempo gracias al aprendizaje supervisado que requiere ojos y oídos humanos.

En este caso, Bloomberg está arrojando luz sobre el ejército de miles de empleados literales de Amazon, algunos contratistas y algunos trabajadores de tiempo completo, en todo el mundo que tienen la tarea de analizar las grabaciones de Alexa para ayudar a mejorar al asistente con el tiempo. Si bien ciertamente no hay nada inherentemente nefasto en este enfoque, Bloomberg señala que la mayoría de los clientes no se dan cuenta a menudo de que esto está ocurriendo. Además, hay espacio para el abuso. Las grabaciones pueden contener características obviamente identificables e información biográfica sobre quién está hablando. Tampoco se sabe durante cuánto tiempo se almacenan exactamente estas grabaciones, y si la información ha sido robada por un tercero malintencionado o mal utilizada por un empleado.

BloombergEl informe señala casos en los que algunos anotadores han escuchado lo que creen que podría ser una agresión sexual u otras formas de actividad delictiva, en cuyo caso Amazon cuenta con procedimientos para aplicar la ley. (Ha habido una serie de casos de alto perfil en los que se han utilizado los datos de voz de Alexa para procesar delitos). En otros casos, el informe dice que los trabajadores en algunas oficinas comparten fragmentos de conversaciones con compañeros de trabajo que les parecen graciosos o vergonzosos.

En un comunicado, Amazon dijo Bloomberg, “Solo anotamos una muestra extremadamente pequeña de las grabaciones de voz de Alexa en orden [sic] Mejorar la experiencia del cliente. Por ejemplo, esta información nos ayuda a capacitar a nuestros sistemas de reconocimiento de voz y comprensión del lenguaje natural, para que Alexa pueda comprender mejor sus solicitudes y garantizar que el servicio funcione bien para todos ". La compañía afirma que tiene" estrictas garantías técnicas y operativas, y tiene una política de tolerancia cero para el abuso de nuestro sistema ”. Los empleados no tienen acceso a la identidad de la persona que participa en la solicitud de voz de Alexa, y cualquier información de esa variedad se“ trata con alta confidencialidad ”y está protegida por“ factores múltiples ”. autenticación para restringir el acceso, el cifrado del servicio y las auditorías de nuestro entorno de control ".

Sin embargo, los críticos de este enfoque del avance de la IA han estado sonando alarmas sobre esto durante algún tiempo, generalmente cuando Amazon comete un error y accidentalmente envía grabaciones a la persona equivocada o revela que las ha estado almacenando durante meses o incluso años. El año pasado, una extraña y extremadamente compleja serie de errores en nombre de Alexa terminó enviando una conversación privada a un compañero de trabajo del esposo del usuario. En diciembre, un residente de Alemania detalló cómo recibió 1,700 grabaciones de voz de Amazon de acuerdo con una solicitud de datos GDPR, aunque el hombre no era dueño de un dispositivo Alexa. Analizando los archivos, periodistas de la revista alemana. Connecticut fueron capaces de identificar al usuario real que fue registrado simplemente utilizando información obtenida de sus interacciones con Alexa.

Amazon está buscando activamente formas de alejarse del tipo de aprendizaje supervisado que requiere una extensa transcripción y anotación. Cableado señaló en un informe a fines del año pasado acerca de cómo Amazon está utilizando nuevas técnicas más avanzadas como el llamado aprendizaje activo y el aprendizaje transferido para reducir las tasas de error y expandir la base de conocimientos de Alexa, aun cuando agrega más habilidades, sin necesidad de añade más humanos a la mezcla.

Ruhi Sarikaya de Amazon, el director de ciencia aplicada de Alexa, publicó un artículo en Científico americano a principios de este mes, titulado “Cómo aprende Alexa”, “donde detalla cómo el objetivo de este tipo de aprendizaje automático a gran escala siempre será reducir la cantidad de trabajo humano tedioso que se requiere para corregir sus errores. “En la investigación reciente de AI, el aprendizaje supervisado ha predominado. Pero hoy, los sistemas comerciales de inteligencia artificial generan muchas más interacciones con los clientes de las que podríamos comenzar a etiquetar a mano ", escribe Sarikaya. “La única manera de continuar con la tórrida tasa de mejora que la IA comercial ha brindado hasta ahora es reorientarnos hacia un aprendizaje semi-supervisado, débilmente supervisado y no supervisado. Nuestros sistemas necesitan aprender cómo mejorar ellos mismos ".

Por ahora, sin embargo, Amazon puede necesitar personas reales con conocimiento del lenguaje y la cultura humana para analizar esas interacciones de Alexa y darles un sentido. Esa incómoda realidad significa que hay personas allá afuera, a veces tan alejadas como India y Rumania, que te escuchan hablar con una IA sin cuerpo en tu sala de estar, dormitorio o incluso en tu baño. Ese es el costo de la conveniencia provista por AI, al menos a los ojos de Amazon.

1 Comentario

  1. […] Amazon, al igual que muchas otras empresas de tecnología que invierten mucho en inteligencia artificial, siempre ha sido sincero acerca de que su asistente de Alexa es un trabajo en progreso. “Cuantos más datos usamos para entrenar estos sistemas, mejor funciona Alexa y capacitar a Alexa con grabaciones de voz de una amplia gama de clientes ayuda a garantizar que Alexa funcione bien para todos”, lee la sección de Preguntas frecuentes de Alexa de la compañía. Lo que la compañía no […] Alexa de Amazon no es solo AI, miles de humanos están escuchando […]

Dejar respuesta

Please enter your comment!
Please enter your name here