👋🏻 Hey folks
Esta semana Iris abre el melón de las interfaces de voz y de cómo han ido evolucionando a conversaciones cada vez más humanas y cuidadas. Además, nos presenta una serie de técnicas y metodologías muy útiles a la hora de enfrentarnos al diseño de una VUI.
✨ We are all ears ✨
La comunidad también estuvo muy activa, compartiendo herramientas y apps que nos facilitan los quereseres diarios y nos permiten sobrevivir un poco mejor a ese constante aluvión de noticias y estímulos. ¡Esperamos que las disfrutéis! 💙
El arte de la conversación: cómo diseñar una VUI eficaz
por Iris A. Ríos
No he podido evitar recordar este catastrófico anuncio al escribir este post. Risas aparte, en los últimos años, nos hemos acostumbrado a la idea de la tecnología de voz: Alexa, Siri, Cortana... pero llevamos décadas soñando con este tipo de interacciones por voz. Han aparecido en el cine, la televisión y la literatura, desde HAL 9000 en “2001: Odisea en el espacio”, el emblemático ordenador de la nave de “Star Trek”, el ordenador de a bordo “Eddie” y el superordenador Deep Thought de “La guía del autoestopista galáctico”. La gente lleva mucho tiempo prediciendo el auge de las interfaces de voz y, lo que es aún más interesante, de la inteligencia artificial por voz. Esta fascinación se debe a nuestra habilidad innata para hablar y comunicarnos. La voz es una forma directa y eficaz de comunicación y al eliminar la necesidad de utilizar las manos o una pantalla, se abren nuevas posibilidades para la interacción persona-ordenador.
Actualmente los chatbots y asistentes de voz han evolucionado gracias a los avances en el procesamiento del lenguaje natural, permitiendo conversaciones más humanas y valiosas. Los consumidores prefieren interactuar con interfaces conversacionales y las marcas quieren aprovecharlo. El diseño de conversación es clave en esta forma de comunicación y, aunque los principios básicos del diseño se mantienen iguales, las interfaces de usuario de voz son diferentes y requieren un enfoque único.
Piensa en el proceso de navegación a través de una página web de ropa. Diferentes opciones de menú almacenadas en diferentes niveles. En el menú principal, eliges primero entre ropa de hombre, mujer y niño. A continuación, un submenú, dentro de estas categorías podrías elegir entre zapatos, vestidos, vaqueros y accesorios. En el siguiente nivel, puedes filtrar por talla, color o estilo, y así sucesivamente. En las interfaces de voz, todas las opciones de menú están en un solo nivel, lo que elimina la necesidad de navegar por diferentes capas para encontrar lo que se busca. Con un simple comando de voz se puede obtener toda la información necesaria de una sola vez.
En este punto hay que considerar la carga cognitiva. Mientras que la información visual se absorbe a nuestro propio ritmo, es más difícil procesar una selección de opciones cuando se escuchan. Hay que evitar abrumar al usuario con una lista interminable, pero también darle una respuesta completa, para lo que las interacciones multimodales pueden ser muy útiles. La voz es útil para simplificar la navegación y reducir la carga cognitiva, especialmente en sistemas complejos. Las VUI’s pueden completar tareas cotidianas con una sola orden de voz, como agregar un evento al calendario o buscar un vuelo. Sin embargo, las interfaces visuales son mejores para mostrar mucha información a la vez. La interacción multimodal combina voz y pantalla para proporcionar una experiencia óptima al usuario.
Diseñando una VUI
Cuando ya has decidido usar la voz frente a otros tipos de interacción hay que tener en cuenta:
1. Dispositivo: cómo se comportará tu servicio de voz en diferentes dispositivos.
2. User persona: necesidades específicas de tu público y cómo se comunican para crear un motor de reconocimiento de voz que pueda entenderlos y responderles.
3. Place-ona: entorno/contexto en el que se utilizará, incluyendo la claridad de la comunicación, el ruido de fondo y la distancia del micrófono.
4. System Persona: perfil de la persona detrás de tu sistema de voz, incluyendo información biográfica, demográfica y atributos vocales que establecerá una conexión emocional con el usuario.
Algunas técnicas y metodologías útiles para el diseño de VUIs son el Sample Dialog, un juego de roles que ayuda a crear un flujo conversacional de baja fidelidad para el asistente, el One-breath-test, que sugiere que los mensajes sean breves y simples, y si no se pueden decir sin respirar, se acorten, o la técnica Jenga (como el juego de construcción), que busca reducir la cantidad de palabras en las frases para evitar que la torre del significado se derrumbe.
Sobre la privacidad de los asistentes de voz, muchos consumidores están, comprensiblemente, nerviosos por invitar a la VUI a sus hogares. Sin embargo, la preocupación de que estos dispositivos escuchen nuestras conversaciones no está del todo fundada. Los asistentes de voz solo están programados para reconocer la forma de onda y activarse con una palabra específica denominada “palabra despertador”, como “Alexa", lo que significa que solo procesan audio activamente después de escuchar estas palabras. Los clips de audio se envían a la nube para su procesamiento mediante lenguaje natural y los dispositivos no pueden procesar flujos de audio más allá de estas palabras clave.
Por último, ten en cuenta la perspectiva de género. Las aplicaciones bancarias y de seguros suelen usar voces masculinas mientras que los asistentes de voz para el hogar son femeninos, lo que refuerza los estereotipos. En respuesta, algunos diseñadores están trabajando en proyectos para crear asistentes de voz con voces neutras que amplíen las posibilidades de cómo podrían sonar.
Recursos
- Alexa Skills Kit (Amazon)
- Siri Kit (Apple)
¿Te gustaría participar con una publicación en la newsletter?
Escríbenos a cualquiera de los administradores de la comunidad de Telegram y nos pondremos en contacto contigo. Si aún no estás dentro puedes apuntarte a la waiting list.
Para lidiar con el exceso de información
Hace un par de días nos recomendaron por Telegram una herramienta que nos recuerda una vez más cómo nos encontramos sumergidos en un infinito mar de información.
Refind está pensada para recopilar 5 noticias al día de distintos medios, seleccionadas para cada usuario en base a sus intereses, es decir, información personalizada. Digamos que buscan los artículos y noticias por ti y te las dejan cada mañana en tu bandeja de entrada. ☕️
Ya que estamos saturados de estímulos y contenido, quizás, cuanta más clasificación y filtrado hagamos, más sencillo será estar informados y estimularnos con temas interesantes.
Herramientas que nos facilitan la vida
Es muy habitual tener que enfrentarnos a alguna presentación y no tener un template adecuado a mano. Esta semana nos recomendaron slidesgo y Slides Carnival para facilitarnos un poco más esta tarea. 💫
Además, para los amantes de la buena documentación aparece Design System OS, un template de Notion que nos permite documentar y mantener un sistema de diseño con una base de datos bastante impressive. Otro plus es que permite conectar Notion y Figma facilitando, de esta forma, la importación de información entre ambas herramientas. 👀
✨ Weekly inspiration
No te pierdas nuestras recomendaciones semanales en Twitter o Instagram.