Inteligencia artificial

Microsoft lanza Seeing AI en Android: IA para describir a personas ciegas todo lo que capta la cámara

La app, que ya estaba disponible para iOS desde 2017, llega al resto de smartphones con nuevos idiomas y funciones de inteligencia artificial mejoradas

Microsoft lanza Seeing AI en Android: IA para describir a personas ciegas todo lo que capta la cámara.
Microsoft lanza Seeing AI en Android: IA para describir a personas ciegas todo lo que capta la cámara.Microsoft.

 Microsoft ha lanzado para la plataforma Android Seeing AI, una app dirigida a personas ciegas o con problemas de visión que utiliza inteligencia artificial para describir al usuario el mundo que le rodea y ayudarle a moverse por él. Prácticamente cualquier cosa que se ponga delante de la cámara del móvil puede ser interpretada por la app y narrada al usuario: desde describir el entorno y las personas a leer textos o contar dinero, entre otras posibilidades.

La aplicación no es estrictamente nueva, dado que está disponible para iOS desde 2017, pero su desembarco en los dispositivos Android incorpora los avances más recientes de Microsoft en inteligencia artificial y nuevas funciones entre las que destacan narraciones más detalladas del entorno y la capacidad de la IA generativa de poder plantear preguntas concretas sobre el contenido de un documento escaneado y chatear sobre ello.

Seeing AI.
Seeing AI. Microsoft.

Seeing AI es gratuita y ya está disponible en Google Play. Ha ampliado el número de idiomas con los que trabaja, tanto en sus menús como en lo que interpreta y la voz del narrador, a 18, entre los que se encuentra el español, y con planes de llegar a 36 el próximo año. De esta manera se pretende que sea una herramienta que ayude a las personas invidentes o con dificultades en sus tareas cotidianas con un asistente por IA que puede describir y narrar lo que capte la cámara del móvil.

Seeing AI.
Seeing AI.Microsoft.

Basta con apuntar con la cámara o hacer una foto para escuchar la descripción. La aplicación permite también cambiar de canal de audio para escuchar información específica. Seeing AI puede:

  • Personas: Reconoce amistades y describe expresiones y caras.
  • Texto corto: Lee el texto en cuanto aparece delante de la cámara.
  • Documentos: Proporciona una guía de audio para capturar una página impresa y lee el contenido en voz alta, junto con su formato original. Posibilita chatear con Seeing AI para encontrar información rápidamente.
  • Productos: Escanea códigos de barras, utilizando pitidos de audio como guía y facilita la localización de los códigos de barras y su posterior escaneo para identificar los productos, así como información sobre fechas de caducidad y recomendaciones de elaboración, si están disponibles.
  • Entorno: Describe el entorno y al tocar "más información" genera una descripción completa. Además, el usuario puede explorar la imagen moviendo el dedo por la pantalla para escuchar la descripción y ubicación de los distintos objetos.
  • Dinero: Reconoce los billetes y divisas, así como su valor
  • Colores: Identifica y describe el color percibido.
  • Escritura a mano: Lee texto manuscrito.
  • Luz: Genera un tono audible correspondiente a la luminosidad del entorno.