Cuando las máquinas entienden el lenguaje de los ejecutivos

Los programas de transcripción de voz han avanzado sustancialmente en calidad y facilidad de uso. En paralelo, arranca la oferta de aplicaciones para dispositivos móviles, con los que dictar mensajes cortos.

Hace más de una década que existen programas que transcriben la voz del usuario. El avance en calidad desde entonces ha sido exponencial. “Son herramientas que requieren una potencia de cálculo que, hasta hace pocos años, no podía soportar cualquier ordenador”, explica Javier Arias, responsable de alianzas estratégicas de Google para Emea.

Los programas de dictado han evolucionado de un modo similar a los antivirus. Hace años, por su peso, ralentizaban los equipos y, además, necesitaban mucho trabajo manual: el usuario debía enseñar al sistema su voz, sus patrones del habla y su acentuación.

En la actualidad, la mayoría de estas soluciones ha liberado a los PC de una parte de la necesidad de memoria, que ahora se almacena en la nube. El fichero que almacena el diccionario y los patrones de voz está colgado en Internet y se retroalimenta de los nuevos términos y las correcciones que van incorporando los usuarios. “Cualquier dispositivo conectado a Internet puede usar un sistema de este tipo”, afirma Arias.

En España, la oferta es limitada. IBM fue pionera en este mercado con la solución ViaVoice, que más adelante fue retirada del mercado. ViaVoice necesitaba que cada usuario le enseñara su voz y algunos de los términos que fuera a emplear, tarea que podía conllevar varias horas. Exigía también hablar muy despacio y en un lugar sin apenas ruido ambiente, pese a lo que los errores eran muy frecuentes. También Philips probó suerte en este mercado hasta que, en septiembre de 2008, Nuance adquirió su división Voice Recognition.

Desde entonces, Nuance es la única firma que comercializa un programa en España para uso doméstico: Dragon Naturally Speaking, que cuesta entre 149 y 199 euros. Está previsto que, antes de final de año, se lance una nueva versión de esta aplicación.

No obstante, las aplicaciones que mejor funcionan son aquéllas especializadas para una temática determinada.

En España, algunos hospitales emplean herramientas de transcripción para la redacción de los informes. El primer servicio en adoptarlas fue radiología. La solución SpeechMagic, de Nuance, incluye un diccionario específico de términos comunes entre los radiólogos, al que cada médico puede añadir nuevas palabras y otras consideraciones.

SpeechMagic interioriza todas las palabras y correcciones que los profesionales van añadiendo, hasta que forma una base suficiente como para preinstalar un diccionario.

Este producto cuesta en torno a 300 euros por usuario (el precio depende de la complejidad del proyecto y su integración con las demás tecnologías del servicio) y, desde este año, es empleado por más especialidades. “En Osakidetza, por ejemplo, se integra con las soluciones de virtualización de Citrix”, expone Javier Viver, director de Sanidad de Nuance.

En un futuro cercano, está previsto que se amplíe el alcance de la solución al campo de los abogados.

Móviles
Los dispositivos móviles actúan cada vez más como herramientas de trabajo. En este contexto, Google y Microsoft han incorporado a sus sistemas operativos aplicaciones capaces de identificar la voz para comandos (por ejemplo, “buscar fichero” o “llamar María”), pero también para redactar breves textos en forma de SMS o de e-mail.

En España, la opción de redactar textos está disponible, por ahora, sólo a través de aplicaciones de terceros. Es el caso de Nuance Dragon Dictation, disponible desde hace unos días en la AppStore. La aplicación, por constituir una primera versión, es gratuita, con unos resultados relativamente buenos. “Transcribe mensajes de hasta sesenta segundos y es capaz de identificar distintos acentos, incluso, con ruido de fondo”, asegura Luis Picazo, director comercial de Nuance.

En enero, está previsto que el código de Dragon Dictation se abra para permitir a los desarrolladores la creación de aplicaciones más especializadas. Los primeros programas estarán disponibles, previsiblemente, seis meses después.

La oferta disponible en España
1. Cualquier usuario de Vodafone dispone de los servicios DictaSMS y Contestador+, que convierten los mensajes de voz en textos escritos. DictaSMS es gratuito tanto para el que llama como para el usuario del móvil y es capaz, incluso, de identificar cualquier voz, con un ruido de fondo considerable.

2. Dragon Naturally Speaking, para pymes y particulares, es compatible con Windows. Cuesta 149 euros y la versión wireless, 199 euros. IBM fue pionera en este mercado con Via Voice. La calidad de estas soluciones ha mejorado mucho, en paralelo al aumento de la capacidad de procesamiento de los PC.

3. Google, al igual que Microsoft, ha creado un sistema para Android que reconoce comandos y, en unos meses, permitirá transcribir textos como SMS y correos electrónicos. Esta opción ya está disponible para usuarios de iPhone y iPad con la aplicación Nuance Dragon Dictation, que se encuentra gratis en la AppStore.

4. SpeechMagic es un programa que adoptó Nuance al comprar el área Philips Speech Recognition. En España, es empleado en hospitales para la redacción de informes, y pronto lo usarán abogados. Requiere que el usuario le enseñe los términos más especializados, y funciona mejor si se usa siempre con la misma voz.

Osakidetza y los informes hablados
Los cardiólogos del servicio público de salud vasco, Osakidetza, redactan sus informes con solo usar su voz. SpeechMagic incorpora un diccionario de términos de cardiología, si bien, cada profesional puede añadir otras palabras. El programa asume los nuevos términos y mejora poco a poco con la participación de todos los usuarios. A lo largo de 2010, se ha desplegado la solución a otros servicios, para los que, en muchos casos, no existe aún un diccionario específico. En la actualidad, más de 200 radiólogos y 430 médicos de Osakidetza emplean esta herramienta, lo que ha supuesto una inversión de más de un millón de euros.

Fuente: Expansion