¿de qué nos va a servir realmente poder dar órdenes orales a un ordenador? Tal vez convendría enfriar un poco el aparente entusiasmo que se está desarrollando en torno a la tecnología de reconocimiento de voz en el Mac, y en la informática en general. En los últimos meses se está hablando, valga la redundancia, del teléfono móvil como medio de acceso a una Internet en la que controlaríamos la navegación mediante órdenes habladas, en lugar de con clics de ratón. Por otro lado, se han presentado ya varias soluciones de reconocimiento de voz para el Mac, aparte de la ya veterana de Apple. De momento sólo estarán disponibles en inglés.

Se puede, no se puede

El reconocimiento de voz tiene dos caras, o tres según Apple: el dictado contínuo de textos, el control por voz y, con Mac OS 9, la identificación de usuarios. Respecto a ésta última no hay mucho que decir puesto que acaba prácticamente de ponerse en marcha. Quizá sea una buena idea para que personas discapacitadas puedan identificarse como usuarios de ordenadores compartidos en caso de que no puedan utilizar el teclado, pero no parece que represente una ventaja muy destacable para el resto del mundo.

El dictado contínuo es quizá la más ventajosa de las tres. Mediante esta técnica podremos introducir textos en el ordenador dictándolos, como indica su nombre, sin necesidad de tocar el teclado. Al fin y al cabo, no todo el mundo consigue convertirse en un veloz mecanógrafo, por lo que este tipo de ayuda debería ser bienvenida por la mayoría de nosotros y especialmente, de nuevo, por las personas que no pueden utilizar un teclado por una u otra razón. La tecnología de dictado contínuo parece estar ya madura a juzgar por la variedad de ofertas existentes, aunque aún no concretadas en productos finales para el Mac, como son el Naturally Speaking de Dragon Systems o el Via Voice de IBM, ambos productos ya existen en el mercado PC.

Además, una empresa maquera, MacSpeech ha anunciado hace tiempo su intención de ofrecer una tercera alternativa.

Pero es el control del ordenador por voz el que resulta preocupante, el que supone un riesgo de volver a modos de trabajo felizmente superados con la excusa de una tecnología superior.

Un poco de psicología

El problema del control por voz no es sólo el reconocimiento del habla necesario para que el ordenador entienda lo que le decimos y lo haga, sino, y sobre todo, qué le podemos decir al ordenador y qué no. De hecho, Apple tiene desde hace años la tecnología básica necesaria (Speech Recognition) que sólo está disponible en inglés y que permite controlar al ordenador en determinadas funciones. Se diría que para muchos el tema de la interfaz de voz, por llamarlo de alguna manera, es cuestión de tiempo y que en un futuro próximo prescindiremos de ratón, teclado y de cualquier otro dispositivo de entrada, salvo de un micrófono. Pero creo que no va a ser así.

Nuestra mente es capaz de manejar diversos tipos básicos de conocimientos, principalmente los declarativos, que podemos verbalizar con facilidad, y los procedimentales, relativos a nuestra capacidad para llevar a cabo diversas acciones, que podemos fácilmenta poner en práctica; pero son difíciles o imposibles de explicar con palabras. Cada uno de ellos es procesado por nosotros de forma diferente. Un ejemplo del primer caso son los recuerdos de experiencias vividas, un ejemplo del segundo es andar en bicicleta: ¿es el lector capaz de explicar cómo se anda en bicicleta?

La aplicación de lo anterior a las interfaces de ordenador es sencilla. Hay operaciones que podemos indicar con cierta facilidad al sistema mediante órdenes verbales (escritas como en el DOS o habladas, para el caso es lo mismo), mientras que otras son sencillamente imposibles. Podemos decir, por ejemplo: “mueve la carpeta Proyecto a la carpeta Trabajos que está en el disco Principal”, pero a ver quién es capaz de explicarle al ordenador los pasos necesarios para dibujar una sencilla mesa sin que el proceso se convierta en un calvario. Es evidente que resulta mucho más sencillo utilizar un lápiz y dibujarla que explicar paso por paso cómo hacerlo.

Por tanto, no es posible esperar que una única interfaz de voz sea el modo de manejar ordenadores en el futuro. Lo lógico es evolucionar hacia sistemas de control similar a los reales. Del mismo modo que la intefaz gráfico es adecuado para un tipo de procedimiento, el interfaz de voz facilitará otras tareas, pero muchos dispositivos se adaptan mejor para otros usos. Por ejemplo, las tabletas gráficas, que permiten dibujar a mano sin utilizar el ratón y que existen desde hace tiempo.

Pero, como se ha dicho en otra ocasión, serán las personas que no pueden utilizar un teclado u otros dispositivos visomotores quienes se beneficien realmente en buena medida de las interfaces basadas en el lenguje oral.

Si quiere suscribirse a la LSPM sólo tiene que enviar cualquier mensaje a [email protected]. o escribir subscribe digest LSPM en un mensaje dirigido a [email protected] si quiere cambiar a la modalidad de resúmenes diarios.