¿Es ya el momento de la voz?

Autor: | Posteado en Noticias Sin comentarios

Apple revela que prepara un SDK para que los programadores de apps puedan interactuar y tener camino a la interfaz de voz Siri, y que utilizará ese asistente mejorado para anunciar un equipo estacionario para el salón posiblemente en el WWDC de este junio, un artefacto del estilo del Amazon Echo o del actualmente publicado Google Home de los que hablamos hace pocos días.

Con el movimiento, son ya 3 de las enormes industrias tecnológicas compitiendo en un ámbito que se define cada vez mas de una forma mas clara, el de las interfaces de voz llevadas, además, al entorno doméstico, al salón de la casa. Los progresos llevados a cabo en el proceso de voz y en el analisis de idioma natural aceptan que, hoy, la voz se configure como uno de los interfaces primordiales con el que interactuaremos con nuestros dispositivos… a pesar de que, paradójicamente, es un tema del que se lleva hablando muchísimos años y en el que el nivel real de uso es poco menos que anecdótico.

Hace pocos días, el noruego Dag Kittlaus, fundador original de Siri que salió de la compañia de la manzana en octubre de 2011, presentó Viv, la que él considera una evolución del asistente personal que califica de “interfaz inteligente para todo“, que esta todavía en la etapa de coming soon to devices near you”, y que se une a la cohorte de startups y compañías de todo tipo que animan el panorama de las interfaces de voz

La enorme pregunta es qué llevaría a que una interfaz relativamente minoritaria y personaje de todo tipo de anécdotas y chistes a convertirse, si las enormes industrias tecnológicas están en lo cierto en sus predicciones, en uno de los enormes intérpretes del futuro de la computación. Y la respuesta, una vez más, parece venir de las fundamentales avances experimentadas por la inteligencia artificial y el machine learning, capaces de producir una interacción cada vez mas perfeccionada, con menos errores y con una variedad mas amplia de posibilidades. Ahora, si tomas tu smartphone e intentas interactuar con él a través de Siri o Google® Now, la sensación es que, a pesar de la amplia base de documentos que ya atesoran para enseñar a sus algoritmos, contamos todavía mas de un videojuego que de otra cosa. Sí, podrias pedirle varias tareas, te podrias economizar pulsaciones en el teclado para anunciar una búsqueda, te puede poner una canción, decirte qué teneis en la agenda o el tiempo que va a hacer, sin embargo la impresión es que la cosa no pasa de ahí, y que al cabo de un rato, uno completa o bien sin saber qué diablos pedir, o bien diciendo alguna tontería. El ejercicio de desafiarse para intentar interactuar con el smartphone únicamente con la voz durante un cierto tiempo tiende a resultar suficiente frustrante, a dejarnos una sensación de estar verdaderamente perdiendo el tiempo. Y sin embargo, a pesar de todo ello, todo indica que nos preparan un futuro inspirado en interfaces de voz situadas ya no solo en el equipo que llevamos en el bolsillo, sino en el mismísimo salón de nuestra casa.

En otros entornos, como el del dictado, la sensación es parecida. Llevamos años teniendo disponibles prestaciones que nos aceptan dictar textos a nuestros computadores mediante interfaces como Dragon, con la que en algunos instantes llegué a tener una destreza notable, o directamente activando determinadas características del metodo operativo, sin embargo a pesar del tiempo que ha pasado desde que se lanzaron al mercado, el uso continua siendo totalmente testimonial salvo, lógicamente, en colectivos como el de los invidentes. Ver interactuar a un ciego con un equipo mediante la voz, con la pantalla apagada, genera una sensación extrañísima, sin embargo parece claro que el desarrollo de este tipo de tecnologias ha reinventado su relación con la tecnología. Sin embargo, mas allá de este colectivo, el uso continua siendo muy minoritario, y anunciar comandos de viva voz continua teniendo una cierta connotación de extravagancia. Y esa sensación, además, no parece adscribirse a ningun tipo de deriva generacional: no veo a los jóvenes hablando con sus smartphones mas de lo que lo puede crear la masa de mi edad.

¿Qué lleva a las industrias tecnológicas a tener tanta confianza en el papel de la voz como interfaz en el futuro? ¿Qué desarrollos logramos permanecer que se conviertan en la verdadera killer application de las interfaces de voz, mas allá de unos usos modernas que han dado de sí para un uso meramente anecdótico? Por mucho que Echo sea un éxito para Amazon y que varios de sus visitantes parezcan enamorados de Alexa, me cuesta imaginarme una popularización extensiva de esta tecnología a falta de casos de uso verdaderamente interesantes, de integraciones que de verdad la doten de sentido. En varios sentidos, el panorama de las interfaces de voz parece recordar a otros entornos y programas de la tecnología en los instantes previos a que Apple® se pusiese a reinventarlas. ¿Supone el aviso de Apple® un intento de reinventar algo que, en mi opinión, promete todavía retos muy importantes, o se intenta simplemente de un movimiento de imitación?

Tras mucho tiempo probando interfaces de voz  y con una actitud probablemente mas positiva que la media de usuarios, visualizar que las enormes tecnológicas apuestan decididamente por su uso continua generándome cierto escepticismo, una circuntancia en la que no suelo encontrarme cuando contamos de tecnología: no dudo que llegarán, sin embargo todavía me parece que estamos muy lejos. ¿Soy el único en verlo así? ¿Estáis todos ya desde hace tiempo hablando sin detener con todos vuestros dispositivos y no me he enterado? 

 


Enrique Dans



El mejor vídeo del día Trucos de Android


Nota: La creación de esta noticia le pertenece al autor original que aparece en la firma de más arriba. No hemos eliminado en ningún momento los enlaces oficiales, ni tampoco intentamos perjudicar su posicionamiento en los motores de búsqueda.

El Administrador de QueEsGoogle.Com

Agrega tu comentario