Las etiquetas como tesoro

Autor: | Posteado en Noticias Sin comentarios

Facebook comenta, en una de las entrevistas de su F8, como maneja las etiquetas en los muchos decenas de millones de fotografías que los visitantes suben a Instagram, para entrenar a sus algoritmos de reconocimiento de imágenes, y como eso le ha permitido optimizar los estándares de la empresa en este sentido y que sus algoritmos sean capaces de alcanzar una fiabilidad del 85.4%

La idea de Facebook® de usar las fotografias subidas y etiquetadas por sus visitantes para entrenar algoritmos de reconocimiento ya había sido puesta en experiencia anteriormente por Google, que utiliza los vídeos etiquetados de YouTube además de forma sistemática para precisamente lo mismo: a la hora de explicar a un algoritmo en qué consisten verbos como abrazarse, pelearse o cocinar, por ejemplo, escasas cosas pueden ser mas explicativas que un vídeo etiquetado con esas palabras. El sistema, obviamente, no es perfecto, sin embargo los errores cuando contamos de etiquetado de una fotografía o vídeo llevado a cabo por el cliente que lo ha elevado son mas bien escasos, porque por regla general, el etiquetado tiene como misión facilitar una preferible ubicación del contenido.

Quien tiene un conjunto de documentos etiquetados de forma razonablemente fiable tiene un tesoro, porque puede utilizarlos para entrenar a un algoritmo y lograr que una maquina sea apto de comprender el significado de lo que hay en esos datos. Recientemente comenté el caso de Qure.ai, una compañia con la que entré en contacto a través de Netexplo, que recopilaba archivos de radiólogos y otros profesionales médicos que laboraban con fotografias (escáneres, tomografías, etc.) y que solían guardarlos etiquetados con el diagnóstico correspondiente. Eso permitía, alimentando al correspondiente algoritmo, crear un metodo apto de diagnosticar tumores a partir de fotografias médicas, algo que hoy es exacto llevar a cabo de forma tutorial y que, obviamente, no esta exento de error. Con el tiempo, la predicción de la compañia era que, a medida que la fiabilidad del algoritmo se incrementaba, los médicos muy posiblemente dejarían de desear diagnosticar esas fotografias manualmente por temor a suceder por alto definidos patrones que la maquina sí podía reconocer, algo que eventualmente, a lo largo del tiempo, podría resolver que esa habilidad se perdiese.

Cada vez esta mas clara la importancia de que las compañías de todo tipo sean conscientes de estas cuestiones. La clave ya no esta en contar con los mejores profesionales, sino en el hecho de que tu version te permita producir documentos estructurados que puedan ser utilizados para entrenar a los correspondientes algoritmos. Da equivalente lo que hagas, plantéatelo: ¿cómo podrias crear que el dia a día, la operativa de tu compañia sea apto de producir ese repositorio de documentos correctamente etiquetados que puedan ser suministrados a un algoritmo para su aprendizaje? ¿Qué podríamos llegar a crear si un algoritmo obtiene un nivel de fiabilidad elevada en ese sentido?

Como en todo, la cuestión es mas de mentalidad que de otra cosa. Entender el dilema acepta llegar antes no solo a una definición de objetivos razonables, sino además a una identificación mas rápida de problemas potenciales que permita trabajar en su resolución. A la hora de imaginar qué actividades puede llegar a crear un algoritmo, la mayor parte de los directivos se localizan con limitaciones de planteamiento: ven una grande suma de sus procesos como intrínsecamente humanos, y son incapaces de imaginar que determinadas cualidades para las que hoy se solicita una persona puedan llegar a ser dominadas por una máquina. Obviamente, los algoritmos no van a realizarlo todo, o al menos no de la noche a la mañana: los proyectos de machine learning precisan de una 1ª etapa sumamente compleja y dura en la que que hay de definir objetivos concretos, recolectar datos, transformarlos y suplementarlos con mas documentos complementarios antes de poder suceder a armar ejemplos y crear predicciones o diagnósticos que puedan ser evaluados… sin embargo a pesar de la dificultad de esos proyectos, una cosa esta clara: los documentos son la auténtica barrera de entrada, la clave de la cuestión, lo que va a diferenciar a las compañías capaces de recorrer en ese sentido de aquellas que no lo consigan.

Orientar la version de una compañia a la generación de documentos analizables no es algo que requiera un grande sacrificio ni cambios radicales: simplemente solicita comprender los objetivos y combatir el dilema de la forma adecuada. Empezar pronto, en cambio, es una certificado de, cuando menos, tener hechos los deberes para lo que pueda venir. Los documentos como auténtica mejoría competitiva. Las compañías tecnológicas hace tiempo que lo tienen claro. ¿Qué podrias crear tú en la tuya?

 


Enrique Dans



El mejor vídeo del día Trucos de Android


Nota: La creación de esta noticia le pertenece al autor original que aparece en la firma de más arriba. No hemos eliminado en ningún momento los enlaces oficiales, ni tampoco intentamos perjudicar su posicionamiento en los motores de búsqueda.

El Administrador de QueEsGoogle.Com

Agrega tu comentario