Machine learning y reconocimiento de vídeo: una frontera importante

Autor: | Posteado en Noticias Sin comentarios

Google anuncia durante su conferencia Google’s Next Cloud que ha construido la capacidad de investigar y encontrar objetos en un vídeo, y que la promete ahora en forma de una API de Cloud Video Intelligence disponible para desarrolladores, como ha hecho con el resto de sus APIs de machine learning. Junto con el anuncio de la adquisición de la sociedad de desarrollo de competiciones de modelos predictivos y analíticos Kaggle, además por parte de Google, son sin desconfianza las novedades sobre el tema mas fundamentales de la semana.

El aviso y presentación del reconocimiento de objetos en vídeo, llevado a cabo por la profesora de Stanford y directora de machine learning y AI de Google® Cloud, Fei-Fei Li, podría parecer relativamente trivial valorando que ya hace cierto tiempo que nos hemos acostumbrado a investigar por frases clave en una colección de imagenes y sacar resultados que no provengan directamente del etiquetado manual, sino del reconocimiento de los objetos existentes en las imágenes, sin embargo la complejidad implicada en edificar esa misma función para vídeo es muy superior, y las oportunidades que abre, para la compañia que posee el mayor repositorios de vídeo del mundo, además lo son.

¿Qué ocurre cuando un algoritmo puede visualizar un vídeo, entenderlo y reconocer los objetos que hay en él? Hasta ahora, un vídeo era un contenedor practicamente cerrado, en el que las únicas formas que teníamos de encontrar algo era mediante su titulo o etiquetándolo con frases clave. Desde hace varios años, esa circuntancia nos parece “lo normal”, lo que la tecnología da de sí, una limitación tan asumida, que eran escasas las situaciones en las que pensábamos en la oportunidad de algo así. El vídeo es uno de los elementos de la web(www) sujeto a un índice de aumento mayor, sin embargo por el momento, la capacidad de realizarlo indexable resultaba suficiente limitada. ¿Qué ocurre cuando los algoritmos de machine learning son capaces, por un lado, de reconocer las frases pronunciadas en un vídeo, pasarlas a texto y crear que podamos investigar en él, y además, otros algoritmos se encargan de comprender el contenido y permitir que podamos investigar imágenes? Pedir a un buscador que nos localice menciones o apariciones de algo – un objeto, una marca, un logotipo, una persona, etc. – en un repositorio de vídeo, y sacar una pagina de resultados en la que se nos indiquen los vídeos que lo contienen, y el lugar del vídeo en el que se encuentra… ¿Cuántas nuevas oportunidades y avenidas para la innovación se pueden abrir gracias a algo así?

Para Google, como para otros rivales en el entorno cloud computing, la forma de competir no es simplemente tratando de brindar mas prestaciones por menos precio – lo que supondría especializarse en la clásica tactica de liderazgo en costos – sino ser apto de brindar prestaciones mas sofisticadas para sus usuarios. La propuesta de una función como esta hace que, de forma automática, la nube de Google, que hasta el instante se percibe como por atras de otros rivales como Amazon® o Microsoft, se convierta en una alternativa mas atrayente para aquellos rivales en los que el vídeo juega un papel fundamental, que ahora pueden plantearse mucho mas beneficios asociados a la puesta en precio de sus repositorios. Pero además, posibilita además el desarrollo de nuevos beneficios planteados por otros competidores, que podrían permitir la adopción de ejemplos de plataforma para aquellos que consideran el vídeo como el centro de su negocio. Hablamos de dinamizar y cambiar en indexables muchísimos millones de horas de vídeo, con contenidos de todo tipo, que se abren a la oportunidad de ser tratados de formas muchísimo mas ricas.

Ahora, una maquina puede visualizar un vídeo de un tigre, comprender que es un tigre lo que hay en el vídeo, y encontrarte vídeos en los que aparezcan tigres. Todo ello, sin que nadie haya etiquetado o titulado ese vídeo como conteniendo un tigre. Lo preferible de aprender el machine learning y la inteligencia artificial es que jamás dejas de sorprenderte.

 


Enrique Dans



El mejor vídeo del día Trucos de Android


Nota: La creación de esta noticia le pertenece al autor original que aparece en la firma de más arriba. No hemos eliminado en ningún momento los enlaces oficiales, ni tampoco intentamos perjudicar su posicionamiento en los motores de búsqueda.

El Administrador de QueEsGoogle.Com

Agrega tu comentario