Noticias, algoritmos y reajustes necesarios

Autor: | Posteado en Noticias Sin comentarios

Mi columna en El Español de esta semana se titula “Rediseñando algoritmos“, y habla de la forma en que compañías como Facebook® o Google® están tratando contestar al dilema de las novedades e informaciones ofensivas o factualmente incorrectas acepta visualizar claramente el desarrollo de sus tacticas y la forma en que afrontan los problemas en el funcionamiento de sus algoritmos de relevancia.

En ambos casos contamos de compañías con una obligación claro de plantearse soluciones: Facebook® lleva ya varios meses, desde la venida de Trump a la Casa Blanca, recibiendo acusaciones con respecto a su papel como difusor de novedades falsas durante la campaña que pudieron llegar a alterar significativamente el voto de varios norteamericanos, mientras Google® se ha hallado también últimamente en el ojo del huracán por las noticias absurdas, conspiranoicas, partidistas o procedentes de fuentes carentes de toda credibilidad que sugiere en sus snippets o a través de Google® Home.

¿Cómo rediseñar un algoritmo para eludir el ascenso en fama o la recomendación de novedades de ese tipo, respetando el hecho de que hay individuos que quieren conscientemente consumirlas (el sensacionalismo y la información sesgada tienen sin duda su público), sin embargo evitando la viralización de información calificable como factualmente incorrecta?

Las oportunidades que se apuntan, por el momento, son cuatro, y en ambos casos pasan por introducir nuevos documentos en la ecuación. ¿De dónde extraer esos nuevos documentos que pretenden cualificar las noticias?

  1. Otras fuentes consideradas autorizadas, de paginas dedicadas a esa version cada vez considerada mas importante, el fact-checking: sitios como Snopes, Politifact u otros que cumplan unos principios básicos de funcionamiento y que dedican individuos cualificadas a verificar las novedades y emiten un veredicto sobre las mismas. Este es el acceso escogido por Facebook® en una iniciación ya puesta en marcha, que adjudica a las novedades la calificación de “disputada” en función del juicio emitido por este tipo de páginas, y por Google® en Francia a través de  CrossCheck, una tool fabricada por Google News Lab junto con First Draft dentro de la iniciación de trabajo con medios europeos. En esta categoría se encuadra, también en Francia y con carácter experimental, la introducción en los algoritmos de bases de documentos como las desarrolladas por Le Monde, seiscientas paginas web(www) directamente identificadas como no fiables; o por Libération, en la que se compilan noticias positivamente identificadas como falsas.
  2. Opinión de los usuarios: el uso de sistemas de peer-rating y la evaluación de patrones derivados de su uso. Ante la publicación rápida de una novedad con carácter claramente partidista, sectario u ofensivo, cabe permanecer no solo una viralización rápida entre aquellos que sintonizan con el tono o el contenido de la noticia, sino también un uso de tools de calificación por parte de aquellos que consideren esa novedad como factualmente incorrecta o inaceptable. El repaso de los patrones de generación de esas evaluaciones negativas de los visitantes puede ser, unida al analisis de esos usuarios, un elemento mas que puede adentrarse en el algoritmo.
  3. Patrones de difusión: el analisis de las curvas de publicación de las novedades en sí. Curvas muy rápidas, muy bruscas o que crecen especialmente a expensas de individuos identificadas como de una tendencias determinada, en grupos muy homogéneos o con patrones claramente identificables y atribuibles, deberían como mínimo ser objeto de algún tipo de supervisión.
  4. Uso de evaluadores independientes: disponer de un numero representativo de individuos en diversos paises y con un nivel de diversidad elevado dedicadas a la evaluación de esas noticias. Es el caso de la iniciación recién presentada por Google: 10 mil individuos contratadas específicamente para esa tarea, que no pueden influir directamente sobre el posicionamiento de las novedades en las paginas de resultados, sin embargo sí generan documentos cualificados sobre su nivel de credibilidad y etiquetan novedades como “upsetting – offensive” en función de un exhaustivo documento directriz de 160 páginas para que esa calificación sea utilizada como una variable de entrada complementario (un informe que cree un intento de definición del dilema que en varios de sus apartados razones ser objeto de estudio, crítica y enriquecimiento por parte de varios periodistas, o inclusive llegar a ser aprovechado en las facultades de Periodismo).

Es conveniente recordar que en todos los casos contamos de variables de entrada, no de salida: es decir, no se intenta de que un patrón determinado, la opinion de un evaluador o la de una fuente secundaria “descalifiquen” o “eliminen” de forma automática una noticia, sino de que esa información es utilizada para alimentar un algoritmo de machine learning que trata, a lo largo del tiempo, de crear patrones derivados de esa información.

¿Por qué es exacto rediseñar los algoritmos? Sencillamente, porque el entorno al que responden también cambia. Toda tool es susceptible de ser pervertida a partir del instante en que los incentivos para realizarlo son suficientes, y eso genera la obligación de esas tools de protegerse contra ese tipo de usos. La mayor parte de los algoritmos que sabemos son, como tales, trabajos en curso que tratan de evolucionar con las funciones del entorno o con los patrones de uso que generan. El caso de las novedades falsas, como el de los sucesivos intentos de corrección del peso del sensacionalismo llevados a cabo anteriormente por Google, no son mas que pruebas en ese sentido.

Como tal, una evolución muy necesaria. Pero además, desde un punto de vista de investigación, totalmente fascinante.

 


Enrique Dans



El mejor vídeo del día Trucos de Android


Nota: La creación de esta noticia le pertenece al autor original que aparece en la firma de más arriba. No hemos eliminado en ningún momento los enlaces oficiales, ni tampoco intentamos perjudicar su posicionamiento en los motores de búsqueda.

El Administrador de QueEsGoogle.Com

Agrega tu comentario