Casi la mitad de los principales medios noticiosos a nivel mundial están bloqueando los rastreadores de inteligencia artificial de empresas como OpenAI y Google. Esta medida podría tener serias implicaciones en la calidad de los modelos de lenguaje y su capacidad para recuperar información de la web.
El estudio del Reuters Institute for the Study of Journalism encontró que, hacia finales de 2023, el 48% de los sitios web de noticias más utilizados en diez países estaban bloqueando los rastreadores de OpenAI, creadores de ChatGPT. En cuanto a Google, desarrolladores de Gemini (antes Bard), un 24% les bloqueaba el acceso.
Casi todos los sitios (97%) que decidieron bloquear a Google también bloquearon a OpenAI. Esto podría deberse a que ChatGPT es más prominente y usado que Gemini, o porque el rastreador de OpenAI se lanzó antes. Pero también es posible que los editores sean más cautelosos al bloquear a Google por temor a afectar su prominencia en los resultados de búsqueda, incluso cuando se trata de rastreadores separados para búsquedas e IA.
La proporción de bloqueos varió ampliamente por país. Para OpenAI osciló entre 79% en Estados Unidos y solo 20% en México y Polonia. En el caso de Google, las cifras fueron de 60% en Alemania a 7% en Polonia y España. En general, los medios del Norte Global bloquearon más que los del Sur Global, en línea con intentos de medir las capacidades y preparación de los países para la IA.
El estudio también reveló que las publicaciones con mayor audiencia online tendían a bloquear más los rastreadores de IA que aquellas de menor alcance. Además, todos los tipos de medios bloqueaban, pero los sitios web de publicaciones impresas tradicionales como The New York Times eran más propensos que los de radiodifusores o medios nativos digitales. Algunos medios impresos ven el bloqueo como una forma de presionar por compensación económica por el uso de su contenido para entrenar modelos de IA.
Otros medios, sin embargo, no parecen tan preocupados y algunos incluso han llegado a acuerdos con OpenAI y otras empresas para permitir el uso de sus noticias en consultas de IA, como es el caso de Axel Springer en Alemania. En general, los hallazgos sugieren que los editores de noticias bloquean con más frecuencia que otros sitios web populares, quizás por inquietudes sobre monetización, propiedad intelectual o experiencias de usuario deficientes.
La batalla por los datos refleja las tensiones entre medios y empresas de IA en un momento de profunda transformación tecnológica en el sector noticioso. A medida que los modelos de IA se vuelven más sofisticados y ubicuos, definir reglas claras sobre el uso ético de la información en línea será crucial. Los editores deberán equilibrar los riesgos y beneficios de participar, mientras que las empresas de IA tendrán que decidir qué tan abiertos quieren ser sus modelos al contenido de noticias y encontrar formas de compensar adecuadamente a los creadores de contenido.
Comments