9.3 C
Buenos Aires
InicioTecnologíaLa crisis del contenido: cómo la inteligencia artificial amenaza la economía de...

La crisis del contenido: cómo la inteligencia artificial amenaza la economía de internet

El auge de la inteligencia artificial generativa está transformando la web, pero también genera una crisis sin precedentes: caída de ingresos publicitarios, pérdida de visibilidad humana y un fenómeno llamado ‘colapso del modelo’ que degrada la calidad de la información.

Las plataformas digitales atraviesan una crisis sin precedentes. Los ingresos publicitarios caen y la avalancha de contenido generado por inteligencia artificial amenaza con destruir la economía que sostuvo a la web por más de cuatro décadas. Detrás del caos, surge una pregunta central: ¿puede sobrevivir internet sin creadores humanos?

Internet fue el gran escenario del conocimiento colectivo y la comunicación global, desde los primeros foros hasta las webs de noticias. Pero en los últimos años, algo cambió: las redes se llenaron de ruido, los motores de búsqueda colapsaron bajo montañas de contenido artificial y repetitivo. Mientras los gigantes tecnológicos multiplican la producción automática con inteligencia artificial, los periodistas, artistas y comunidades humanas pierden visibilidad y poder. A esta problemática se la llama “crisis del contenido”, una transformación silenciosa que amenaza con convertir a la red en una copia vacía de sí misma.

La crisis de contenido se debe a tres fenómenos: el colapso del modelo de las inteligencias artificiales, Google Zero y la inundación de contenido. Primero, hay que entender qué es la IA generativa: son modelos conocidos como LLM (modelos de texto generativos), sistemas que aprenden patrones del lenguaje a gran escala y luego los usan para predecir texto, creando contenido a partir de probabilidades. Se estima que los modelos actuales tienen una tasa de error de entre el 20% y 40%, errores conocidos como “delirios de la IA”, cuando inventan información sobre lo preguntado.

En cuanto al colapso del modelo: se refiere a la disminución del rendimiento de la IA generativa (como ChatGPT o Gemini) al ser enfrentada con textos generados por ellas mismas y no por humanos. Un grupo de investigadores de las universidades de Cambridge y Oxford analizó qué sucede cuando las herramientas de IA generativa consultan contenido producido por IA. Los resultados fueron alarmantes. El Dr. Ilia Shumailov, de la Universidad de Oxford y ex investigador sénior en Google DeepMind, descubrió que cuando el software de IA generativa se basa únicamente en contenido producido por IA, las respuestas comienzan a degradarse gradualmente.

El equipo confirmó el colapso del modelo con un experimento: comenzaron con una wiki preentrenada con IA que se actualizaba a partir de sus propios resultados. A medida que los datos erróneos contaminaban el conjunto original de datos de entrenamiento, la información se fue deteriorando progresivamente hasta volverse ininteligible. Por ejemplo, después del noveno ciclo de consultas, un extracto del artículo wiki sobre los campanarios de las iglesias inglesas del siglo XIV se había transformado en un texto incoherente sobre los diversos colores de los conejos y sus colas.

Esto se ve más claro en un modelo gráfico: se generan diferentes imágenes de razas de perros, pero a través de los ciclos, las razas menos conocidas quedan excluidas de los conjuntos de datos repetidos, favoreciendo a razas más populares como los golden retrievers. La IA crea su propio método de selección de facto, del tipo “usar o perder”, que elimina las razas menos populares de su base de datos. Tras suficientes ciclos de entrada únicamente con datos de IA, esta solo es capaz de generar resultados sin sentido.

Shumailov afirma que cada vez resulta más difícil para los desarrolladores humanos filtrar el contenido creado a gran escala por sistemas de IA, sin que se vislumbre una solución aparente. Para evitar este error, las diferentes empresas comenzaron a invertir en acuerdos de libre uso del contenido clásico, ya sean foros o páginas de noticias. Esto significa que los medios tradicionales y sus textos de calidad siguen teniendo un gran peso e importancia para las grandes empresas tecnológicas.

Por ejemplo, Amazon paga hasta 25 millones de dólares al año al New York Times por licencias de contenido e IA. El acuerdo le otorga a la empresa tecnológica acceso a una amplia gama de contenido del medio, incluido material de su sección de noticias, cocina y The Athletic, que Amazon puede utilizar para entrenar modelos de IA y ofrecer funciones como las respuestas de Alexa. Según un informe de mayo de 2023, The New York Times ganó casi 100 millones de dólares en tres años gracias a un acuerdo con Google de Alphabet que permitió ofrecer contenido del Times en todas sus plataformas.

MAS NOTICIAS
NOTICIAS RELACIONADAS