Wikimedia bajo presión: aumento del tráfico del 50% debido a bots de IA

En el corazón del universo digital del conocimiento libre, Wikimedia se enfrenta hoy a uno de los desafíos más complejos de su historia reciente: la creciente ola de bots de IA alcista que saquean sistemáticamente sus contenidos.

En particular, en los últimos meses ha habido un aumento del 50% en el tráfico generado por la llamada IA rastreadora, lo que está poniendo a prueba tanto la capacidad técnica como la sostenibilidad económica de la plataforma.

El impacto de la inteligencia artificial (AI) en la infraestructura digital está creciendo: el caso de Wikimedia

A partir de enero de 2024, ha habido un crecimiento vertiginoso en el volumen de datos descargados de plataformas como Wikipedia y otros proyectos de Wikimedia.

Este aumento no se debe a una mayor participación de usuarios humanos, sino más bien a un uso sistemático y a menudo mal regulado de bots automáticos empleados por empresas que desarrollan modelos de inteligencia artificial.

Estas herramientas, diseñadas para recopilar y analizar grandes cantidades de texto, imágenes y otro contenido, utilizan Wikimedia como fuente de datos principal para el entrenamiento de sus algoritmos.

Una operación que, por un lado, demuestra la centralidad de la plataforma en el ecosistema del conocimiento digital, por otro lado, ejerce una presión insostenible sobre sus infraestructuras de TI.

El problema no radica únicamente en la cantidad de datos transferidos. La verdadera cuestión crítica está representada por la forma en que estos bots acceden a los contenidos.

En la mayoría de los casos, de hecho, las solicitudes están dirigidas a páginas raras o poco visitadas, es decir, aquellas que no caen dentro de los sistemas de caché. En otras palabras, mecanismos que permiten almacenar temporalmente copias de las páginas más consultadas para acelerar su carga.

Cuando esto sucede, las solicitudes deben ser manejadas directamente por los servidores centrales, lo que resulta en un aumento significativo de la carga de trabajo y, sobre todo, en los costos.

Este escenario se vuelve particularmente crítico en conjunto con eventos de alta relevancia mediática, durante los cuales el tráfico "humano" ya alcanza niveles altos.

Bots fuera de control: ignoran las reglas, evaden los bloques

Otra dimensión alarmante del fenómeno está representada por el comportamiento que es cada vez más sofisticado y, a veces, incorrecto de los rastreadores. Muchos de estos bots, de hecho, ignoran las convenciones establecidas, evaden los sistemas de bloqueo automático y se disfrazan para aparecer como usuarios legítimos.

Este tipo de conducta no solo viola las normas de un buen uso de la red, sino que obliga a los equipos técnicos de Wikimedia a una monitorización continua y a un uso constante de recursos para proteger la infraestructura.

Recursos que podrían ser asignados en su lugar para mejorar la plataforma o enriquecer su contenido.

En respuesta a esta situación, la Fundación Wikimedia está tratando de no limitarse a una reacción técnica o defensiva. La solución propuesta va más allá de simplemente contener el problema y busca una gestión colaborativa y sostenible del conocimiento libre.

Así, nace WE5, una nueva iniciativa estratégica destinada a promover enfoques más equitativos y responsables en la adquisición y uso de datos alojados en la plataforma.

El proyecto se presenta como una invitación a las empresas de tecnología y desarrolladores de inteligencia artificial.

Específicamente, una invitación a respetar las reglas, contribuir a los costos de gestión de la red y asegurar la supervivencia de la infraestructura en la que se basa una de las principales fuentes de información gratuita en el mundo.

Todo el asunto plantea una pregunta crucial para el futuro del acceso libre al conocimiento: en una era donde los datos se han convertido en la savia de la inteligencia artificial, ¿quién paga por la preservación y distribución de esos datos?

Wikimedia, siempre impulsado por el principio de gratuidad y compartición, ahora se encuentra en la encrucijada entre la apertura y la sostenibilidad.

Sin un cambio de rumbo por parte de las grandes tecnológicas y los actores que utilizan masivamente el contenido de la fundación, el proyecto podría verse obligado a reducir la accesibilidad o introducir límites más estrictos para salvaguardar su infraestructura.

Un llamamiento al respeto del bien público digital

El mensaje que Wikimedia envía al mundo es claro. Es decir, el conocimiento libre es un bien común y, como tal, debe ser tratado con respeto y responsabilidad.

El uso con fines comerciales de los enormes activos informativos puestos a disposición por la fundación debe realizarse de manera transparente, de acuerdo con las normas y. Además, si es necesario, acompañado de formas de contribución justa.

En un paisaje digital cada vez más dominado por algoritmos y automatización, es esencial asegurar que el acceso al conocimiento no se vea comprometido por los intereses económicos de unos pocos.

Solo a través de un diálogo abierto entre comunidades, instituciones y empresas será posible mantener vivo el sueño de una enciclopedia global libre, accesible y sostenible.

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Comercie con criptomonedas en cualquier lugar y en cualquier momento
qrCode
Escanee para descargar la aplicación Gate.io
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)