Uncategorized

Meta cierra alianzas con CNN, Fox News, Le Monde y otros para nutrir su sistema de IA

Meta AI, el chatbot de la empresa matriz de Facebook, ahora tendrá la capacidad de responder en tiempo real con una gama más amplia de contenido noticioso. La compañía dirigida por Mark Zuckerberg anunció acuerdos de licencia con casi una decena de firmas mediáticas para utilizar sus publicaciones en los resultados entregados por su sistema de inteligencia artificial (IA) .

En un comunicado de prensa, la empresa informó que se asoció con CNN, Fox News, Fox Sports, Le Monde Group, la cartera de marcas de medios de People Inc., The Daily Caller, The Washington Examiner, USA TODAY y USA TODAY Network para ampliar la variedad del contenido en tiempo real que Meta AI utiliza para ofrecer respuestas noticiosas a los usuarios.


La nueva sede europea de Meta y Facebook en la Plaza del Gran Canal de Dublín.

Meta utilizó LibGen, una base de datos ilegal en línea, saltándose así los derechos de autor y el trabajo de múltiples investigadores.


“Los eventos en tiempo real pueden ser difíciles de seguir para los sistemas de IA actuales, pero al integrar más y diferentes tipos de fuentes de noticias, nuestro objetivo es mejorar la capacidad de Meta AI para proporcionar contenido oportuno y relevante con una amplia gama de perspectivas y formatos”, explicó la compañía.

Meta subrayó que estas alianzas también facilitarán a las audiencias el acceso a los enlaces de los artículos de referencia para ampliar su investigación, condición que permitirá a sus nuevos socios llegar a públicos adicionales y captar lectores en beneficio de su negocio. Esta no es la primera vez que Meta alcanza un acuerdo para licenciar contenido noticioso. El año pasado, la firma llegó a un convenio con Reuters para entrenar a su chatbot con los materiales producidos por la agencia.

Meta quiere evitar demandas

Las nuevas alianzas surgen en un momento en el que diversos actores de la industria editorial y de producción de contenidos han denunciado el uso indebido de sus publicaciones por parte de empresas tecnológicas para entrenar modelos de IA. Esta semana, por ejemplo, The New York Times presentó una demanda contra Perplexity al acusar que el motor de búsqueda había violado derechos de autor durante los últimos 18 meses.

El descontento no solo proviene del empleo de publicaciones para procesos de entrenamiento. También está relacionado con ciertas funciones basadas en IA que, según los editores, reducen la probabilidad de que los usuarios visiten los sitios web originales, lo que limita sus posibilidades de generar ingresos publicitarios.

En septiembre, Penske Media Corporation (PMC), empresa matriz de revistas como Rolling Stone, Variety y The Hollywood Reporter, presentó una demanda contra Google al considerar que la función AI Overviews afecta de manera grave el tráfico hacia sus portales y, en consecuencia, su capacidad de obtener ingresos por publicidad y suscripciones. Los argumentos coinciden con un análisis del Pew Research Center que reveló que solo el 1% de los usuarios hace clic en los enlaces citados en los resúmenes generados por IA que aparecen en el motor de búsqueda.

Rolling Stone demanda Google IA 458537943

Página web de la revista Rolling Stone en una ventana de Google Chrome vista en la pantalla de una computadora.Getty Images

Sin datos de calidad para entrenar la IA

Las nuevas asociaciones de Meta no solo buscan evitar conflictos similares. También forman parte de una estrategia necesaria ante la escasez de datos de calidad que enfrentan los desarrolladores de IA para entrenar sus sistemas. Data Provenance Initiative, un colectivo liderado por el Instituto de Tecnología de Massachusetts, sostiene que los editores y plataformas informativas en línea están estableciendo medidas más estrictas para impedir que sus publicaciones sean utilizadas para capacitar productos como Gemini o GPT. Como consecuencia, han restringido el acceso al 5% de los contenidos que antes eran públicos. Además, el 25% de los datos de mayor calidad se ha vuelto inaccesible. Organizaciones como Google han intentado responder a esta falta de información con datos sintéticos, pero la fiabilidad del procedimiento sigue en duda.

Meta no es la única empresa tecnológica que ha cerrado acuerdos con grandes editoriales para garantizar la disponibilidad de información de calidad para entrenar sus modelos de IA. OpenAI ha firmado múltiples convenios semejantes. En julio de 2023 alcanzó un acuerdo con la agencia Associated Press y, cinco meses después, concretó un contrato con el conglomerado alemán Axel Springer para utilizar información publicada en sitios como Business Insider y Politico. En abril del año pasado, se asoció con Financial Times y, quince días después, cerró un trato con Prisa Media, propietaria de títulos como El País, Cinco Días, AS y El HuffPost. Más adelante, en agosto de 2024 firmó un acuerdo con el grupo Condé Nast, editor de Wired, Vogue y GQ, entre otras publicaciones.

Al mismo tiempo, editores y creadores de contenido buscan alternativas para proteger sus obras en la era de la IA. Una de las propuestas más recientes es el estándar Really Simple Licensing (RSL), un modelo abierto y descentralizado de licencias que permite a los propietarios de contenidos definir cómo deben pagar los desarrolladores de IA por extraer información desde sus sitios web.

Sus desarrolladores sostienen que “con este estándar como clave tecnológica, la industria de internet dispone ahora de la infraestructura necesaria para aplicar un modelo de licencias colectivas en la red: establecer precios de mercado justos y fortalecer la capacidad de negociación de todos los editores”.