Meta hizo trampa con Llama-4 en sus pruebas de IA

Juegos, trampas y mentiras. Facebook no ha estado exento de estas cosas en su ya larga historia. Para reconocerlo solamente basta con recordar el escándalo de Cambridge Analitica, o los ires y venires de lo que realmente hacen con nuestros datos, su papel en las elecciones de EE UU. La lista es larga. En fin, que en esta sociedad seguimos a quienes nos mienten y engañan, como si eso fuera algo de lo más normal.

Meta añade más limitaciones a las cuentas de adolescentes

La compañía anuncia nuevas funciones de seguridad para menores de 16 años en Instagram, Facebook y Messenger.

Meta, según informa Kylie Robinson de The Verge, mintió supuestamente sobre el rendimiento de los dos últimos modelos de IA lanzados durante el fin de semana: Scout, un modelo más pequeño dedicado a consultas rápidas, y Maverick, destinado a ser el rival de ChatGPT-4o. En el anuncio, como viene siendo habitual últimamente, Meta presentó un sinfín de datos técnicos para justificar la afirmación de que su IA era mejor que la de competidores como Google, OpenAI y Anthropic. Y, aunque estos resultaron incomprensibles para la mayoría de quienes los leyeron, algunas personas más experimentadas se dieron cuenta de que el anuncio de la empresa escondía algunos errores que no podían subestimarse.

Al parecer, de hecho, Meta afirmaba que Maverick tenía una puntuación ELO de 1417 en LMArena, una plataforma de evaluación comparativa en la que los usuarios votan los mejores resultados de los modelos de IA. Un valor elevado, que situaba a Maverick en el segundo puesto de una clasificación que lo ve justo por encima de GPT-4o y por debajo de Gemini 2.5 Pro. Sin embargo, de lo que solo unos pocos se dieron cuenta es de que ese resultado tan alto lo había conseguido una versión totalmente diferente a la que se puso a disposición de los usuarios, Llama-4-Maverick-03-26-Experimental, “un modelo personalizado para optimizar las preferencias humanas” y mejorar la conversación con los usuarios. Un detalle que no ha pasado en absoluto desapercibido para los expertos en la materia, que se han percatado de que las respuestas proporcionadas por Maverick son mucho menos elocuentes que las divulgadas en LMArena.

X content

This content can also be viewed on the site it originates from.

En cualquier caso, teniendo en cuenta que cada vez se presta más atención al rendimiento de los modelos de IA que salen al mercado, no es de extrañar que las empresas del sector estén dispuestas a mentir para ganarse la atención de los usuarios. Una estratagema que no sentó nada bien a LMArena, que declaró que el comportamiento de Meta no se ajustaba en absoluto a las expectativas de transparencia de la plataforma. Tampoco a los apasionados usuarios del sector.

Artículo originalmente publicado en WIRED Italia. Adaptado por Mauricio Serfatty Godoy.