{"id":830,"date":"2025-04-21T19:19:08","date_gmt":"2025-04-21T19:19:08","guid":{"rendered":"http:\/\/6806742d72a4dfe053dde49f"},"modified":"2025-04-21T19:19:08","modified_gmt":"2025-04-21T19:19:08","slug":"la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet","status":"publish","type":"post","link":"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/","title":{"rendered":"La insaciable glotoner\u00eda de los bots de IA es un dolor de cabeza para Wikipedia y el resto del internet"},"content":{"rendered":"<div class=\"media_block\"><img decoding=\"async\" src=\"https:\/\/media.es.wired.com\/photos\/6806742d987f6a2d39ca1e97\/master\/pass\/Nuova%20immagine%20anteprima%20COPilot%20(5).png\" class=\"media_thumbnail\"><\/div>\n<p>Una <a data-offer-url=\"https:\/\/diff.wikimedia.org\/2025\/04\/01\/how-crawlers-impact-the-operations-of-the-wikimedia-projects\/\" class=\"external-link\" data-event-click=\"{&quot;element&quot;:&quot;ExternalLink&quot;,&quot;outgoingURL&quot;:&quot;https:\/\/diff.wikimedia.org\/2025\/04\/01\/how-crawlers-impact-the-operations-of-the-wikimedia-projects\/&quot;}\" href=\"https:\/\/diff.wikimedia.org\/2025\/04\/01\/how-crawlers-impact-the-operations-of-the-wikimedia-projects\/\" rel=\"nofollow noopener\" target=\"_blank\">declaraci\u00f3n<\/a> de la Wikimedia Foundation, la fundaci\u00f3n que gestiona Wikipedia, <strong>alerta sobre uno de los costos ocultos de la inteligencia artificial generativa.<\/strong> Los grandes sistemas de formaci\u00f3n de modelos ling\u00fc\u00edsticos necesitan alimentarse constantemente con una enorme cantidad de datos que, adem\u00e1s de conjuntos de datos p\u00fablicos y privados, tambi\u00e9n se extraen directamente de la web mediante <em>rastreadores<\/em>. Los crawlers, ratreadores, o spider bots, son programas inform\u00e1ticos normalmente utilizados por los motores de b\u00fasqueda, que los emplean para indexar contenidos. Estas acciones <strong>consumen recursos y, por tanto, tienen un costo<\/strong> para los sitios que visitan automaticamente, como <a data-offer-url=\"https:\/\/commons.wikimedia.org\/wiki\/Commons:Welcome\" class=\"external-link\" data-event-click=\"{&quot;element&quot;:&quot;ExternalLink&quot;,&quot;outgoingURL&quot;:&quot;https:\/\/commons.wikimedia.org\/wiki\/Commons:Welcome&quot;}\" href=\"https:\/\/commons.wikimedia.org\/wiki\/Commons:Welcome\" rel=\"nofollow noopener\" target=\"_blank\">Wikimedia Commons<\/a>, el archivo de 144 millones de im\u00e1genes, v\u00eddeos y archivos que pueden copiarse, descargarse, distribuirse y modificarse bajo la <a data-offer-url=\"https:\/\/creativecommons.org\/licenses\/by-sa\/3.0\/\" class=\"external-link\" data-event-click=\"{&quot;element&quot;:&quot;ExternalLink&quot;,&quot;outgoingURL&quot;:&quot;https:\/\/creativecommons.org\/licenses\/by-sa\/3.0\/&quot;}\" href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/3.0\/\" rel=\"nofollow noopener\" target=\"_blank\">licencia Creative Commons<\/a> de la fundaci\u00f3n.<\/p>\n<p>Los <a data-offer-url=\"https:\/\/wikimediafoundation.org\/our-work\/wikimedia-projects\/#a1-reference\" class=\"external-link\" data-event-click=\"{&quot;element&quot;:&quot;ExternalLink&quot;,&quot;outgoingURL&quot;:&quot;https:\/\/wikimediafoundation.org\/our-work\/wikimedia-projects\/#a1-reference&quot;}\" href=\"https:\/\/wikimediafoundation.org\/our-work\/wikimedia-projects\/#a1-reference\" rel=\"nofollow noopener\" target=\"_blank\">proyectos<\/a> Wikimedia \u2013que van m\u00e1s all\u00e1 de Wikipedia e incluyen tambi\u00e9n Wikilibros y Wikcionario, por citar s\u00f3lo algunos\u2013 se basan de hecho en dos elementos principales: contenidos libres y accesibles para todos, y el trabajo voluntario de la comunidad que los elabora. Y es precisamente esto lo que la hace atractiva para nuevos rastreadores que, adem\u00e1s de los ya existentes y del tr\u00e1fico humano, <strong>consumen los recursos de proyectos como el de la enciclopedia m\u00e1s popular del mundo<\/strong>, cuyo contenido es gratuito para el usuario, pero cuesta dinero a la fundaci\u00f3n.<\/p>\n<h2>El auge del tr\u00e1fico<\/h2>\n<p>A medida que los LLM y los chatbots vinculados a sus modelos se han vuelto m\u00e1s comunes, el volumen de peticiones ha aumentado exponencialmente. Las cifras publicadas en el comunicado muestran un <strong>crecimiento del tr\u00e1fico de descargas del 50%<\/strong> desde enero de 2024. Wikimedia denuncia que el auge de las peticiones no procede de los usuarios, sino del software que explota su cat\u00e1logo para alimentar modelos generativos de IA, algo para lo que la fundaci\u00f3n no estaba preparada. <strong>El 65% del tr\u00e1fico m\u00e1s caro hoy procede de bots<\/strong>, por la sencilla raz\u00f3n de que la demanda de contenidos de un humano es muy peque\u00f1a comparada con la de un software.<\/p>\n<p>Por ejemplo, la navegaci\u00f3n de un usuario puede llevarle a buscar la palabra &#8220;<em>crawler<\/em>&#8220;, de ah\u00ed a hacer clic en la palabra &#8220;<em>scraping<\/em>&#8220;, y as\u00ed sucesivamente. En t\u00e9rminos de datos, estamos hablando de una velocidad y cantidad limitadas para un gran n\u00famero de usuarios. En cambio, cuando se trata de bots, las cantidades son enormes y las peticiones se producen en grandes bloques. Solo el 35% de las p\u00e1ginas vistas son visitadas por bots, pero generan <strong>dos tercios del tr\u00e1fico m\u00e1s caro<\/strong>. Esta situaci\u00f3n se vuelve problem\u00e1tica cuando la plataforma enfrenta picos de tr\u00e1fico donde las b\u00fasquedas humanas son altas, es decir, cuando las noticias y los eventos actuales llevan a millones de usuarios en todo el mundo a buscar las mismas entradas en la enciclopedia. En ese momento la navegaci\u00f3n se ralentiza o no se produce como se espera.<\/p>\n<h2>Los datos como mercanc\u00eda<\/h2>\n<p>La disponibilidad de datos es uno de los <em>activos<\/em> clave del enfoque actual de las grandes empresas tecnol\u00f3gicas hacia los modelos ling\u00fc\u00edsticos a gran escala. Bas\u00e1ndose en una enorme cantidad de par\u00e1metros, estas tecnolog\u00edas requieren conjuntos de datos enormes y de alta calidad, es decir, creados y revisados \u200b\u200bpor humanos. Basadas en un gran n\u00famero de par\u00e1metros, estas tecnolog\u00edas requieren infinitos conjuntos de datos de alta calidad, es decir, creados y revisados por humanos. Como es sabido, los contenidos sint\u00e9ticos pueden contener imprecisiones y errores, com\u00fanmente llamados alucinaciones. Por eso, es esencial que los datos sean lo m\u00e1s precisos posible, lo que es viable cuando existe un proceso de revisi\u00f3n y edici\u00f3n. A\u00fan con todas sus limitaciones y distinciones inevitables, <strong>este procedimiento t\u00edpicamente humano garantiza una cierta calidad del resultado<\/strong>, y se basa en la idea de la libre circulaci\u00f3n del conocimiento. Para evitar el problema de la autofagia de la IA generativa, es decir, que los chabots devuelvan resultados de nivel progresivamente inferior debido a la cantidad de contenido sint\u00e9tico en los conjuntos de datos de los modelos, este tipo de datos es una condici\u00f3n necesaria para obtener resultados de alto nivel. El contenido humano de calidad es <strong>un bien esencial<\/strong> no s\u00f3lo para la democracia, sino tambi\u00e9n para la industria privada de la inteligencia artificial.<\/p>\n<p>Para el universo Wiki, de hecho, no se trata s\u00f3lo de una cuesti\u00f3n de costes, sino tambi\u00e9n de capital humano, que, ante el uso masivo de los contenidos creados gratuitamente por su comunidad, ve <strong>disminuir la presencia de usuarios en su sitio.<\/strong> A largo plazo, estos factores pueden amenazar la existencia de la comunidad de voluntarios que se ocupa de ella.<\/p>\n<p>Consultada por WIRED, Birgit Mueller, Directora de Producto, MediaWiki y Experiencias de Desarrolladores de la Fundaci\u00f3n Wikimedia, declar\u00f3: &#8220;Creemos que el prop\u00f3sito de la IA es ser \u00fatil a la gente, y para ello necesita la disponibilidad continua de contenidos escritos y verificados por humanos. <strong>El hecho de que estas empresas consuman sistem\u00e1ticamente contenidos de nuestro sitio web demuestra lo valiosos que son<\/strong>; al mismo tiempo, estas empresas no est\u00e1n haciendo lo suficiente para apoyar a las personas y la infraestructura de las que depende en \u00faltima instancia la IA. Las empresas que utilizan y comparten la informaci\u00f3n contenida en Wikipedia y proyectos relacionados son bienvenidas, pero <strong>les pedimos que lo hagan de una manera que apoye la sostenibilidad a largo plazo de la plataforma<\/strong> y de nuestras comunidades de voluntarios: por un lado, atribuyendo la procedencia de los contenidos, para reconocer la contribuci\u00f3n de los voluntarios y ayudar a que los usuarios vuelvan a nuestro sitio, y por otro lado, consumiendo nuestros contenidos de una manera que no suponga una carga para nuestros servidores y garantice la sostenibilidad financiera de nuestra misi\u00f3n: el conocimiento libre&#8221;<em>.<\/em><\/p>\n<div class=\"ContentCardEmbedWrapper-kULtsE iGAJsG content-card-embed content-card-embed--stacked\" data-testid=\"ContentCardEmbedWrapper\" readability=\"24.809352517986\">\n<div class=\"ContentCardEmbedImage-iwqgVw jlIubp content-card-embed__image\" data-testid=\"ContentCardEmbedImage\"><span class=\"SpanWrapper-umhxW jvZaPI responsive-asset\"><picture class=\"ResponsiveImagePicture-cWuUZO dUOtEa responsive-image\"><img decoding=\"async\" alt=\"Carmen Alca\u0301zar\" class=\"ResponsiveImageContainer-eybHBd fptoWY responsive-image__image\" src=\"https:\/\/media.es.wired.com\/photos\/63d1de380e342a546864e085\/master\/w_775%2Cc_limit\/Carmen_Alca%25CC%2581zar_2.png\" srcset=\"https:\/\/media.es.wired.com\/photos\/63d1de380e342a546864e085\/master\/w_120,c_limit\/Carmen_Alca%CC%81zar_2.png 120w, https:\/\/media.es.wired.com\/photos\/63d1de380e342a546864e085\/master\/w_240,c_limit\/Carmen_Alca%CC%81zar_2.png 240w, https:\/\/media.es.wired.com\/photos\/63d1de380e342a546864e085\/master\/w_320,c_limit\/Carmen_Alca%CC%81zar_2.png 320w, https:\/\/media.es.wired.com\/photos\/63d1de380e342a546864e085\/master\/w_640,c_limit\/Carmen_Alca%CC%81zar_2.png 640w\" sizes=\"100vw\"><\/picture><\/span><\/div>\n<div class=\"ContentCardEmbedInfo-bDftKl bGnSrq\" readability=\"27.064748201439\">\n<div class=\"BaseWrap-sc-gjQpdd BaseText-ewhhUZ ContentCardEmbedHed-kJVPGC iUEiRd cekThb cewqFA content-card-embed__hed\" data-testid=\"ContentCardEmbedHed\"><a class=\"BaseWrap-sc-gjQpdd BaseText-ewhhUZ BaseLink-eNWuiM ContentCardEmbedHedLink-eXLwe iUEiRd cekThb gqhxzW eFUKSb content-card-embed__hed-link\" href=\"https:\/\/es.wired.com\/articulos\/wikipedia-en-espanol-entrevista-con-su-presidenta\" data-testid=\"ContentCardEmbedHedLink\">As\u00ed es la batalla de Wikipedia en espa\u00f1ol contra la desinformaci\u00f3n<\/a><\/div>\n<p>Aunque se trate del conductor mexicano Chabelo, o de la crisis sanitaria, Wikipedia se toma la informaci\u00f3n en serio. WIRED en Espa\u00f1ol habl\u00f3 con la presidenta de Wikimedia M\u00e9xico para conocer sus esfuerzos.<\/p>\n<\/div>\n<\/div>\n<h2>M\u00e1s all\u00e1 de Wikipedia<\/h2>\n<p>La din\u00e1mica recuerda a la que existe entre los sitios de noticias y las plataformas sociales, y por supuesto a la que existe entre los editores y los productores de inteligencia artificial generativa. El problema en este caso, sin embargo, no est\u00e1 relacionado con los derechos de autor, sino con el hecho de que si <strong>el sitio que realmente ha creado ese contenido no es aquel en el que un usuario lo encuentra<\/strong> \u2013porque por ejemplo puede verlo resumido por Google dentro del buscador\u2013 acabar\u00e1 por no ir a buscarlo a la fuente. Simplificando, si le pido a Gemini, o a Claude, quiz\u00e1s con un comando de voz, que me diga qu\u00e9 es un rastreador web, y encuentro la respuesta dentro del chat, \u00bfpor qu\u00e9 deber\u00eda abrir <a href=\"https:\/\/es.wired.com\/articulos\/wikitok-el-contenido-de-wikipedia-en-formatos-tiktok\">Wikipedia<\/a>? Los peri\u00f3dicos y los proyectos con \u00e1nimo de lucro pueden correr a esconderse con iniciativas como los paywalls o las licencias de uso, pero esto no puede ocurrirle a Wikimedia, que basa su propia existencia en la apertura y la gratuidad.<\/p>\n<p>En un momento en que casi <strong>la mitad del tr\u00e1fico en l\u00ednea es generado por <em>bots<\/em><\/strong>, cabe preguntarse si los LLM est\u00e1n acelerando la transici\u00f3n hacia un <a href=\"https:\/\/es.wired.com\/articulos\/por-que-internet-corre-el-riesgo-de-convertirse-en-posthumano\" target=\"_blank\">Internet posthumano<\/a>: una <em>world wide web<\/em> en la que las acciones son realizadas por <em>bots<\/em> de distintos tipos, en lugar de usuarios reales. Un escenario en el que los asistentes virtuales \u2013<em>chatbots<\/em> con los que podemos comunicarnos en lenguaje natural\u2013 recuperan la informaci\u00f3n que les pedimos y nos la devuelven a trav\u00e9s de las interfaces de la propia IA generativa, sin que visitemos un sitio, sino simplemente <strong>permaneciendo en una aplicaci\u00f3n conectada a la web<\/strong>.<\/p>\n<p>La idea b\u00e1sica de los agentes aut\u00f3nomos presupone esto: tanto si la petici\u00f3n es reservar un viaje como conocer la definici\u00f3n de &#8220;dialelo&#8221;, poco importa, <strong>los agentes aut\u00f3nomos har\u00e1n lo solicitado sin que tengamos que teclearlo en un buscador<\/strong> o, incluso, en Wikipedia. Las consecuencias de este proceso ya en marcha son cada vez m\u00e1s visibles.<\/p>\n<p><em>Art\u00edculo originalmente publicado en<\/em> <a href=\"https:\/\/www.wired.it\/article\/training-ai-bot-scraping-internet-wikipedia\/\">WIRED Italia<\/a><em>. Adaptado por Camila Enr\u00edquez.<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Una declaraci\u00f3n de la Wikimedia Foundation, la fundaci\u00f3n que gestiona Wikipedia, alerta sobre uno de los costos ocultos de la inteligencia artificial generativa. Los grandes sistemas de formaci\u00f3n de modelos ling\u00fc\u00edsticos necesitan alimentarse constantemente con una enorme cantidad de datos que, adem\u00e1s de conjuntos de datos p\u00fablicos y privados, tambi\u00e9n se extraen directamente de la [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":831,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-830","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-technology"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v24.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>La insaciable glotoner\u00eda de los bots de IA es un dolor de cabeza para Wikipedia y el resto del internet - TecnoArtesanos Tech Blog<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/\" \/>\n<meta property=\"og:locale\" content=\"en_US\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"La insaciable glotoner\u00eda de los bots de IA es un dolor de cabeza para Wikipedia y el resto del internet - TecnoArtesanos Tech Blog\" \/>\n<meta property=\"og:description\" content=\"Una declaraci\u00f3n de la Wikimedia Foundation, la fundaci\u00f3n que gestiona Wikipedia, alerta sobre uno de los costos ocultos de la inteligencia artificial generativa. Los grandes sistemas de formaci\u00f3n de modelos ling\u00fc\u00edsticos necesitan alimentarse constantemente con una enorme cantidad de datos que, adem\u00e1s de conjuntos de datos p\u00fablicos y privados, tambi\u00e9n se extraen directamente de la [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/\" \/>\n<meta property=\"og:site_name\" content=\"TecnoArtesanos Tech Blog\" \/>\n<meta property=\"article:published_time\" content=\"2025-04-21T19:19:08+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/media.es.wired.com\/photos\/6806742d987f6a2d39ca1e97\/master\/pass\/Nuova%20immagine%20anteprima%20COPilot%20(5).png\" \/>\n<meta name=\"author\" content=\"Sergio Morales\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Sergio Morales\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"7 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/\",\"url\":\"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/\",\"name\":\"La insaciable glotoner\u00eda de los bots de IA es un dolor de cabeza para Wikipedia y el resto del internet - TecnoArtesanos Tech Blog\",\"isPartOf\":{\"@id\":\"https:\/\/blog.tecnoartesanos.com\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/blog.tecnoartesanos.com\/wp-content\/uploads\/2025\/04\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet.png\",\"datePublished\":\"2025-04-21T19:19:08+00:00\",\"author\":{\"@id\":\"https:\/\/blog.tecnoartesanos.com\/#\/schema\/person\/ec88bc1410fd158963717c4216f04807\"},\"breadcrumb\":{\"@id\":\"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/#breadcrumb\"},\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/#primaryimage\",\"url\":\"https:\/\/blog.tecnoartesanos.com\/wp-content\/uploads\/2025\/04\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet.png\",\"contentUrl\":\"https:\/\/blog.tecnoartesanos.com\/wp-content\/uploads\/2025\/04\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet.png\",\"width\":775,\"height\":517},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/blog.tecnoartesanos.com\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"La insaciable glotoner\u00eda de los bots de IA es un dolor de cabeza para Wikipedia y el resto del internet\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/blog.tecnoartesanos.com\/#website\",\"url\":\"https:\/\/blog.tecnoartesanos.com\/\",\"name\":\"TecnoArtesanos Tech Blog\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/blog.tecnoartesanos.com\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"en-US\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/blog.tecnoartesanos.com\/#\/schema\/person\/ec88bc1410fd158963717c4216f04807\",\"name\":\"Sergio Morales\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\/\/blog.tecnoartesanos.com\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/3d45178fc8fbbe32d39278bc504fa9093f947f406ff4f1ddcfa27505ab772184?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/3d45178fc8fbbe32d39278bc504fa9093f947f406ff4f1ddcfa27505ab772184?s=96&d=mm&r=g\",\"caption\":\"Sergio Morales\"},\"sameAs\":[\"https:\/\/sergiomorales.space\"],\"url\":\"https:\/\/blog.tecnoartesanos.com\/index.php\/author\/sergiomorales\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"La insaciable glotoner\u00eda de los bots de IA es un dolor de cabeza para Wikipedia y el resto del internet - TecnoArtesanos Tech Blog","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/","og_locale":"en_US","og_type":"article","og_title":"La insaciable glotoner\u00eda de los bots de IA es un dolor de cabeza para Wikipedia y el resto del internet - TecnoArtesanos Tech Blog","og_description":"Una declaraci\u00f3n de la Wikimedia Foundation, la fundaci\u00f3n que gestiona Wikipedia, alerta sobre uno de los costos ocultos de la inteligencia artificial generativa. Los grandes sistemas de formaci\u00f3n de modelos ling\u00fc\u00edsticos necesitan alimentarse constantemente con una enorme cantidad de datos que, adem\u00e1s de conjuntos de datos p\u00fablicos y privados, tambi\u00e9n se extraen directamente de la [&hellip;]","og_url":"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/","og_site_name":"TecnoArtesanos Tech Blog","article_published_time":"2025-04-21T19:19:08+00:00","og_image":[{"url":"https:\/\/media.es.wired.com\/photos\/6806742d987f6a2d39ca1e97\/master\/pass\/Nuova%20immagine%20anteprima%20COPilot%20(5).png","type":"","width":"","height":""}],"author":"Sergio Morales","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Sergio Morales","Est. reading time":"7 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/","url":"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/","name":"La insaciable glotoner\u00eda de los bots de IA es un dolor de cabeza para Wikipedia y el resto del internet - TecnoArtesanos Tech Blog","isPartOf":{"@id":"https:\/\/blog.tecnoartesanos.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/#primaryimage"},"image":{"@id":"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/#primaryimage"},"thumbnailUrl":"https:\/\/blog.tecnoartesanos.com\/wp-content\/uploads\/2025\/04\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet.png","datePublished":"2025-04-21T19:19:08+00:00","author":{"@id":"https:\/\/blog.tecnoartesanos.com\/#\/schema\/person\/ec88bc1410fd158963717c4216f04807"},"breadcrumb":{"@id":"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/#breadcrumb"},"inLanguage":"en-US","potentialAction":[{"@type":"ReadAction","target":["https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/"]}]},{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/#primaryimage","url":"https:\/\/blog.tecnoartesanos.com\/wp-content\/uploads\/2025\/04\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet.png","contentUrl":"https:\/\/blog.tecnoartesanos.com\/wp-content\/uploads\/2025\/04\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet.png","width":775,"height":517},{"@type":"BreadcrumbList","@id":"https:\/\/blog.tecnoartesanos.com\/index.php\/2025\/04\/21\/la-insaciable-glotoneria-de-los-bots-de-ia-es-un-dolor-de-cabeza-para-wikipedia-y-el-resto-del-internet\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/blog.tecnoartesanos.com\/"},{"@type":"ListItem","position":2,"name":"La insaciable glotoner\u00eda de los bots de IA es un dolor de cabeza para Wikipedia y el resto del internet"}]},{"@type":"WebSite","@id":"https:\/\/blog.tecnoartesanos.com\/#website","url":"https:\/\/blog.tecnoartesanos.com\/","name":"TecnoArtesanos Tech Blog","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/blog.tecnoartesanos.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"en-US"},{"@type":"Person","@id":"https:\/\/blog.tecnoartesanos.com\/#\/schema\/person\/ec88bc1410fd158963717c4216f04807","name":"Sergio Morales","image":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/blog.tecnoartesanos.com\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/3d45178fc8fbbe32d39278bc504fa9093f947f406ff4f1ddcfa27505ab772184?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/3d45178fc8fbbe32d39278bc504fa9093f947f406ff4f1ddcfa27505ab772184?s=96&d=mm&r=g","caption":"Sergio Morales"},"sameAs":["https:\/\/sergiomorales.space"],"url":"https:\/\/blog.tecnoartesanos.com\/index.php\/author\/sergiomorales\/"}]}},"_links":{"self":[{"href":"https:\/\/blog.tecnoartesanos.com\/index.php\/wp-json\/wp\/v2\/posts\/830","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.tecnoartesanos.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.tecnoartesanos.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.tecnoartesanos.com\/index.php\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.tecnoartesanos.com\/index.php\/wp-json\/wp\/v2\/comments?post=830"}],"version-history":[{"count":0,"href":"https:\/\/blog.tecnoartesanos.com\/index.php\/wp-json\/wp\/v2\/posts\/830\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.tecnoartesanos.com\/index.php\/wp-json\/wp\/v2\/media\/831"}],"wp:attachment":[{"href":"https:\/\/blog.tecnoartesanos.com\/index.php\/wp-json\/wp\/v2\/media?parent=830"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.tecnoartesanos.com\/index.php\/wp-json\/wp\/v2\/categories?post=830"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.tecnoartesanos.com\/index.php\/wp-json\/wp\/v2\/tags?post=830"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}