La IA y la mediocridad: el peligro invisible

-Por Cristian Situ-

En el 2024, dos investigadores de la University College London y la Universidad de Exeter publicaron en Science Advances un experimento que debería haber generado más conversación de la que generó. Anil Doshi y Oliver Hauser reclutaron a cerca de trescientas personas y les pidieron que escribieran cuentos cortos. Un grupo lo hizo sin ayuda. Otro recibió ideas de ChatGPT. Un tercero pudo consultar hasta cinco ideas generadas por IA antes de empezar. Los resultados fueron reveladores: las historias asistidas por IA fueron evaluadas, en promedio, como más creativas, mejor escritas y más entretenidas. La IA mejoraba el resultado individual. Hasta ahí, buenas noticias.

Pero había un problema. Las historias asistidas por IA se parecían entre sí mucho más que las escritas sin ayuda: eran más homogéneas como conjunto. La conclusión de los autores fue directa: el acceso a ideas generadas por IA hace que cada historia parezca más creativa cuando se la evalúa individualmente, pero reduce la diversidad y la novedad del conjunto.

Ese es el dilema que este artículo quiere explorar. No si la IA es útil, que lo es. Sino qué perdemos cuando todos usamos la misma herramienta para pensar.

La máquina de la mediocridad

Para entender el fenómeno hay que entender cómo funciona la herramienta. Los grandes modelos de lenguaje, los LLMs que están detrás de ChatGPT, Claude, Gemini y los que vendrán, no generan ideas en el sentido pleno de la palabra. Operan sobre distribuciones estadísticas de todo el texto que han procesado durante su entrenamiento: miles de millones de palabras, artículos, ensayos, reportes, correos. Cuando producen una respuesta, entregan lo más probable dado todo lo que ya existe.

Su output por defecto es, en términos precisos, el promedio ponderado de lo que se ha escrito. Eso no es un defecto de diseño. Es exactamente para lo que fueron construidos. El problema aparece cuando ese promedio reemplaza el pensamiento en lugar de asistirlo.

Un estudio de Microsoft Research y Carnegie Mellon University publicado en 2025 con 319 trabajadores del conocimiento encontró que quienes confiaban más en la capacidad de la IA para completar una tarea ejercían menos pensamiento crítico y producían un conjunto significativamente menos diverso de resultados que quienes no usaban estas herramientas (Lee et al., 2025). La variable que mediaba ese efecto tiene un nombre técnico que vale la pena aprender: cognitive offloading, o descarga cognitiva. El cerebro, como cualquier sistema que busca eficiencia, tiende a externalizar procesos mentales cuando una herramienta puede ejecutarlos. El problema es que esa externalización tiene costos que no aparecen de inmediato.

Los propios investigadores de Microsoft usan la metáfora de los músculos. Un músculo que no se usa se atrofia. No de golpe, sino gradualmente, casi sin que te des cuenta. Primero dejas de notar la diferencia. Después, cuando lo necesitas, ya no responde igual.

Un dilema que no es nuevo

La tensión entre eficiencia y diversidad cognitiva no es un problema que inventó la IA. Es, en realidad, uno de los dilemas clásicos de la teoría organizacional. La investigación en psicología de grupos lleva décadas documentando que la diversidad cognitiva, la presencia de personas que razonan de maneras distintas, que parten de marcos conceptuales distintos, que llegan a los mismos problemas desde trayectorias distintas, es uno de los predictores más robustos del rendimiento colectivo en contextos complejos (Sourati et al., 2026). Un equipo de personas con razonamientos divergentes supera sistemáticamente a un equipo de personas altamente capaces pero que piensan de manera similar. La diversidad no es un valor decorativo: es una ventaja funcional.

Lo que hacen los estudios recientes es mostrar que esa ventaja se erosiona cuando todos los miembros de un equipo externalizan sus procesos cognitivos al mismo modelo. Un estudio publicado en PNAS Nexus (Anderson et al., 2025) encontró la paradoja que ya adelantó el experimento de Doshi y Hauser, pero a mayor escala: los LLMs igualan o superan a los humanos en las medidas de creatividad individual, pero sus outputs son notablemente similares entre sí. La variabilidad colectiva se contrae cuando todos consultan a la misma fuente.

En simple: más productividad aparente. Menos pensamiento real. Más individuos que parecen creativos. Menos creatividad como fenómeno colectivo.

Kumar et al. (2025) añaden un matiz importante: el uso de LLMs mejora la fluidez de ideas a nivel individual, es decir, la cantidad de ideas que una persona genera, pero reduce la flexibilidad y la originalidad a nivel colectivo, que son precisamente las dimensiones del pensamiento divergente asociadas a la innovación no incremental. En otras palabras, la IA puede hacer que los equipos sean mejores en optimizar lo que ya existe y peores en imaginar lo que todavía no existe.

Hay un bucle y es preocupante

Gesnot (2025), en un extenso análisis sobre el impacto de la IA en el pensamiento humano, señala una dimensión del problema que suele quedar fuera de la conversación: los modelos futuros se entrenan con el contenido que generan los modelos actuales. Si ese contenido ya está homogeneizado, el próximo ciclo de entrenamiento amplificará esa homogeneidad. La diversidad cognitiva no solo se reduce hoy. Se vuelve estructuralmente más difícil de recuperar mañana.

Es un bucle de retroalimentación. Y se retroalimenta en silencio, a través de millones de documentos, propuestas, análisis y textos que parecen correctos, que en cierta medida lo son, pero que paulatinamente se asemejan más entre sí.

El problema que no está en los datos

Todo lo anterior se vuelve más urgente cuando se traslada al contexto del Sur Global, y es aquí donde la conversación habitual sobre IA y productividad muestra su punto ciego más significativo.

Los grandes modelos de lenguaje fueron entrenados predominantemente con texto en inglés, producido en contextos del Norte Global, que refleja los marcos conceptuales, las jerarquías de conocimiento y los supuestos epistémicos de esas sociedades. Esto no es una opinión ideológica: es una realidad técnica que sus propios creadores reconocen. Lo que Gesnot (2025) llama estandarización cognitiva, la convergencia no solo de los outputs sino del lenguaje, los referentes culturales y los marcos de interpretación que los modelos privilegian, no opera igual en todas partes. Para las organizaciones del Sur Global, esa estandarización opera sobre un terreno ya asimétrico.

Cuando un profesional en Lima, Nairobi o Karachi usa estas herramientas para estructurar un análisis de política pública, un diagnóstico organizacional o una estrategia de comunicación, no está usando una herramienta neutral. Está siendo guiado, de manera no explícita, hacia formas de pensar que no necesariamente corresponden a su contexto, a sus categorías culturales, a los problemas específicos que intenta resolver. Las tradiciones intelectuales latinoamericanas, africanas, del sur de Asia, los saberes situados, las epistemologías construidas desde la experiencia del Sur, están subrepresentadas en los datos de entrenamiento. El promedio que el modelo ofrece no es universal: es el promedio de una parte del mundo.

Las organizaciones de la región que adoptan estas herramientas sin una reflexión crítica no solo importan una tecnología de productividad. También importan, inadvertidamente, un marco epistémico que no les pertenece. La innovación social en el Sur no puede generarse con el promedio estadístico del Norte.

No es la herramienta: es la relación

Sería inexacto concluir que la homogeneización cognitiva es un destino inevitable. La evidencia también apunta en otra dirección, aunque todos esos caminos tienen algo en común: requieren intencionalidad.

El mismo estudio de Microsoft que documentó la atrofia cognitiva encontró un dato que rara vez se cita: cuando los trabajadores tenían poca confianza en la capacidad de la IA para resolver una tarea, ejercían más pensamiento crítico, evaluaban el output con mayor rigor y reportaban mayor confianza en su propia capacidad para mejorarlo (Lee et al., 2025). La fricción cognitiva, el esfuerzo de pensar, dudar, cuestionar, contrastar, no es el obstáculo. Es parte de la solución.

Meincke et al. (2024) demostraron que ciertas formas de diseñar los prompts producen outputs significativamente más diversos. Bordas et al. (2025) mostraron que introducir conocimiento no relacionado en el proceso de ideación puede reducir el efecto de convergencia. El experimento de Doshi y Hauser, que abrió este artículo, también sugiere algo en esa dirección: los escritores que recibieron ideas de IA pero las usaron como punto de partida para divergir, no como guión a seguir, lograron resultados más originales que quienes simplemente las adoptaron.

Hay una diferencia fundamental entre usar la IA como un asistente que propone y el humano critica, reformula, contradice y contextualiza, y usarla como un oráculo al que se acata porque es más rápido que pensar. La primera es una herramienta. La segunda es una sustitución.

Lo que no aparece en los reportes de productividad

El pensamiento crítico y divergente no es un lujo intelectual. En el contexto de las democracias latinoamericanas, marcadas por la desigualdad, la complejidad institucional y la necesidad de soluciones que emerjan desde los propios contextos, es una necesidad funcional. Es también, en cierta medida, un acto político.

Las organizaciones de sociedad civil, los equipos de diseño de políticas públicas, los colectivos que trabajan en innovación social, producen valor precisamente porque ven lo que el mainstream no ve. Porque sus marcos de análisis están situados. Porque su conocimiento es local, específico, irreductible a un promedio estadístico. Cuando esos equipos empiezan a producir documentos indistinguibles entre sí, no están siendo más eficientes. Están perdiendo lo que los hace valiosos.

La respuesta no es rechazar las herramientas. Sería tanto ingenuo como contraproducente. La respuesta es una adopción crítica, que incluya formación explícita en pensamiento crítico como competencia complementaria al uso de IA, que diseñe procesos de trabajo con fricción intencional, que insista en la diversificación epistémica activa y que trate el sesgo de entrenamiento de los modelos no como un detalle técnico sino como una variable política.

La tecnología convergerá. Ese es su impulso natural, su lógica de diseño, el resultado inevitable de los incentivos que la producen.

El desafío, especialmente para el Sur Global, es asegurarse de que el pensamiento no converja con ella.

Este artículo está basado en un reporte académico presentado a Hyper Island y ha sido actualizado para incorporar nuevos hallazgos y perspectivas.

Portada: ilustración por Alona Horkova .

Referencias

Anderson, C. et al. (2025) 'Large language models are homogeneously creative', PNAS Nexus, 5(3), art. pgag042. doi: 10.1093/pnasnexus/pgag042.
Bordas, A., Le Masson, P. y Weil, B. (2025) 'Switching perspectives: Enhancing generative artificial intelligence's creativity, by humans, with design', Creativity and Innovation Management. doi: 10.1111/CAIM.70013.
Doshi, A.R. y Hauser, O.P. (2024) 'Generative AI enhances individual creativity but reduces the collective diversity of novel content', Science Advances, 10(28), art. eadn5290. doi: 10.1126/sciadv.adn5290.
Gerlich, M. (2025) 'AI tools in society: Impacts on cognitive offloading and the future of critical thinking', Societies, 15(1), art. 6. doi: 10.3390/soc15010006.
Gesnot, R. (2025) The impact of artificial intelligence on human thought. Documento de trabajo, arXiv:2508.16628 [cs.CY]. Disponible en: https://arxiv.org/abs/2508.16628.
Kumar, H. et al. (2025) 'Human creativity in the age of LLMs: Randomized experiments on divergent and convergent thinking', en CHI '25: Proceedings of the 2025 CHI Conference on Human Factors in Computing Systems, pp. 1-18. doi: 10.1145/3706598.3714198.
Lee, M. et al. (2025) 'The impact of generative AI on critical thinking: Self-reported reductions in cognitive effort and confidence effects from a survey of knowledge workers', en Proceedings of CHI 2025. Microsoft Research / Carnegie Mellon University.
Meincke, L. et al. (2024) 'Prompt engineering and divergent AI-generated ideas: Chain-of-thought outperforms alternatives', documento de trabajo.

Sobre Cristian

Especialista en innovación, diseño de productos digitales y gestión de proyectos con más de 15 años de experiencia. Apasionado por el liderazgo, la educación y el diseño centrado en las personas. Ha trabajado como Education & Product Manager en Crehana y como Head of Product en Colectivo23, plataforma educativa de Intercorp. Actualmente es Líder de Innovación & Estrategia en Más Igualdad Perú, así como Co-Director Ejecutivo y Fundador de Sur Global, una iniciativa sin fines de lucro para impulsar la innovación responsable en LATAM. Además, ha colaborado como consultor con organizaciones como UNICEF, Volvo y el Ministerio de Educación del Perú.