¿Qué pasaría si pudieras hablar con alguien del antiguo Egipto? Poder tener una charla con un tipo cualquiera de hace 2,000 años. Un vecino del antiguo Egipto o un campesino de la China de la dinastía Han. ¿No sería increíble poder preguntarle cómo veía el mundo, cuáles eran sus sueños, sus miedos? Bueno, ahora parece que la inteligencia artificial está intentándolo. Vamos a hablar de los modelos de lenguaje históricos (HLLM) y cómo nos pueden dar una idea de la forma en que pensaban esas personas.
¿Qué Son los Modelos de Lenguaje Históricos (HLLM)?
Mira, el tema es así: los modelos de lenguaje grandes como ChatGPT o Gemini AI se entrenan con una cantidad bestial de texto. Desde libros hasta tweets. Pero, ¿qué pasa si hacemos lo mismo con textos de hace milenios? Esa es la idea detrás de los HLLM: entrenar a un modelo con libros, cartas, poesía y cualquier cosa que nos haya quedado de alguna civilización. Así podría simular cómo pensaría un tipo promedio del Imperio Romano o de la Mesopotamia antigua. Brillante, ¿no?
La cosa es que, si alimentas a una IA con todo este material, podría crear una versión digital de alguien de esa época, cuya precisión dependerá directamente de la calidad y cantidad de los textos disponibles. Algo así como un «gemelo digital». Claro, todo es suposición, pero nos da una ventana que nunca antes tuvimos a la psicología y a la forma de pensar de esas personas.
¿Pueden Estas IAs Realmente Simular a Alguien del Pasado?
Vamos a ver. Esto tiene sus complicaciones. Por ejemplo, intentar simular la mentalidad de alguien de hace 2,000 años implica lidiar con ideas y creencias que ya no existen, como la creencia en la influencia de los dioses en cada aspecto de la vida diaria, algo que la IA debe entender para poder responder de manera precisa. No es como que puedas encender un modelo y de repente tengas a Aristóteles dándote una conferencia. Hay algunas cositas que complican el asunto.
Primero, los textos antiguos que tenemos no son la historia completa. Normalmente, la mayoría de estos documentos fueron escritos por la élite: los educados, los ricos, los poderosos. Lo que quiere decir que la voz del pueblo, del que en verdad tenía que lidiar con la vida dura, no siempre está presente. Lo que la IA nos da no es la mente de «Juan el Campesino», sino de «Marco el Escriba».
Además, la calidad del material es importante. Para que estas IA funcionen bien, se necesita mucho contenido y que sea bastante específico. No sirve de mucho tener pedacitos de textos incompletos. Y, claro, los datos modernos no se pueden mezclar con los antiguos, porque, si no, el modelo termina contaminado con cosas que no tienen nada que ver. Sería como darle hamburguesas modernas a un tipo de la antigua Grecia: seguro ni entendería qué se está comiendo.
Ejemplos de Modelos que Intentan Hacerlo: MonadGPT y XunziALLM
Hablemos de ejemplos concretos. Porque sí, ya hay quienes están probando esto. ¿Has oído de MonadGPT? Es un modelo de lenguaje entrenado con más de 11,000 textos históricos. Este modelo habla en inglés, francés y latín, pero no es que se vaya de fiesta hablando de lo que pasa hoy en día. No, MonadGPT se ciñe a lo que se creía hace siglos. Habla de salud, pero del siglo XVII, y si le preguntas de astronomía, te sale con lo que se pensaba hace unos 500 años. Toda una reliquia.
Otro ejemplo curioso es XunziALLM, que está entrenado con textos de la antigua China, específicamente elegidos por su riqueza cultural y su capacidad de reflejar las costumbres y creencias de la época. Este tipo genera poesía como si estuviera escribiendo en el año 800 d.C., usando ideas y expresiones de aquellos tiempos. Es algo como sacar una foto al pasado, pero con palabras. Ojo, es importante no romantizar demasiado esto. Son aproximaciones. Un poeta de verdad de aquellos tiempos podría pensar que esta IA está chiflada. Pero el hecho de que siquiera podamos intentarlo ya es fascinante.
Los Retos de Simular la Mentalidad del Pasado
Ok, no todo es color de rosa, eso seguro. Vamos a hablar de algunos de los desafíos más importantes que complican esta idea y que debemos tener en cuenta. Lo primero que debemos entender es que los modelos de lenguaje tienen sus limitaciones. Hay quienes piensan que si los entrenamos con suficiente información de calidad, estos modelos pueden darnos una idea bastante aproximada de cómo era pensar hace siglos. Pero claro, cuando hablamos de civilizaciones enteras, eso se pone más complicado.
- Calidad y cantidad de datos: Necesitamos muchísimos textos para que la IA entienda lo que estaba pasando, y no siempre los tenemos. Y a veces lo que tenemos son fragmentos, textos rotos, cosas que no cuentan toda la historia.
- Sesgo: Lo otro es que la mayoría de los textos que se conservan fueron escritos por las élites. Esto significa que si la IA aprende solo de eso, solo obtendremos la versión de la élite, que es como escuchar sólo un lado de la historia. Y no olvidemos que a veces estas élites querían parecer más sofisticadas de lo que eran en realidad.
- Complejidad del lenguaje: Los textos históricos están llenos de referencias que hoy pueden sonar absurdas. Cosas como que la tierra es plana o que la salud depende de los «humores». Una IA necesita todo un andamiaje de contexto para entender esas referencias. No es lo mismo una «estrella» en 1500 que una en 2023.
¿Podría la IA Ser el Futuro de la Investigación Histórica?
Hay mucho potencial. La IA podría ayudar a estudiar la naturaleza humana de una manera completamente diferente a como lo hacíamos antes. Podría mostrarnos patrones, cosas que se repiten, aspectos que nos hemos perdido porque simplemente no hay suficiente gente para analizar todo lo que hay. ¿Cuántos estudiosos hay que puedan dedicar toda su vida a analizar todos los textos de la antigua Roma? No muchos. Pero una IA podría hacerlo, y más rápido.
Aún así, no nos engañemos. Esto tiene también mucho de suposición. Y eso está bien, pero hay que tener cuidado. Hay que recordar que la IA está limitada por los datos que le damos. Y esos datos son fragmentados, sesgados, a veces incompletos. Por eso siempre habrá algo que se escape. Nunca será una verdadera representación del todo. Más bien, es un espejo roto que refleja algunas partes, pero no todas.
Lo Bueno, Lo Malo y Lo Raro de Esta Idea
Vamos a ponerlo claro: esta idea tiene cosas geniales y otras que son un poco raras. Lo bueno es obvio: entender mejor el pasado. Una IA que pueda hablarnos desde la perspectiva de un romano, un egipcio o un monje medieval es una idea maravillosa. Es un recurso pedagógico con un potencial brutal. Y es que, si podemos meter a la gente en la mentalidad de otro tiempo, podríamos aprender mucho más rápido.
Pero lo malo es que la IA no siempre puede comprender el contexto completo. Como ya dije, hay mucho que simplemente no conocemos. Los datos disponibles son sólo un pedazo del rompecabezas, y si tratas de armar un cuadro entero con piezas faltantes, el resultado será impreciso. Y lo raro es cómo dependemos cada vez más de la tecnología para intentar conocer nuestro pasado. Es como si quisiéramos dejar de hacer las preguntas nosotros mismos y que un algoritmo las conteste por nosotros.
Resumen Rápido
- Modelos de lenguaje históricos (HLLM): Simulan cómo pensaban las personas de civilizaciones antiguas usando IA entrenada con textos históricos.
- Falta de representación: Los textos antiguos provienen, en su mayoría, de las élites, así que sólo obtenemos una versión limitada de la historia.
- Ejemplos prácticos: Modelos como MonadGPT y XunziALLM ya están intentando esto, con sus propias limitaciones y resultados.
- Retos del contexto: Las IA necesitan comprender un contexto antiguo que no siempre es fácil de reconstruir.
- Potencial de la IA: Puede ayudar a entender patrones y aspectos de la historia que sería imposible para un humano analizar solo.
- Limitaciones claras: La IA nunca podrá ser completamente precisa debido a la naturaleza fragmentada de los datos antiguos.
Preguntas Frecuentes
- ¿Cómo puede una IA aprender sobre civilizaciones antiguas?
- La IA se entrena con textos históricos, como libros, cartas y documentos antiguos, que le permiten aprender cómo se expresaban las personas en esas épocas.
- ¿Los modelos de lenguaje históricos son realmente precisos?
- No del todo. Los textos que existen están incompletos y suelen representar sólo a las élites, por lo que siempre hay una buena dosis de suposición.
- ¿Cómo podría cambiar esto la investigación histórica?
- La IA podría acelerar el análisis de textos antiguos y descubrir patrones que los investigadores humanos podrían pasar por alto.
- ¿Qué limitaciones tienen estos modelos de lenguaje?
- La mayor limitación es el sesgo de los datos. Los textos que se han conservado provienen de las élites y no representan a toda la población.
- ¿Por qué es importante evitar el sesgo en el entrenamiento de estas IA?
- El sesgo podría llevar a conclusiones erróneas sobre cómo pensaban las personas comunes en el pasado, ofreciendo una visión distorsionada.
- ¿Podríamos tener una charla con una IA que simule a un personaje histórico?
- Es posible hasta cierto punto, pero siempre hay que tener en cuenta que sería una aproximación basada en lo que sabemos, no una reproducción exacta.