En abril de 2024, Meta sorprendió al mundo con Llama 3, la última versión de sus modelos de lenguaje de gran tamaño impulsados por IA. Basado en un conjunto de datos que es al menos 7 veces más grande que Llama 2, este lanzamiento ya ha dejado una marca significativa.
La Competencia de los Grandes
Inicialmente disponible en tamaños de parámetros 8B y 70B, Llama 3 ha superado a sus predecesores y competidores, como el modelo Gemma de código abierto de Google y Claude Sonnet de Anthropic. Desde entonces, Sonnet ha recibido una actualización importante, colocándolo entre los modelos de IA más potentes.
Pero las filtraciones recientes indican que el lanzamiento de los modelos más potentes de Llama 3, entrenados con más de 400 mil millones de parámetros, podría estar cerca. Este es solo uno de los muchos modelos en los que Meta está trabajando, utilizando sus cientos de miles de GPU Nvidia H100.
Eficiencia y Potencia
En las primeras pruebas, el modelo optimizado para instrucciones Llama 3 400B obtuvo una puntuación de 86,1 en el índice de referencia MMLU, igualando el rendimiento de GPT-4 con menos de la mitad de los parámetros.
¿Por qué es esto tan importante?
En términos sencillos, los modelos de lenguaje con más parámetros tienden a desempeñarse mejor en pruebas comparativas y tareas del mundo real. Pero el hecho de que Llama 3 400B pueda igualar la puntuación MMLU de GPT-4 con menos del 50% de los parámetros sugiere que Meta ha logrado avances significativos en la arquitectura y entrenamiento de modelos, posicionándolos como un serio competidor de OpenAI.
Al lograr el mismo rendimiento con menos parámetros, es probable que Llama 3 400B sea mucho más eficiente que ChatGPT-4 de OpenAI en términos de recursos computacionales, consumo de energía y costo.
Ventaja del Código Abierto
Otra razón por la cual Llama 3 está generando tanto entusiasmo es su licencia abierta para investigación y uso comercial. Aunque aún no está claro si el modelo 400B se lanzará bajo la misma licencia abierta, si así fuera, estas capacidades de lenguaje de última generación estarían disponibles para investigadores y desarrolladores de forma gratuita a través de múltiples plataformas y ecosistemas en la nube, acelerando la innovación y permitiendo aplicaciones más novedosas de la tecnología.
El nuevo modelo 400B tiene la potencia suficiente para competir con ChatGPT-4, poniendo mucho poder en manos de los investigadores y permitiendo un desarrollo más rápido de aplicaciones avanzadas de inteligencia artificial en lenguaje sin depender de costosas API propietarias.
Lo Que Sabemos Hasta Ahora
Meta AI ha estado insinuando el lanzamiento del modelo 400B desde su comunicado de prensa original sobre Llama 3 el 18 de abril. «Nuestros modelos más grandes tienen parámetros de más de 400B«, escribieron, y añadieron que «en los próximos meses, lanzaremos múltiples modelos con nuevas capacidades que incluyen multimodalidad, la capacidad de conversar en varios idiomas, una ventana de contexto mucho más larga y capacidades generales más sólidas».
Desde entonces, Internet ha estado lleno de teorías sobre una posible fecha de lanzamiento para los modelos 400B. Aunque Meta ha confirmado que el desarrollo de Llama 3 400B ha finalizado, aún no se ha anunciado una fecha de lanzamiento oficial.
Sin embargo, los usuarios de WhatsApp Beta en Android 2.24.14.7 han descubierto una nueva opción para probar el modelo Llama 3-405B de Meta AI. Si bien esta opción se ha implementado actualmente solo para los usuarios de la versión beta y con importantes límites en el volumen de uso, es suficiente para entusiasmar a la gente con un lanzamiento completo, posiblemente a fines de julio o agosto de 2024.
Conclusión
La llegada del Llama 3 400B de Meta marca un hito importante en el desarrollo de la inteligencia artificial. Con su eficiencia, potencia y potencial de código abierto, este modelo no solo compite con gigantes como GPT-4, sino que también promete democratizar el acceso a tecnologías avanzadas, impulsando la innovación y el desarrollo en el campo de la IA. ¡El futuro de la inteligencia artificial nunca ha sido tan emocionante!