Meta presenta Llama 3, el sucesor del modelo Llama 2
Meta lanza Llama 3, un avanzado modelo de lenguaje de código abierto con dos variantes, mejorando el rendimiento y la accesibilidad para desarrolladores.
Meta ha presentado Llama 3, el sucesor del exitoso modelo de código abierto Llama 2. Este nuevo modelo de lenguaje llega con dos variantes: Llama 3-8B, que cuenta con 8 mil millones de parámetros y puede ser ejecutado en hardware relativamente modesto, y Llama 3-70B. A diferencia de Llama 2, que ofrecía tres variantes, Llama 3 simplifica su oferta a dos modelos, lo que promete optimizar el rendimiento en función de los requisitos del sistema.
En línea con su enfoque en el código abierto, Meta reafirma su compromiso de continuar el desarrollo de los modelos Llama, en contraposición a competidores como OpenAI que mantienen sus modelos más avanzados bajo estricta reserva. Los modelos Llama 3 estarán disponibles en plataformas como Amazon SageMaker, Google Cloud, Hugging Face, y más, lo que facilitará su acceso a desarrolladores.
Las evaluaciones recientes de inteligencia artificial indican que Llama 3-8B sobresale en pruebas de rendimiento, mientras que se anticipa que la variante de 70B proporcionará un rendimiento mejorado. Para personalizar Llama 3, los desarrolladores podrán utilizar diferentes herramientas y opciones de terceros para la formación y ajuste del modelo, lo que permitirá integrar datos específicos en sus aplicaciones.
Una de las innovaciones de Llama 3 es su velocidad y eficiencia. Utiliza un tokenizador con un vocabulario de 128,000 tokens, lo que le permite comprender términos complejos con mayor facilidad, en comparación con los 32,000 tokens de su predecesor. Sin embargo, esta mejora puede resultar en un aumento en el tiempo de entrenamiento.
Además de los modelos, Meta ha lanzado una nueva aplicación de chatbot llamada Meta AI, que se puede utilizar en diversas habitaciones y feeds dentro de las aplicaciones de Meta, como Facebook, Instagram y WhatsApp. Sin embargo, aún no está disponible en Europa, donde las regulaciones sobre comportamiento de IA son más estrictas. En un contexto más amplio, Meta AI se presenta como un competidor robusto frente a ChatGPT y Google Gemini, incorporando capacidades multimodales que permiten la creación y análisis de imágenes junto con textos.
Por último, Meta, en colaboración con la Universidad del Sur de California, ha propuesto un nuevo modelo de inteligencia artificial llamado Megalodon. Este modelo busca superar las limitaciones de los modelos actuales, permitiendo un procesamiento de información mucho más amplio gracias a la tecnología de atención conocida como Moving Average Equipped Gate Attention (MEGA). Esta propuesta promete cambiar la forma en que los modelos de IA manejan la información, marcando un avance significativo en el campo de la inteligencia artificial generativa.