Uno de los temas clave en el mercado de Modelos de Lenguaje de Gran Escala (LLM) en 2024 ha sido el aumento de la competencia, lo que ha llevado a OpenAI y otros proveedores a hacer que sus modelos más avanzados sean mucho más asequibles. Desde el lanzamiento de GPT-4 en marzo de 2023, hemos visto una serie de reducciones de precios constantes por parte de OpenAI, lo que hace que estas tecnologías sean más accesibles para una mayor cantidad de negocios y casos de uso.
Reducciones de Precios Clave
Marzo 2023: Lanzamiento de GPT-4
Cuando GPT-4 fue lanzado, su precio era elevado: $60 por millón de tokens de salida y $30 por millón de tokens de entrada. Esta tecnología de vanguardia, aunque avanzada, representaba una barrera de costo para muchos.
Noviembre 2023: GPT-4 Turbo
OpenAI introdujo GPT-4 Turbo, una opción más asequible con un precio de $30 por millón de tokens de salida y $10 por millón de tokens de entrada. Este modelo ofreció mejores capacidades a la mitad del costo, facilitando su adopción por parte de las empresas.
Marzo 2024: GPT-4o
OpenAI continuó reduciendo costos con el lanzamiento de GPT-4o, que se fijó en $15 por millón de tokens de salida y $5 por millón de tokens de entrada. Esto hizo que la IA de alta calidad fuera aún más asequible.
Julio 2024: GPT-4o Mini
En respuesta a la demanda de una solución más económica, OpenAI presentó GPT-4o Mini en julio de 2024. Este modelo, específicamente diseñado para ofrecer una opción rentable, tiene un precio de $0.600 por millón de tokens de salida y $0.15 por millón de tokens de entrada. GPT-4o Mini compite directamente con otros modelos pequeños de lenguaje como Gemini Flash de Google y Claude Haiku de Anthropic. Está diseñado para aplicaciones donde la eficiencia en costos es clave, siendo una mejor opción frente a los modelos más grandes como GPT-4o.
Agosto 2024: Reducción de Precios de GPT-4o
El precio de GPT-4o bajó aún más a $10 por millón de tokens de salida y $3 por millón de tokens de entrada, lo que representó una reducción significativa y lo convirtió en una de las opciones más rentables del mercado.
En solo 16 meses, hemos visto una caída del 83% en el precio de los tokens de salida, pasando de $60 a $10 por millón de tokens, y una caída del 90% en los tokens de entrada, de $30 a $3 por millón de tokens.
API por Lotes de OpenAI: 50% más barata
OpenAI también ofrece sus modelos de lenguaje a través de la API por lotes, que proporciona una solución más rentable para ciertas tareas. La API por lotes permite enviar grupos de solicitudes de forma asincrónica con un costo un 50% más bajo. Así se desglosan los precios:
- $1.875 por millón de tokens de entrada
- $7.500 por millón de tokens de salida
Esta API es ideal para trabajos de procesamiento que no requieren respuestas inmediatas, como evaluaciones, ya que ofrece un tiempo de respuesta claro de 24 horas. Además de los costos más bajos, la API por lotes ofrece un conjunto de límites de tasa mucho más altos, lo que la convierte en una excelente opción para las empresas que necesitan procesar grandes volúmenes de datos.
Panorama Competitivo
OpenAI no es la única empresa que está reduciendo precios. Las rebajas de precios han sido generales en toda la industria, con todos los modelos en las plataformas de hosting/cloud. Por ejemplo, los modelos Gemini de Google en Google Cloud y la serie Llama de Meta en Azure han experimentado reducciones similares de precios, haciendo que la IA avanzada sea más accesible en general.
Modelos de Lenguaje más pequeños como GPT-4o Mini, Gemini Flash de Google y Claude Haiku de Anthropic también han introducido una capa adicional a la competencia de precios.
En general, la mayor competencia, la variedad de modelos y procesos como la API por lotes son beneficiosos para la adopción de la IA. Esto ha hecho que los LLMs sean mucho más accesibles para diferentes tipos de casos de uso. Ya sea que se trate de un modelo de bandera, un modelo más pequeño o el proceso de API por lotes que se ajuste a tu caso de uso, asegúrate de aprovechar las condiciones cambiantes del mercado.
Conclusión
En el último año, el costo de utilizar los modelos GPT de OpenAI ha caído significativamente. Manteniéndote informado sobre estos cambios y explorando opciones como la API por lotes y los modelos más pequeños, puedes aprovechar las mejores ofertas y optimizar tu inversión en IA.
Acerca de Nebuly
Nebuly es una plataforma de experiencia de usuario de LLM. Ayudamos a las empresas a mejorar y personalizar continuamente las experiencias de LLM al capturar valiosos conocimientos de las interacciones de los usuarios con la IA. Si estás interesado en mejorar tu experiencia de usuario con LLM, nos encantaría conversar.