Modelos de Lenguaje de Gran Escala (LLMs) de Código Abierto: Guía sobre Licencias, Privacidad y Modelos Principales

Los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) son una clase de inteligencia artificial diseñados para entender, generar e interactuar con el lenguaje humano. Están construidos utilizando grandes volúmenes de datos textuales y entrenados en redes neuronales de gran escala, con miles de millones de parámetros, lo que les permite realizar tareas complejas como generación de texto, traducción, resumen y más. Algunos de los LLMs más conocidos incluyen GPT-4 de OpenAI, BERT de Google y LLaMA de Meta.

Licencias de los LLMs: Código Abierto vs. Propietario

La licencia es un aspecto crucial cuando hablamos de LLMs, ya que determina cómo se pueden utilizar, modificar y distribuir estos modelos. Las licencias de los LLMs generalmente se dividen en tres categorías:

  • Licencias Propietarias: Estas licencias restringen el acceso y uso del modelo. La organización que desarrolló el LLM mantiene el control sobre su distribución, y los usuarios deben cumplir con términos específicos, a menudo prohibiendo su uso comercial sin permiso explícito. Los modelos GPT de OpenAI son un ejemplo de LLMs bajo una licencia propietaria.
  • Licencias de Código Abierto: Los LLMs de código abierto están disponibles para que cualquiera los use, modifique y distribuya, generalmente bajo licencias permisivas como Apache 2.0 o MIT. Sin embargo, “código abierto” no es un término uniforme; diferentes licencias vienen con distintos niveles de libertad y restricciones. Por ejemplo, algunas permiten el uso comercial, mientras que otras no.
  • Licencias Híbridas: Estos modelos operan bajo licencias que combinan elementos de términos abiertos y propietarios. Podrían permitir el uso y la modificación, pero bajo ciertas condiciones, como el uso no comercial o la obligación de atribuir al creador original. Muchos defensores del código abierto argumentan que la mayoría de los modelos caen en esta categoría, a menos que todo sobre el modelo y su uso esté completamente abierto con una comunidad sólida y una licencia bien definida.

La Ambigüedad del Código Abierto en los LLMs

El concepto de “código abierto” en el contexto de los LLMs no está claramente definido. Mientras que algunos modelos son completamente libres para cualquier uso, otros etiquetados como “código abierto” pueden tener restricciones significativas, particularmente en cuanto al uso comercial, pesos del modelo y datos de entrenamiento. Esta variabilidad en las licencias puede generar confusión para las empresas que buscan integrar LLMs en sus operaciones.

Para las organizaciones, las implicaciones de usar LLMs de código abierto dependen en gran medida de la licencia específica en vigor. Mientras que los modelos de código abierto pueden ofrecer mayor flexibilidad en términos de personalización y despliegue, las empresas deben evaluar cuidadosamente los términos de la licencia para evitar posibles problemas legales, especialmente en lo que respecta al uso comercial o la distribución.

Consideraciones de Privacidad: Modelos Propietarios vs. Código Abierto

La privacidad es una preocupación importante cuando se implementan LLMs, especialmente en sectores que manejan datos sensibles. Los modelos propietarios, como los de OpenAI, pueden generar preocupaciones debido a la necesidad de enviar datos a servidores externos, donde el control sobre cómo se usan o almacenan los datos es limitado. Con los modelos propietarios, queda en manos del acuerdo entre el proveedor y el cliente cómo se manejarán los datos y si se utilizarán para entrenar nuevos modelos.

Por otro lado, los LLMs de código abierto ofrecen la posibilidad de una mayor privacidad, especialmente cuando se implementan en servidores internos o en una nube privada. Con estos modelos, las organizaciones pueden mantener el control total sobre sus datos y asegurarse de que permanezcan dentro de su propia infraestructura. Sin embargo, este enfoque requiere medidas de ciberseguridad robustas para proteger contra posibles brechas.

OpenAI: De Abierto a Propietario

OpenAI es uno de los proveedores de LLM más conocidos y también ha sido central en la discusión sobre el código abierto en la industria. OpenAI comenzó con la misión de compartir abiertamente investigaciones y promover el desarrollo de la IA para el beneficio de todos. El “Open” en OpenAI señalaba este compromiso. Sin embargo, con el tiempo, a medida que la organización desarrolló modelos más avanzados y comercialmente viables, se trasladó a un modelo más cerrado y propietario. Este cambio fue impulsado por preocupaciones sobre el mal uso de la tecnología de IA y la necesidad de financiación sostenible, pero ha generado críticas de quienes creen que contradice la misión original de la organización.

Principales Modelos de Lenguaje de Gran Escala (LLMs) de Código Abierto

A pesar de los desafíos, han surgido varios poderosos LLMs de código abierto, que ofrecen alternativas viables a los modelos propietarios. Algunos de los principales LLMs de código abierto incluyen:

  • LLaMA de Meta
    Un modelo de alto rendimiento conocido por su eficiencia en el entrenamiento y la inferencia, disponible abiertamente para su uso en investigación y comercial. Para ejemplificar las advertencias en las licencias, “Términos Comerciales Adicionales. Si, en la fecha de lanzamiento de la versión Llama 3.1, los usuarios activos mensuales de los productos o servicios ofrecidos por o para el Licenciatario, o sus afiliados, son mayores de 700 millones de usuarios activos mensuales en el mes calendario anterior, debe solicitar una licencia a Meta, que Meta podrá otorgar a su exclusivo criterio, y no está autorizado a ejercer ninguno de los derechos bajo este acuerdo a menos que Meta otorgue expresamente dichos derechos.”
  • Gemma 2 de Google
    Disponible en versiones de 9 mil millones y 27 mil millones de parámetros, Gemma 2 se lanza bajo una licencia amigable para fines comerciales, permitiendo su uso tanto para investigación como para aplicaciones comerciales. Se destaca por su eficiencia y compatibilidad con los principales marcos de IA, lo que lo convierte en un competidor fuerte en el panorama de los LLMs de código abierto.
  • Mistral Large 2
    Un modelo de 123 mil millones de parámetros con una ventana de contexto de 128k, Mistral Large 2 soporta múltiples idiomas y lenguajes de programación. Se lanza bajo la licencia de investigación Mistral, destinada solo para investigación y uso no comercial, con una licencia comercial disponible para aplicaciones comerciales.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *