Límites de Tasa de la API LunaVerseX

Para garantizar un uso justo, la estabilidad de nuestra plataforma y proteger nuestros servicios contra abusos, la API de LunaVerseX implementa límites de tasa. Esta guía explica nuestros límites actuales y cómo puedes trabajar eficientemente con ellos.

Nuestros Límites de Tasa Actuales

Los siguientes límites de tasa se aplican por defecto a las solicitudes realizadas a nuestros modelos de API (por ejemplo, Lumi o1 Mini) por API Key:

Resumen de Límites

Por Minuto: 7 mensajes
Por Día (24 horas): 600 mensajes
Por Mes (calendario): 20,000 mensajes

Estos límites están diseñados para permitir un amplio rango de casos de uso en desarrollo y aplicaciones de bajo a mediano volumen. Los límites se reinician automáticamente al final de cada período respectivo (minuto, día, mes UTC).

Nota: Estos límites pueden variar según el modelo específico de API o tu plan de suscripción. Consulta siempre la documentación del modelo o los detalles de tu plan para la información más actualizada.

¿Cómo Funcionan los Límites?

Cada solicitud exitosa a un endpoint de generación de la API (como /v1/chat) cuenta para tus límites.

Cuando excedes un límite de tasa, la API responderá con un código de estado HTTP 429 Too Many Requests. El cuerpo de la respuesta puede incluir información adicional sobre cuándo podrás realizar nuevas solicitudes.

Para ayudarte a monitorear tu uso, incluimos los siguientes encabezados en las respuestas de la API (cuando sea aplicable):

X-RateLimit-Limit: El número total de solicitudes permitidas en el período actual.
X-RateLimit-Remaining: El número de solicitudes restantes en el período actual.
X-RateLimit-Reset: El tiempo (en segundos Unix epoch o una marca de tiempo) hasta que el límite se reinicie.

Es crucial que tu aplicación esté preparada para manejar respuestas 429 e inspeccionar estos encabezados.

Consejos para Trabajar con los Límites

Optimiza tus Solicitudes: Agrupa tareas si es posible en lugar de hacer muchas solicitudes pequeñas. Asegúrate de que tus prompts sean eficientes.
Implementa Caching: Para solicitudes comunes o respuestas que no cambian frecuentemente, considera implementar un sistema de caché en tu aplicación para reducir el número de llamadas a la API.
Backoff Exponencial: Si recibes un error 429, implementa una estrategia de reintento con "backoff exponencial". Esto significa esperar un corto período antes de reintentar, y aumentar gradualmente el tiempo de espera con cada reintento fallido.
Monitorea tu Uso: Presta atención a los encabezados X-RateLimit-* para entender tu consumo y anticipar cuándo podrías alcanzar un límite.
Pruebas y Desarrollo: Utiliza entornos de prueba o claves de desarrollo con límites separados si están disponibles, para no agotar tus límites de producción durante el desarrollo.

¿Necesitas Límites Más Altos?

Entendemos que algunas aplicaciones pueden requerir una capacidad de procesamiento mayor. Si los límites de tasa estándar no son suficientes para tus necesidades, o si estás desarrollando una aplicación a gran escala, por favor, contacta con nuestro equipo de ventas o soporte.

Estaremos encantados de discutir tus requerimientos y explorar opciones para planes empresariales o límites de tasa personalizados que se ajusten a tu caso de uso.