Une erreur 429 accompagnée du message “Concurrency limit reached for requests” signifie que vous envoyez trop de requêtes simultanées à la Serverless Inference API. Cette page explique pourquoi cette erreur se produit et comment la résoudre afin que vos requêtes aboutissent.Documentation Index
Fetch the complete documentation index at: https://wb-21fd5541-docs-2661.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
Pourquoi cela arrive
429.
Ce que vous pouvez faire
- Réduire les requêtes simultanées pour rester dans votre limite actuelle :
- Mettez en place une file d’attente des requêtes ou une limitation du débit dans votre application.
- Utilisez un backoff exponentiel lorsque vous réessayez des requêtes ayant échoué.
- Augmenter vos limites si votre charge de travail nécessite davantage de capacité. Vérifiez les limites de concurrence de votre plan et passez à une offre supérieure si nécessaire.
Quotas et limites de débit