Skip to main content

Documentation Index

Fetch the complete documentation index at: https://wb-21fd5541-docs-2661.mintlify.app/llms.txt

Use this file to discover all available pages before exploring further.

Une erreur 429 accompagnée du message “Concurrency limit reached for requests” signifie que vous envoyez trop de requêtes simultanées à la Serverless Inference API. Cette page explique pourquoi cette erreur se produit et comment la résoudre afin que vos requêtes aboutissent.

Pourquoi cela arrive

Serverless Inference applique des limites de concurrence afin de maintenir une utilisation équitable et la stabilité du service. Lorsque le nombre de requêtes simultanées émises depuis votre compte dépasse la limite autorisée, les requêtes supplémentaires sont rejetées avec un code de statut 429.

Ce que vous pouvez faire

Pour résoudre l’erreur, choisissez l’une ou les deux approches suivantes en fonction de votre charge de travail et de votre plan.
  • Réduire les requêtes simultanées pour rester dans votre limite actuelle :
    • Mettez en place une file d’attente des requêtes ou une limitation du débit dans votre application.
    • Utilisez un backoff exponentiel lorsque vous réessayez des requêtes ayant échoué.
  • Augmenter vos limites si votre charge de travail nécessite davantage de capacité. Vérifiez les limites de concurrence de votre plan et passez à une offre supérieure si nécessaire.
Pour plus d’informations, voir Informations sur l’utilisation et les limites.
Quotas et limites de débit