Skip to main content

Documentation Index

Fetch the complete documentation index at: https://wb-21fd5541-docs-2661.mintlify.app/llms.txt

Use this file to discover all available pages before exploring further.

Une erreur 503 accompagnée du message “Le moteur est actuellement surchargé, veuillez réessayer plus tard” signifie que le serveur Serverless Inference subit actuellement un trafic important et ne peut pas traiter votre requête. Cette page explique pourquoi cette erreur se produit et comment l’atténuer.

Pourquoi cela arrive

Pendant les périodes de forte demande, le moteur d’inférence peut être temporairement surchargé. Cette situation se résout généralement d’elle-même à mesure que le trafic diminue.

Ce que vous pouvez faire

Utilisez les stratégies suivantes pour vous remettre d’une réponse 503 et réduire le risque d’y être confronté à nouveau :
  • Réessayez après un court délai:
    • Attendez quelques secondes avant de réessayer votre requête.
    • Utilisez un backoff exponentiel pour éviter d’accentuer la congestion.
  • Espacez les requêtes:
    • Si vous envoyez de nombreuses requêtes, espacez-les dans le temps.
    • Mettez en place une file d’attente des requêtes pour lisser les pics de trafic.

Erreurs du serveur