Skip to main content

Documentation Index

Fetch the complete documentation index at: https://wb-21fd5541-docs-2661.mintlify.app/llms.txt

Use this file to discover all available pages before exploring further.

「Concurrency limit reached for requests」というメッセージを伴う 429 エラーは、Serverless Inference API に同時リクエストを送りすぎていることを示しています。このページでは、このエラーが発生する理由と、リクエストを正常に処理させるための解決方法を説明します。

これが発生する理由

Serverless Inference は、公平な利用とサービスの安定性を維持するため、同時実行制限を強制しています。お使いのアカウントからの同時リクエスト数が許可された制限値を超えると、追加のリクエストは 429 ステータスコードで拒否されます。

できること

エラーを解決するには、ワークロードとプランに応じて、次のいずれか一方または両方の方法を選択してください。
  • 同時リクエストを減らすことで、現在の制限内に収めます。
    • アプリケーションにリクエストのキューイングまたはスロットリングを実装する。
    • 失敗したリクエストを再試行する際は、指数バックオフを使用する。
  • ワークロードにより多くの容量が必要な場合は、制限を引き上げる。プランの同時実行制限を確認し、必要に応じてアップグレードする。
詳細は、使用状況と制限を参照してください。
クォータとレート制限