ガードレール

ガードレールは、ユーザー入力やエージェント出力のチェックと検証を可能にします。例えば、非常に賢い（したがって遅く/高価な）モデルを使って顧客対応を行うエージェントがあるとします。悪意のあるユーザーが、そのモデルに自分の数学の宿題を手伝うよう依頼することは避けたいでしょう。そこで、速く/安価なモデルでガードレールを実行できます。ガードレールが悪用を検知した場合、すぐにエラーを発生させて高価なモデルの実行を防げるため、時間とコストを節約できます（ブロッキングガードレールを使用する場合。並列ガードレールの場合、ガードレールが完了する前に高価なモデルの実行が開始されている可能性があります。詳細は下記「実行モード」を参照してください）。

ガードレールには 2 種類あります。

入力ガードレールは最初のユーザー入力に対して実行されます
出力ガードレールは最終的なエージェント出力に対して実行されます

入力ガードレール

入力ガードレールは 3 つのステップで実行されます。

まず、ガードレールはエージェントに渡されるものと同じ入力を受け取ります。

次に、ガードレール関数が実行され、GuardrailFunctionOutput を生成し、それをInputGuardrailResult でラップします
最後に、.tripwire_triggered が true かを確認します。true の場合、InputGuardrailTripwireTriggered 例外を送出し、ユーザーへの適切な応答や例外処理ができるようにします。

Note

入力ガードレールはユーザー入力に対して実行されることを想定しているため、エージェントのガードレールはそのエージェントが「最初の」エージェントである場合にのみ実行されます。なぜguardrails プロパティがエージェント側にあり、Runner.run に渡さないのか疑問に思うかもしれません。これは、ガードレールが実際のエージェントに密接に関係する傾向があるためです。エージェントごとに異なるガードレールを実行することになるため、コードを同じ場所に置くことで可読性が向上します。

実行モード

入力ガードレールは 2 つの実行モードをサポートします。

並列実行（デフォルト、run_in_parallel=True）: ガードレールはエージェントの実行と同時に実行されます。両者が同時に開始されるため、最も良いレイテンシーになります。ただし、ガードレールが失敗した場合でも、キャンセルされるまでにエージェントがすでにトークンを消費し、ツールを実行している可能性があります。
ブロッキング実行（run_in_parallel=False）: ガードレールはエージェントが開始する「前に」実行され完了します。ガードレールのトリップワイヤーが発動した場合、エージェントは一切実行されず、トークン消費やツール実行を防止できます。コスト最適化や、ツール呼び出しによる副作用を避けたい場合に最適です。

出力ガードレール

出力ガードレールは 3 つのステップで実行されます。

まず、ガードレールはエージェントが生成した出力を受け取ります。
次に、ガードレール関数が実行され、GuardrailFunctionOutput を生成し、それをOutputGuardrailResult でラップします
最後に、.tripwire_triggered が true かを確認します。true の場合、OutputGuardrailTripwireTriggered 例外を送出し、ユーザーへの適切な応答や例外処理ができるようにします。

Note

出力ガードレールは最終的なエージェント出力に対して実行されることを想定しているため、エージェントのガードレールはそのエージェントが「最後の」エージェントである場合にのみ実行されます。入力ガードレールと同様に、ガードレールは実際のエージェントに密接に関係する傾向があるため、コードを同じ場所に置くことで可読性が向上します。

出力ガードレールは常にエージェントの完了後に実行されるため、run_in_parallel パラメーターはサポートしません。

トリップワイヤー

入力または出力がガードレールに不合格となった場合、ガードレールはトリップワイヤーでそれを通知できます。トリップワイヤーが発動したガードレールを検知するとすぐに、{Input,Output}GuardrailTripwireTriggered 例外を送出し、エージェントの実行を停止します。