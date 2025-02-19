包括的な防御戦略は、次の内容が組み合わさったものである必要があります。

要求のふるまい監視

コンテキスト認識型テキスト分析

コンテンツ検証

アクセス制御と API セキュリティ



このように階層化されたアプローチにより、モデルの応答を意図したユースケースと一致させやすくなります。疑わしいパターンのプロアクティブな特定と厳格な検証対策の実施により、企業として、 AI 主導の脅威を緩和し、アプリケーションのセキュリティと整合性を維持することが可能となります。

企業でのプロンプトインジェクションの検知用として、すべてのユーザープロンプトとモデルの応答を確認し、トピック内での疑わしい話題変更や無関係な話題変更を見つける、専用のツールがあります。このツールは、既知のジェイルブレイクや他の操作パターンの自動検出と対処に役立ちます。また、AI が機密情報や機能へのアクセス、またはそれらの開示を指示される新手の攻撃にも、継続的な監視が必要です。

システムプロンプトの漏えいの検出であれば、モデルの応答にシステムプロンプトの一部が含まれていないかをスキャンするだけで済むこともあります。しかし攻撃者が、漏えいしたデータのエンコードや変換などの巧妙な手を使い、単純なチェックを回避する場合もあり得ます。高度な防御ソリューションには、それぞれの応答を徹底的に検査し、システムインストラクションの漏えいがないことを自動的に確認する機能が必須です。

テキストベースの脆弱性のみならず、AI による、社内 API、データベース、その他のデータソース（許可されている場合）とのインタラクションを監視することが不可欠です。たとえば、異常な数のクエリーや、データの変更や削除の試みなど、異常なふるまいが見られた場合には、アクティブな悪用の存在が疑われることになります。