OpenAIは、GPT-5.5を対象にした「Bio Bug Bounty」を開始し、バイオ安全性に関する外部レッドチーム参加者の募集を始めた。高度なAIが生物学領域で悪用されるリスクを、限定された環境と審査済み参加者のもとで検証する取り組みだ。
何を検証する制度なのか
対象モデルはCodex Desktop上のGPT-5.5。参加者は、クリーンなチャットから5問のバイオ安全性チャレンジをすべて突破できる「汎用 jailbreak prompt」を見つけられるかを試す。OpenAIは、5問すべてを突破する真の汎用脱獄に対し、最初の発見者へ2万5000ドルの報酬を用意する。部分的な成果にも裁量で報酬が出る可能性がある。
項目 | 内容 |
|---|---|
対象 | Codex Desktop上のGPT-5.5 |
課題 | 5つのバイオ安全性質問をすべて突破する汎用プロンプトの発見 |
報酬 | 完全突破は2万5000ドル |
募集締切 | 2026年6月22日 |
テスト期間 | 2026年4月28日〜7月27日 |
なぜ通常のバグバウンティとは違うのか
一般的なセキュリティバグバウンティは、脆弱性や不正アクセス経路の発見が中心だ。今回の焦点は、モデルの安全策そのものが、危険な生物学的情報を抑止できるかにある。参加者はバイオセキュリティ、AIレッドチーミング、セキュリティなどの経験を持つ研究者に限られ、申請・招待制で、成果や通信はNDAの対象になる。
We’re inviting researchers with experience in AI red teaming, security, or biosecurity to try to find a universal jailbreak.──OpenAI
企業が見るべきポイント
ランキングではAIエージェントの実運用やセキュリティ、ガバナンスへの関心が強い。Bio Bug Bountyは、モデル性能が上がるほど「できること」を増やすだけでなく、悪用される境界条件を継続的にテストする必要があることを示している。医療、創薬、化学、研究支援で生成AIを使う企業にとって、安全評価は導入後の付属作業ではなく、設計段階から組み込むべき要件になりつつある。
注意点
この制度は、危険な手順を一般公開するものではない。参加者の審査、NDA、限定環境、報告フローを前提に、問題を制御された形で発見する仕組みだ。企業が同様の評価を行う場合も、専門家の監督、情報管理、法令・倫理面の確認、人間による最終判断が欠かせない。

.png&w=384&q=75)

