1: 2026/05/02(土) 23:21:32.69 ID:sA6rXgyV
GPT-5.5が「危険過ぎて公開できない」Claude Mythosにベンチマークで並ぶ
2026年4月公開のGPT-5.5は、UK AI Security Institute(AISI)のサイバー評価で、限定提供中のClaude Mythos Previewに近い成績を出した。
Expert難易度タスクのスコアはGPT-5.5が71.4%、Claude Mythos Previewが68.6%で、誤差範囲を考えると優劣は断定しにくい。
人工知能(AI)を使う企業にとっての変化は、危険な能力が特定の非公開モデルだけに閉じ込められない点にある。
攻撃者と防御者の双方が同じ技術進歩を利用できるため、モデル性能よりも、誰にどの権限で使わせるかが安全対策の中心になってくる。
(以下略、続きはソースでご確認ください)
xenospectrum 2026年5月2日
https://xenospectrum.com/gpt55-claude-mythos-cyber-risk/
2026年4月公開のGPT-5.5は、UK AI Security Institute(AISI)のサイバー評価で、限定提供中のClaude Mythos Previewに近い成績を出した。
Expert難易度タスクのスコアはGPT-5.5が71.4%、Claude Mythos Previewが68.6%で、誤差範囲を考えると優劣は断定しにくい。
人工知能(AI)を使う企業にとっての変化は、危険な能力が特定の非公開モデルだけに閉じ込められない点にある。
攻撃者と防御者の双方が同じ技術進歩を利用できるため、モデル性能よりも、誰にどの権限で使わせるかが安全対策の中心になってくる。
(以下略、続きはソースでご確認ください)
xenospectrum 2026年5月2日
https://xenospectrum.com/gpt55-claude-mythos-cyber-risk/
続きを読む
