通信・IT

AIに「分からないことを分からないと認める力」は身につくのか？OpenAIが有益な性質を強化学習で定着させる研究結果を公開

1: 2026/06/20(土) 22:11:33.80 ID:4fKrXnnZ AIに「分からないことを分からないと認める力」は身につくのか？OpenAIが有益な性質を強化学習で定着させる研究結果を公開　OpenAIは2026年6月18日、AIに正直さや不確実性を認める謙虚さ、訂正を受け入れる姿勢、公平性な...

umiumi111 2026年6月22日 1 分の読み取り

1: 2026/06/20(土) 22:11:33.80 ID:4fKrXnnZ

AIに「分からないことを分からないと認める力」は身につくのか？OpenAIが有益な性質を強化学習で定着させる研究結果を公開

　OpenAIは2026年6月18日、AIに正直さや不確実性を認める謙虚さ、訂正を受け入れる姿勢、公平性などの有益な性質を学習させると訓練に使っていない分野でも望ましい振る舞いが広がり、悪意ある指示にも崩されにくくなるという研究結果を公開しました。

　Reinforcement learning towards broadly and persistently beneficial models
　https://alignment.openai.com/beneficial-rl/

（以下略、続きはソースでご確認ください）

Gigazine 2026年06月19日 20時00分
https://gigazine.net/news/20260619-openai-beneficial-rl/

関連記事

geminiが弱い

米国の出生率急落、スマートフォンの普及が原因か　新研究

ガチで213000円のハイエンドスマホを買ってしまって心が痛い

見逃したかもしれません

愛情ホルモンが「戦闘モード」を誘発している可能性が研究で判明