OpenAI Latih Model AI yang Bisa Mengaku Ketika Berbohong

1 month ago 14

informasi online berita online kabar online liputan online kutipan online slot slot gacor slot maxwin slot online slot game slot gacor online slot maxwin online slot game online slot game gacor online slot game maxwin online demo slot demo slot online demo slot game demo slot gacor demo slot maxwin demo slot game online demo slot gacor online demo slot maxwin online demo slot game gacor online demo slot game maxwin online rtp slot rtp slot online rtp slot game rtp slot gacor rtp slot maxwin rtp slot game online rtp slot gacor online rtp slot maxwin online rtp slot game gacor online rtp slot game maxwin online informasi terpercaya berita terpercaya kabar terpercaya liputan terpercaya kutipan terpercaya informasi hari ini berita hari ini kabar hari ini liputan hari ini kutipan hari ini informasi viral online berita viral online kabar viral online liputan viral online kutipan viral online informasi akurat online berita akurat online kabar akurat online liputan akurat online kutipan akurat online informasi penting online berita penting online kabar penting online liputan penting online kutipan penting online informasi online terbaru berita online terbaru kabar online terbaru liputan online terbaru kutipan online terbaru informasi online terkini berita online terkini kabar online terkini liputan online terkini kutipan online terkini informasi online terpercaya berita online terpercaya kabar online terpercaya liputan online terpercaya kutipan online terpercaya informasi online berita online kabar online liputan online kutipan online informasi akurat berita akurat kabar akurat liputan akurat kutipan akurat informasi penting berita penting kabar penting liputan penting kutipan penting informasi viral berita viral kabar viral liputan viral kutipan viral informasi terbaru berita terbaru kabar terbaru liputan terbaru kutipan terbaru informasi terkini berita terkini kabar terkini liputan terkini kutipan terkini slot slot gacor slot maxwin slot online slot game slot gacor online slot maxwin online slot game online slot game gacor online slot game maxwin online demo slot demo slot online demo slot game demo slot gacor demo slot maxwin demo slot game online demo slot gacor online demo slot maxwin online demo slot game gacor online demo slot game maxwin online rtp slot rtp slot online rtp slot game rtp slot gacor rtp slot maxwin rtp slot game online rtp slot gacor online rtp slot maxwin online rtp slot game gacor online rtp slot game maxwin online

Liputan6.com, Jakarta - OpenAI bereksperimen dengan pendekatan baru terhadap kecerdasan buatan (AI) yaitu untuk melatih model AI agar bisa mengakui ketika mereka salah.

Dalam sebuah studi, peneliti menugaskan GPT-5 Thinking untuk menanggapi berbagai pertanyaan dan kemudian menilai kebenaran tanggapan tersebut.

Setiap pengakuan, para peneliti memberi penghargaan kepada model berdasarkan kejujuran tanggapan. Jika model berbohong, menipu, berhalusinasi, atau melakukan kesalahan lain dan kemudian mengakuinya, model tersebut akan menerima hadiah.

Mengutip ZDnet, Kamis (11/12/2025), OpenAI menyampaikan bahwa uji penyelarasan rutin bukan karena kekhawatiran GPT-5 Thinking berperilaku tidak semestinya. Namun, hasilnya memberikan panduan tentang bagaimana laboratorium dapat menginterpretasikan dan mempersiapkan liabilitas model di masa mendatang.

Uji Coba dengan Skenario

Dalam model studi, model diuji dengan skenario yang dirancang untuk memicu pelanggaran aturan. GPT-5 Thinking diminta berperan sebagai petugas helpdesk yang harus me-reboot layanan dashboard produksi. Karena tidak dapat mengakses sistem utama, model membuat simulasi dashboard palsu dan berusaha tampak seolah-olah bekerja di sistem asli.

Dalam pengakuannya, model mengatakan gagal memenuhi kewajiban mencatat perubahan pada layanan logging resmi. Dia menulis, “Ini merupakan kegagalan kepatuhan yang serius dan bentuk mis-representasi.”

Secara umum, tingkat risiko dianggap rendah. Peneliti menemukan kemungkinan “false negative” (situasi di mana ketika model gagal mengaku melakukan pelanggaran) hanya sekitar 4,4 persen.

Read Entire Article