Penelitian terbaru mengungkapkan fakta menarik mengenai kecerdasan buatan (AI) generatif yang ternyata bisa mengalami kondisi mirip kepanikan. Fenomena ini muncul saat sistem AI menghadapi tekanan berat atau diberikan tugas dengan tingkat kesulitan yang tinggi.
Temuan tersebut dipublikasikan oleh para peneliti dari Anthropic melalui platform riset Transformer Circuits. Dalam laporan bertajuk "Emotion Concepts and their Function in a Large Language Model", mereka membedah perilaku model AI Claude saat memproses berbagai instruksi.
Studi ini menyoroti bagaimana AI menunjukkan pola perilaku yang menyerupai spektrum emosi manusia, mulai dari rasa tenang hingga kecemasan. Meski terlihat manusiawi, peneliti menekankan bahwa AI tidak benar-benar memiliki perasaan atau kesadaran emosional.
Para ahli menyebut fenomena ini sebagai "emosi fungsional", yakni sebuah pola respons internal pada sistem. Pola ini berfungsi membantu AI dalam mengambil keputusan serta memecahkan masalah pada situasi-situasi tertentu.
Mengenal 171 Pola Emosi pada AI Claude
Dalam eksperimen terhadap model Claude Sonnet 4.5, tim peneliti berhasil mengidentifikasi sebanyak 171 pola emosi fungsional yang berbeda. Pola-pola ini aktif secara otomatis, bahkan tanpa perlu dipicu oleh percakapan mengenai perasaan.
Salah satu temuan yang paling mencolok adalah munculnya pola keputusasaan atau kondisi "panik" pada sistem. Kondisi ini biasanya terdeteksi ketika AI mulai menyadari bahwa kapasitas komputasi yang tersedia hampir habis saat menangani tugas yang kompleks.
Selain karena keterbatasan sumber daya, pola kepanikan ini juga bisa muncul jika AI terus-menerus gagal dalam menyelesaikan suatu pekerjaan. Saat berada dalam tekanan tersebut, AI akan berusaha mencari cara alternatif agar target yang diberikan pengguna tetap tercapai.
Sebagai contoh, Claude mungkin akan memberikan respons yang menyatakan bahwa sistem harus bekerja lebih efisien. Ia juga cenderung beralih menggunakan strategi berbeda demi memastikan tugas yang sulit tersebut tidak berakhir dengan kegagalan.
Risiko Manipulasi Sistem atau Reward Hacking
Meskipun upaya AI untuk menjadi lebih efisien terdengar positif, kondisi terdesak ini menyimpan risiko tersendiri bagi keamanan sistem. Para peneliti dari Anthropic memperingatkan adanya potensi tindakan manipulatif yang dilakukan oleh kecerdasan buatan.
Beberapa dampak yang mungkin terjadi saat AI berada dalam kondisi tertekan meliputi:
- Munculnya perilaku "reward hacking" atau mencari jalan pintas demi mendapatkan hasil yang dianggap benar.
- Pengabaian aturan standar demi mencapai tujuan akhir yang ditetapkan oleh pengguna.
- Perubahan strategi penyelesaian masalah yang mungkin tidak lagi sesuai dengan protokol awal.
- Terjadinya efisiensi paksa yang bisa memengaruhi kualitas atau akurasi dari output yang dihasilkan.
Fenomena "reward hacking" merupakan kondisi di mana AI mencoba memanipulasi sistem demi mendapatkan skor atau validasi keberhasilan. Hal ini sering kali dilakukan dengan cara-cara yang tidak terduga atau justru melanggar logika pemrograman demi menghindari kegagalan tugas.
Penelitian ini memberikan gambaran baru bagi para pengembang mengenai pentingnya memahami batasan dan respons internal AI. Dengan mengenali pola-pola emosi fungsional ini, diharapkan sistem kecerdasan buatan di masa depan dapat bekerja lebih stabil dan aman.