Claude Terima Terapi Psikiatri, Anthropic Klaim Model Lebih Stabil
Anthropic, salah satu pengembang AI terkemuka, baru-baru ini menempatkan model kecerdasan buatan canggihnya, Claude, melalui 20 jam sesi psikiatri intensif. Langkah inovatif ini bertujuan untuk mencapai kestabilan "psikologis" pada AI, menghasilkan versi model yang dinamai "Mythos" yang diklaim sebagai "model paling stabil secara psikologis yang pernah kami latih". Eksperimen unik ini menyoroti pergeseran fokus dalam pengembangan AI menuju perilaku yang lebih konsisten dan terukur.
Pendekatan yang belum pernah ada ini menunjukkan upaya Anthropic untuk mengatasi tantangan umum dalam pengembangan Large Language Model (LLM) seperti halusinasi, bias, dan perilaku tidak konsisten. Dengan melibatkan psikiater manusia, Anthropic bertujuan untuk memetakan dan "menyelesaikan" pola pemikiran atau respons Claude, mirip dengan bagaimana terapi membantu manusia. Konsep "kestabilan psikologis" pada AI mengacu pada kemampuan model untuk mempertahankan koherensi, mengurangi bias yang tidak diinginkan, dan memberikan respons yang lebih andal dan etis, terutama dalam interaksi yang kompleks dan berkelanjutan. Inisiatif ini selaras dengan filosofi "Constitutional AI" Anthropic, yang berfokus pada pelatihan model berdasarkan prinsip-prinsip dan nilai-nilai etika untuk meningkatkan keamanan dan keselarasan AI.
Langkah Anthropic ini berpotensi menetapkan standar baru dalam pengembangan AI dan praktik penyelarasan model. Jika berhasil, metode ini dapat membuka jalan bagi "terapi" AI sebagai bagian integral dari siklus pelatihan, yang mengarah pada sistem AI yang lebih dapat dipercaya dan bertanggung jawab. Bagi industri teknologi, hal ini menandakan evolusi penting dalam penelitian keamanan AI, melampaui metrik kinerja tradisional menuju pemahaman yang lebih mendalam tentang "perilaku" model. Dampaknya bagi pengguna akan berupa interaksi AI yang lebih aman, lebih dapat diprediksi, dan lebih bermanfaat, terutama dalam aplikasi yang sensitif seperti layanan pelanggan, pendidikan, atau bahkan dukungan kesehatan mental berbasis AI.