Microsoft Hapus Panduan Latih AI, Sarankan Konten Bajakan Harry Potter
Microsoft baru-baru ini menghapus sebuah postingan blog kontroversial yang secara keliru menyarankan pengembang untuk melatih model bahasa besar (LLM) mereka menggunakan dataset buku Harry Potter yang ternyata berstatus bajakan. Panduan tersebut, yang dipublikasikan di blog resmi perusahaan, dengan cepat ditarik setelah memicu kritik dan pertanyaan serius mengenai praktik data training AI dan hak cipta. Dalam penjelasan singkat, Microsoft menyatakan dataset tersebut "secara keliru" dilabeli sebagai domain publik.
Insiden ini menyoroti kompleksitas dan tantangan etika dalam pengembangan kecerdasan buatan, khususnya terkait dengan akuisisi data pelatihan untuk LLM. Model AI modern membutuhkan volume data yang sangat besar untuk mencapai akurasi dan kapabilitas yang diinginkan, namun sumber data tersebut harus legal dan bebas dari pelanggaran hak cipta. Kesalahan fatal dalam panduan Microsoft adalah pelabelan dataset Harry Potter sebagai "domain publik," padahal karya-karya J.K. Rowling tersebut masih dilindungi hak cipta secara ketat dan tidak memenuhi kriteria tersebut. Hal ini menunjukkan potensi misinformasi atau kegagalan verifikasi internal yang serius dalam proses penyusunan konten teknis oleh perusahaan sekelas Microsoft yang merupakan salah satu pemimpin di bidang AI.
Kejadian ini tidak hanya berpotensi merusak reputasi Microsoft, salah satu pemain kunci dalam perlombaan AI global melalui platform seperti Azure OpenAI dan Copilot, tetapi juga memperkuat urgensi diskusi tentang etika dan legalitas dalam ekosistem AI. Bagi industri teknologi, insiden ini menjadi pengingat penting akan perlunya validasi ketat terhadap sumber data dan panduan yang dipublikasikan, terutama saat berhadapan dengan isu sensitif seperti hak cipta. Pengembang dan perusahaan yang membangun LLM didorong untuk melakukan uji tuntas yang menyeluruh terhadap data pelatihan mereka guna menghindari implikasi hukum dan etika yang merugikan di masa depan, seiring dengan semakin ketatnya pengawasan regulasi terhadap teknologi AI di seluruh dunia.