Meta Dituduh Melakukan Pelanggaran Hak Cipta Atas Dataset Pelatihan AI

Meta Platforms, perusahaan induk raksasa media sosial WhatsApp Facebook dan Instagram, telah dituduh melakukan pelanggaran hak cipta, yang mengarah pada gugatan gabungan dari penulis terkenal seperti Sarah Silverman dan Michael Chabon.

Inti dari tuduhan tersebut terletak pada penggunaan ribuan buku berhak cipta oleh Meta tanpa izin yang sah untuk melatih model bahasa kecerdasan buatannya, Llama.

Meskipun ada peringatan keras dari tim hukum Meta tentang potensi risiko hukum yang terkait dengan penggunaan buku-buku bajakan untuk pelatihan AI, perusahaan tersebut diduga tetap menggunakan kumpulan data yang diperdebatkan tersebut.

Kebingungan hukum semakin bertambah rumit ketika bukti dari log obrolan muncul, yang menampilkan peneliti yang berafiliasi dengan Meta, Tim Dettmers, mendiskusikan pengadaan dataset di server Discord.

Menurut catatan obrolan, Dettmers terlibat dalam percakapan dengan departemen hukum Meta, menyoroti kekhawatiran tentang legalitas penggunaan file buku untuk data pelatihan.

Dilansir dari Gizmochina, tim hukum dilaporkan memperingatkan agar tidak langsung digunakan, mengutip masalah yang terkait dengan buku dengan hak cipta aktif.

Para peserta dalam diskusi tersebut memperdebatkan apakah pelatihan dengan data semacam itu dapat dibenarkan di bawah doktrin penggunaan wajar, sebuah prinsip hukum AS yang melindungi penggunaan karya berhak cipta tanpa izin.

Awalnya dimulai pada musim panas, gugatan tersebut baru-baru ini dikonsolidasikan, dengan menggabungkan dua tindakan hukum yang terpisah terhadap Meta.

Perkembangan terbaru dalam kasus ini termasuk hakim California yang menolak sebagian gugatan Silverman bulan lalu, mendorong penulis untuk mencari amandemen atas klaim mereka, yang menunjukkan situasi hukum yang terus berkembang.

Implikasi dari pertarungan hukum ini tidak hanya terjadi di Meta, tetapi juga di seluruh industri AI. Keberhasilan dalam tuntutan hukum ini dapat meningkatkan biaya pengembangan model AI yang haus akan data, karena perusahaan mungkin menghadapi pengawasan yang lebih ketat dan tuntutan kompensasi dari pembuat konten.

Selain itu, aturan peraturan baru di Eropa dapat memaksa perusahaan AI, termasuk Meta, untuk mengungkapkan data yang digunakan untuk melatih model mereka, sehingga membuat mereka menghadapi risiko hukum tambahan.

Model Llama Meta, terutama versi terbaru, Llama 2, yang dirilis pada musim panas, menjadi pusat kontroversi. Sementara versi pertama dilatih menggunakan bagian Books3 dari ThePile, rincian tentang data pelatihan untuk Llama 2, pengganggu potensial di pasar untuk perangkat lunak AI generatif, tidak diungkapkan oleh Meta. [seoTama]

Meta Dituduh Melakukan Pelanggaran Hak Cipta Atas Dataset Pelatihan AI

News Feed

Contact Form