Ribuan orang di seluruh dunia sedang menjual identitas mereka untuk melatih AI, tetapi apa harganya?

Penulis: The Guardian

Diterjemahkan oleh: Deep潮 TechFlow

Deep潮 Panduan: Laporan investigasi ini mengungkapkan industri abu-abu yang sedang berkembang pesat: ribuan orang di seluruh dunia menghasilkan uang dari pelatihan AI dengan menjual suara, wajah, rekaman panggilan, dan video harian mereka.

Ini bukan sekadar diskusi umum tentang privasi, melainkan investigasi nyata dengan orang nyata, jumlah uang nyata, dan konsekuensi nyata—seorang aktor yang menjual wajahnya, kemudian melihat “dirinya sendiri” di Instagram mempromosikan produk medis yang tidak dikenal, dan di kolom komentar ada yang menilai “penampilan” nya.

Ketika kebutuhan data dari perusahaan AI bertemu dengan kesenjangan ekonomi global, terciptalah sebuah transaksi yang tidak seimbang.

Berikut lengkapnya:

Suatu pagi tahun lalu, Jacobus Louw yang tinggal di Cape Town, Afrika Selatan, seperti biasa keluar jalan-jalan, memberi makan burung camar di sepanjang jalan. Tapi kali ini dia merekam beberapa video—mengambil langkah kaki dan pandangannya di trotoar. Video ini memberinya uang sebesar 14 dolar, sekitar 10 kali lipat dari upah minimum negara itu, dan setara dengan pengeluaran makan setengah minggu untuk pria berusia 27 tahun ini.

Ini adalah tugas " navigasi kota" yang diselesaikan Louw di Kled AI. Kled AI adalah aplikasi berbayar yang memberi imbalan kepada pengguna yang mengunggah foto, video, dan data lain untuk melatih model AI. Dalam beberapa minggu saja, Louw menghasilkan 50 dolar dari mengunggah foto dan video kehidupan sehari-harinya.

Jauh ribuan mil, di Ranchi, India, mahasiswa berusia 22 tahun, Sahil Tigga, secara rutin menghasilkan uang dari Silencio—aplikasi crowdsourcing data audio untuk pelatihan AI yang mengakses mikrofon ponselnya, merekam suara di restoran dan persimpangan yang ramai. Ia juga mengunggah rekaman suaranya sendiri. Sahil bahkan pergi ke tempat-tempat unik, seperti lobi hotel yang belum tercatat di peta Silencio. Dari pekerjaan ini, ia mendapatkan lebih dari 100 dolar per bulan, cukup untuk menutupi seluruh pengeluaran makanannya.

Di Chicago, pemuda berusia 18 tahun, Ramelio Hill, yang sedang magang sebagai tukang las, menjual percakapan pribadi di ponsel bersama teman dan keluarganya ke Neon Mobile—platform pelatihan AI percakapan yang membayar 0,50 dolar per menit—dan menghasilkan ratusan dolar. Bagi Hill, ini adalah perhitungan sederhana: dia percaya perusahaan teknologi sudah mengumpulkan banyak data pribadinya, jadi mengapa tidak ikut mendapatkan bagian.

“Para pekerja lepas pelatihan AI” ini—mengunggah pemandangan sekitar, foto diri, video, dan audio—berada di garis depan dari sebuah demam emas data global. Dengan Silicon Valley yang sangat menginginkan data manusia berkualitas tinggi melebihi apa yang bisa diambil dari internet terbuka, industri pasar data yang berkembang pesat pun muncul untuk mengisi kekosongan ini. Dari Cape Town hingga Chicago, ribuan orang menyerahkan identitas biometrik dan data pribadi mereka secara mikro kepada generasi AI berikutnya.

Namun, ekonomi lepas ini datang dengan harga. Di balik beberapa dolar yang mereka peroleh, para pelatih ini memberi bahan bakar untuk industri yang berpotensi membuat keterampilan mereka usang, sekaligus mengekspos diri mereka pada risiko deepfake, pencurian identitas, dan eksploitasi digital—dan mereka baru mulai menyadari hal ini.

Menggerakkan roda AI

Model bahasa AI seperti ChatGPT dan Gemini membutuhkan bahan belajar dalam jumlah besar agar terus berkembang, tetapi mereka menghadapi kekurangan data. Sumber data pelatihan yang paling umum—C4, RefinedWeb, dan Dolma—mengisi seperempat dari dataset data berkualitas tinggi di internet, dan kini membatasi perusahaan AI generatif dalam melatih model mereka. Para peneliti memperkirakan, perusahaan AI paling cepat akan kehabisan data teks berkualitas tinggi yang baru pada tahun 2026. Meski beberapa laboratorium mulai menggunakan data sintetis yang dihasilkan AI sendiri untuk pelatihan ulang, proses rekursif ini berisiko menghasilkan model yang penuh dengan “sampah” dan kesalahan, yang dapat menyebabkan keruntuhan sistem.

Di sinilah aplikasi seperti Kled AI dan Silencio berperan. Di pasar data ini, jutaan orang menjual data identitas mereka untuk melatih dan mengembangkan AI. Selain Kled AI, Silencio, dan Neon Mobile, ada banyak pilihan lain bagi pelatih AI: Luel AI yang didukung oleh inkubator terkenal Y-Combinator, menawarkan data percakapan multibahasa dengan harga sekitar 0,15 dolar per menit; ElevenLabs memungkinkan pengguna menduplikasi suara mereka secara digital dan digunakan orang lain dengan tarif dasar 0,02 dolar per menit.

Profesor ekonomi di King’s College London, Bouke Klein Teeselink, menyatakan bahwa pekerjaan lepas pelatihan AI ini adalah kategori pekerjaan baru yang akan berkembang pesat.

Perusahaan AI tahu bahwa membayar biaya lisensi data kepada orang-orang membantu menghindari sengketa hak cipta yang mungkin timbul dari pengambilan data secara langsung dari internet. Teeselink mengatakan. Peneliti AI Veniamin Veselovsky menambahkan bahwa perusahaan-perusahaan ini juga membutuhkan data berkualitas tinggi untuk memodelkan perilaku baru dan yang lebih baik dari sistem mereka. “Saat ini, data manusia adalah standar emas untuk sampling di luar distribusi model,” katanya.

Manusia yang menggerakkan mesin ini—terutama dari negara berkembang—sering kali membutuhkan uang ini, dan hampir tidak punya pilihan lain. Bagi banyak pekerja lepas pelatihan AI, pekerjaan ini adalah respons praktis terhadap kesenjangan ekonomi. Di negara dengan tingkat pengangguran tinggi dan mata uang yang melemah, menghasilkan dolar seringkali lebih stabil dan menguntungkan daripada pekerjaan lokal. Beberapa orang sulit mendapatkan pekerjaan tingkat pemula dan harus melakukan pelatihan AI demi penghidupan. Bahkan di negara yang lebih makmur, kenaikan biaya hidup membuat menjual diri menjadi pilihan finansial yang masuk akal.

Louw dari Cape Town sadar akan risiko privasi yang menyertainya. Meski penghasilannya tidak stabil dan tidak cukup menutupi seluruh pengeluarannya setiap bulan, dia bersedia menerima kondisi ini demi uang. Ia telah lama menderita gangguan sistem saraf dan tidak bisa bekerja, tetapi uang dari pasar data AI (termasuk Kled AI) telah mengumpulkan 500 dolar, dan dia mendaftar kursus spa untuk menjadi terapis pijat.

“Sebagai orang Afrika Selatan, menerima dolar lebih berharga dari yang orang bayangkan,” kata Louw.

Profesor geografi internet di Oxford, Mark Graham, yang juga penulis buku “Feeding the Machines,” mengakui bahwa uang ini mungkin memiliki arti praktis dalam jangka pendek bagi individu di negara berkembang, tetapi dia memperingatkan, “Secara struktural, pekerjaan ini tidak stabil, tidak memiliki peluang kenaikan, dan sebenarnya adalah jalan buntu.”

Graham menambahkan bahwa pasar data AI bergantung pada “penekanan upah yang bersaing” dan “permintaan sementara terhadap data manusia.” Ketika permintaan ini beralih, “pekerja tidak akan memiliki perlindungan, keterampilan yang dapat dipindahtangankan, maupun jaring pengaman.”

Menurut Graham, satu-satunya pemenang adalah “platform di belahan bumi utara yang menguasai semua nilai yang tahan lama.”

Pengalihan hak penuh

Seorang pelatih AI dari Chicago, Hill, merasa campur aduk tentang menjual percakapan telepon pribadinya ke Neon Mobile. Sekitar 11 jam percakapan memberinya 200 dolar, tetapi dia mengatakan aplikasi ini sering offline dan menunda pembayaran. “Neon selalu terlihat mencurigakan bagi saya, tapi saya tetap pakai demi mendapatkan uang saku tambahan buat bayar tagihan,” katanya.

Sekarang dia mulai mempertanyakan apakah uang ini benar-benar semudah itu. Pada September tahun lalu, Neon Mobile offline beberapa minggu setelah peluncurannya, setelah TechCrunch menemukan celah keamanan yang memungkinkan siapa saja mengakses nomor telepon, rekaman panggilan, dan catatan teks pengguna. Hill mengatakan Neon Mobile tidak pernah memberi tahu dia tentang hal ini, dan sekarang dia khawatir suaranya akan disalahgunakan di internet.

Jennifer King, peneliti privasi data di Stanford’s Institute for Human-Centered Artificial Intelligence, merasa khawatir bahwa pasar data AI tidak jelas tentang bagaimana dan di mana data pengguna akan digunakan. Dia menambahkan bahwa tanpa pemahaman tentang hak mereka dan tanpa kemampuan bernegosiasi, “konsumen menghadapi risiko data mereka digunakan kembali dengan cara yang tidak mereka sukai, tidak mereka pahami, atau tidak mereka duga, dan hampir tidak ada jalan keluar.”

Ketika pelatih AI berbagi data di Neon Mobile dan Kled AI, mereka memberikan izin penuh (global, eksklusif, tidak dapat dicabut, dapat dipindahtangankan, dan bebas royalti), yang memungkinkan platform menjual, menggunakan, menampilkan secara publik, dan menyimpan potret mereka, bahkan menciptakan karya turunan berdasarkan data tersebut.

Avi Patel, pendiri Kled AI, mengatakan bahwa perjanjian data perusahaan mereka membatasi penggunaan data untuk pelatihan dan penelitian AI. “Seluruh model bisnis bergantung pada kepercayaan pengguna. Jika kontributor merasa data mereka bisa disalahgunakan, platform tidak akan berjalan.” Dia menambahkan bahwa perusahaan akan meninjau pembeli data sebelum menjual dataset, untuk menghindari bekerja sama dengan entitas yang “berniat buruk,” seperti industri pornografi, dan “instansi pemerintah” yang mungkin menggunakan data secara melanggar kepercayaan tersebut.

Neon Mobile tidak menanggapi permintaan komentar.

Enrico Bonadio, profesor hukum di City, University of London, yang juga mengajar di bidang hukum teknologi, menunjukkan bahwa ketentuan dalam perjanjian ini memungkinkan platform dan klien mereka “melakukan apa saja terhadap materi tersebut secara permanen, tanpa pembayaran tambahan, dan kontributor tidak memiliki cara nyata untuk mencabut persetujuan atau bernegosiasi ulang.”

Risiko yang lebih mengkhawatirkan termasuk: pelatih AI yang datanya digunakan untuk membuat deepfake dan impersonasi identitas. Meski pasar data mengklaim bahwa mereka menghapus informasi identifikasi pribadi (seperti nama dan lokasi) sebelum menjual data, Bonadio menambahkan bahwa fitur biometrik secara inheren sulit untuk dianonimkan secara bermakna.

Penyesalan penjual

Bahkan jika pelatih AI bisa bernegosiasi perlindungan yang lebih rinci tentang penggunaan data mereka, mereka tetap bisa menyesal. Pada 2024, aktor dari New York, Adam Coy, menjual wajahnya ke Captions—perangkat lunak pengedit video AI yang kini bernama Mirage—dengan harga 1.000 dolar. Perjanjian menyatakan bahwa identitasnya tidak akan digunakan untuk tujuan politik, promosi alkohol, tembakau, atau konten pornografi, dan masa berlakunya satu tahun.

Captions tidak menanggapi permintaan komentar.

Tak lama kemudian, teman-temannya mulai menyebarkan video yang mereka temukan di internet, menampilkan wajah dan suara Coy, yang telah ditiru oleh AI dan ditonton jutaan kali. Salah satu video di Instagram menunjukkan AI tiruan Coy yang mengaku sebagai “dokter vagina,” mempromosikan suplemen medis yang tidak terbukti untuk wanita hamil dan pasca melahirkan.

“Rasanya memalukan menjelaskan hal ini kepada orang lain,” kata Coy.

“Kolom komentar sangat aneh karena mereka menilai penampilan saya, padahal itu bukan saya,” tambah Coy. “Saat saya memutuskan untuk menjual wajah saya, saya pikir kebanyakan model akan diambil data dan gambarnya dari internet, jadi lebih baik dibayar.”

Coy mengatakan dia tidak lagi menerima pekerjaan lepas pelatihan AI. Dia hanya akan mempertimbangkan lagi jika ada perusahaan yang menawarkan bayaran besar.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan