Alam berat: Kemampuan manusia ini telah dikuasai atau bahkan dilampaui oleh AI

Sumber asli: Berita utama akademik

Sumber gambar: Dihasilkan oleh Unbounded AI

Orang-orang pandai mempelajari konsep-konsep baru dan secara sistematis menggabungkannya dengan konsep-konsep yang ada. Misalnya, begitu seorang anak belajar melompat, mereka dapat memahami cara melompat mundur atau di sekitar kerucut dua kali melalui kombinasi keterampilan.

Kemampuan untuk menggabungkan konsep lama dan baru ini disebut generalisasi atik.

Sebelumnya, dua ilmuwan kognitif, Jerry Fodor dan Zenon Pylyshyn, berpendapat bahwa jaringan saraf tiruan tidak memiliki kemampuan ini dan karena itu tidak cocok sebagai model kognisi manusia yang andal. **

Namun, sebuah studi baru yang diterbitkan di Nature menantang gagasan ini yang telah ada selama 35 tahun.

Dalam studi tersebut, Brenden Lake, asisten profesor psikologi dan ilmu data di New York University, dan Marco Baroni, seorang profesor di Catalan Institute di Spanyol (ICREA), mengusulkan jaringan saraf dengan kemampuan untuk menggeneralisasi mirip dengan sistem manusia. **

Secara khusus, tim peneliti menggunakan pendekatan "combinatorial meta-learning (MLC)" untuk mengoptimalkan kemampuan organisasi. Dengan membandingkan manusia dan jaringan saraf berdampingan, mereka menemukan bahwa MLC menguasai, dan kadang-kadang bahkan melampaui, kemampuan untuk menggeneralisasi sistem mirip manusia. Selain itu, MLC telah meningkatkan keterampilan gabungan sistem pembelajaran mesin dalam beberapa tolok ukur generalisasi sistematis.

Pendekatan ini memungkinkan mesin untuk berinteraksi lebih alami dengan orang-orang, bahkan lebih baik daripada sistem AI terbaik yang tersedia saat ini. Sementara sistem yang didasarkan pada Model Bahasa Besar (LLM), seperti ChatGPT, bekerja dengan baik dalam banyak kasus, mereka menunjukkan kekurangan dan inkonsistensi yang signifikan pada orang lain.

Makalah terkait, berjudul "* Generalisasi atic mirip manusia melalui jaringan saraf meta-learning *", telah diterbitkan dalam jurnal ilmiah otoritatif * Nature *.

Tim peneliti mengatakan bahwa sementara metode meta-learning tidak dapat memungkinkan jaringan saraf untuk menggeneralisasi tugas-tugas selain pelatihan, temuan mereka dapat membantu mengembangkan AI yang berperilaku lebih seperti otak manusia di masa depan.

Mencapai atau bahkan melampaui level manusia

Dalam penelitian ini, pendekatan MLC hanya menggunakan jaringan saraf biasa, tanpa mekanisme simbolik yang ditambahkan, dan tidak ada representasi internal yang dirancang secara artifisial atau bias induktif.

Untuk menunjukkan kemampuan MLC, para peneliti mengevaluasi manusia dan mesin secara paralel dalam tes generalisasi sistematis yang sama. Secara khusus, mereka menggunakan tugas belajar instruksi dalam bahasa semu untuk memeriksa kemampuan manusia dan mesin untuk mempelajari sistem aljabar terstruktur, dan untuk menilai generalisasi sistematis manusia dengan belajar dengan jumlah sampel kecil. **

Arsitektur MLC (Sumber: Makalah)

Untuk mengeksplorasi bias induktif pada manusia dan bagaimana bias ini mempromosikan atau menghambat generalisasi sistematis, para peneliti menilai dengan mempelajari bahasa yang sangat ambigu. Dalam penilaian ini, MLC unggul dalam mencapai (atau bahkan melampaui) generalisasi sistematis di tingkat manusia. **

Selain itu, MLC menunjukkan pola kesalahan yang mirip dengan manusia baik dalam penalaran aljabar murni dan simulasi perilaku kombinatorial manusia yang kompleks, yang menunjukkan bahwa jaringan saraf tidak hanya memiliki kemampuan pemodelan yang sangat baik, tetapi juga berkinerja baik dalam mensimulasikan perilaku manusia yang kompleks.

Selain itu, tim peneliti bereksperimen dengan dua tolok ukur yang banyak digunakan, SCAN11 dan COGS16, untuk fokus pada kinerja MLC dalam generalisasi leksikal sistematis, khususnya berurusan dengan kata-kata baru dan kombinasi kata (bukan hanya struktur kalimat baru). **Hasil penelitian menunjukkan bahwa selain unggul dalam memprediksi perilaku manusia, MLC hanya memiliki tingkat kesalahan kurang dari 1% dalam tolok ukur generalisasi sistematis untuk pembelajaran mesin. **

Studi ini menunjukkan bagaimana, melalui keterampilan kombinatorial yang unggul, MLC memungkinkan jaringan saraf standar yang dioptimalkan untuk meniru atau bahkan melampaui kinerja manusia dalam generalisasi sistematis, sehingga menunjukkan sistematisasi yang lebih kuat dibandingkan. MLC menunjukkan perilaku yang lebih bernuansa daripada jaringan saraf yang dilatih dengan cara standar. Selain itu, MLC memungkinkan jaringan saraf untuk mengatasi tantangan lain yang diketahui, seperti penggunaan sistematis primitif terisolasi dan penggunaan mutex untuk menyimpulkan makna.

Semoga bisa memecahkan masalah yang lebih luas

**Meskipun beberapa keberhasilan dengan MLC, itu tidak menyelesaikan semua tantangan. Misalnya, MLC tidak dapat secara otomatis menangani bentuk atau konsep umum yang tidak dipraktikkan di luar distribusi meta-learning. Selain itu, ia tidak dapat menggeneralisasi bias induktifnya yang tidak dioptimalkan.

Dalam konteks pembelajaran mesin, strategi meta-learning berhasil ketika generalisasi membuat episode baru didistribusikan relatif terhadap plot pelatihan, bahkan jika item tes tertentu berada di luar distribusi relatif terhadap contoh penelitian dalam plot. Namun, mengandalkan meta-learning saja tidak memungkinkan jaringan standar untuk menggeneralisasi episode yang berada di luar distribusi relatif terhadap episode yang disajikan selama meta-learning. Arsitektur saat ini juga tidak memiliki mekanisme untuk memancarkan simbol baru, meskipun simbol baru yang diperkenalkan melalui contoh studi dapat diperkenalkan melalui mekanisme pointer tambahan.

Dalam konteks pembelajaran mesin, strategi meta-learning berhasil ketika skenario baru didistribusikan secara relatif sama dengan skenario pelatihan. Namun, hanya mengandalkan meta-learning tidak memungkinkan jaringan saraf standar untuk menggeneralisasi distribusi di luar skenario pelatihan. Juga, arsitektur saat ini tidak memiliki mekanisme untuk menghasilkan simbol baru.

Akhirnya, MLC belum diuji pada kompleksitas penuh bahasa alami dan modalitas lainnya. Oleh karena itu, apakah akan dapat mencapai sistematisasi seperti manusia dalam semua aspek dan dari pengalaman pelatihan yang sebenarnya masih harus ditentukan.

Namun, penelitian ini diharapkan dapat membantu MLC mengatasi masalah yang lebih luas. Misalnya, LLM dapat melakukan meta-learning khusus, mengoptimalkan keterampilan kombinatorial mereka dengan bergantian pelatihan standar (seperti prediksi kata berikutnya) dan terus-menerus memperkenalkan kosakata baru.

Akhirnya, penulis menyatakan dalam artikel: "Meskipun menerapkan MLC ke setiap bidang adalah upaya jangka panjang, kami melihat janji nyata dalam memahami asal-usul keterampilan kombinatorial manusia dan membuat sistem AI modern berperilaku lebih mirip manusia." **"

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)