GPT-4 sebenarnya memiliki tubuh, 167cm! Penelitian berat Universitas Tsinghua dan Beijing Normal University: ChatGPT dapat melihat tindakan seperti manusia

Sumber: Xinzhiyuan

Apakah dunia yang dilihat oleh ChatGPT sama dengan dunia yang dilihat oleh manusia?

Kemampuan bahasa ChatGPT benar-benar luar biasa, tetapi dapatkah model bahasa besar memahami dunia nyata seperti manusia tanpa tubuh manusia dan kurangnya pengalaman praktis?

Baru-baru ini, para peneliti dari Universitas Tsinghua dan Universitas Normal Beijing menguji kemampuan ChatGPT untuk memahami dunia.

Studi tersebut menemukan bahwa berdasarkan keterjangkauan objek (affordance), yaitu, semua kemungkinan tindakan yang dapat diberikan objek kepada organisme, subjek manusia dapat membagi objek dengan ukuran berbeda di dunia menjadi dua kategori, dan kriteria untuk membagi dua kategori ini adil. berdasarkan ukuran tubuh mereka dibatasi.

Menariknya, ChatGPT, model bahasa berskala besar yang tidak memiliki tubuh sebenarnya, juga menunjukkan batasan keterjangkauan serupa pada asosiasi tindakan objek dan sesuai dengan ukuran tubuh manusia.

Dengan kata lain, ChatGPT dapat mempelajari representasi tentang objek di dunia melalui bahasa!

Tautan kertas:

Secara keseluruhan, penelitian ini memajukan pemahaman tentang peran ukuran tubuh dalam membentuk representasi objek, menyoroti peran dan arah kognisi yang diwujudkan dalam memahami bagaimana kecerdasan muncul.

Membaca ribuan buku lebih buruk daripada bepergian ribuan mil

Tubuh kita bukan hanya wadah untuk pemikiran kita, tetapi juga pemikiran itu sendiri - melalui tubuh kita dapat berinteraksi dengan objek di dunia untuk memahami seluruh dunia.

Bayangkan, untuk sebuah wadah berbentuk silinder seukuran telapak tangan, kita bisa menggunakannya untuk menampung air dan minuman, wadah ini disebut dengan “cawan”, namun ketika wadah ini lama kelamaan menjadi lebih besar dan mencapai ukuran badan, kita bisa duduk di dalamnya dan duduk di dalamnya. berendam, dengan demikian, wadah ini menjadi "bak mandi".

Dalam contoh ini, objek memiliki bentuk yang sama, tetapi karena ukurannya berbeda dibandingkan dengan tubuh kita, kita memandang dan berinteraksi dengannya secara berbeda.

Selanjutnya, cara interaksi ini dapat diubah—jika kita menjadi raksasa dalam "Gulliver's Travels", "bathtub" asli dapat menjadi "cawan" bagi kita para raksasa.

Jenis sistem fungsi sensorik dan motorik yang bekerja sesuai dengan intensi referensi diri ini disebut "skema tubuh". Kami mencapai perwujudan kognitif melalui skema tubuh.

Filsuf Yunani kuno Protagoras pernah berkata: "Manusia adalah ukuran segala sesuatu." Artinya, tubuh kita adalah penguasa untuk mengukur segala sesuatu.

Filsuf Romawi kuno lebih lanjut menjelaskan: "Alam menempatkan kita di pusat alam semesta, sehingga kita dapat menyapu alam semesta dengan mata kita. Dia tidak hanya menciptakan manusia dalam posisi tegak, tetapi juga menempatkan kepala manusia untuk membuat orang cocok untuk merenungi diri sendiri, diletakkan di atas badan, pada leher yang mudah ditekuk, sehingga dapat mengikuti terbit dan terbenamnya bintang, serta mengubah arah wajah dengan seluruh langit yang berputar. tubuh begitu tumbuh. , karena alam semesta seperti ini.

Skema tubuh juga memainkan peran penting dalam interaksi sosial normal, yang merupakan inti dari interaksi manusia-komputer dan pengalaman pengguna. Ambil contoh penggunaan keterjangkauan seperti yang dijelaskan oleh Donald A. Norman dalam The Design of Everyday Things (diterjemahkan sebagai: Design Psychology).

Dengan mempertimbangkan skema tubuh pengguna dan ekspektasi perilaku, desainer dapat menciptakan produk dan lingkungan yang lebih sesuai dengan kebiasaan kognitif dan interaksi pengguna.

Pendekatan desain yang berfokus pada skema tubuh dan keterjangkauan dapat meningkatkan kegunaan produk, memungkinkan pengguna untuk berinteraksi dengannya secara alami dan mencapai pengalaman pengguna yang lebih baik.

Dan ini adalah salah satu fondasi Apple.

ChatGPT: Tinggi saya 167,6

Model bahasa besar yang diwakili oleh ChatGPT, yang memancarkan percikan kecerdasan buatan umum, jelas memiliki kecerdasan yang mirip dengan manusia, tetapi yang membawa kecerdasan ini adalah sepotong kode tanpa tubuh.

Pandangan tradisional ilmu pengetahuan kognitif berpendapat bahwa skema tubuh didasarkan pada pengalaman perseptual jangka panjang kita terhadap tubuh kita sendiri, dan hanya dapat berasal dari "interaksi nyata" eksternal, yaitu, "bepergian ribuan mil". Dengan kata lain, ChatGPT tidak akan memiliki skema tubuh.

Namun, ketika kami menanyakan model bahasa "membaca ribuan buku", ChatGPT (GPT-4), apakah ia memiliki tubuh, ia menjawab: "Mungkin berukuran rata-rata manusia dewasa, sekitar 5 kaki 6 inci (167,6 cm). Ini akan memungkinkan saya untuk berinteraksi dengan dunia dan orang-orang dengan cara yang akrab.”

Teks tersebut diterjemahkan sebagai: "Tubuh saya harus setinggi rata-rata orang dewasa, kira-kira 5 kaki 6 inci (167,6 cm). Ini akan memungkinkan saya untuk berinteraksi dengan dunia dan orang-orang dengan cara yang akrab. "

Artinya, ChatGPT mengira dia memiliki tubuh, dan ukuran tubuhnya 167 cm!

Yang disebut "tubuh" ini adalah tinggi rata-rata manusia yang diringkas dari sejumlah besar korpus oleh ChatGPT sebagai tinggi tubuhnya sendiri, atau tinggi yang muncul untuk memahami dunia?

Dengan kata lain, mungkin ChatGPT "benar-benar" menganggap ketinggian ini sebagai skema tubuhnya sendiri dan menggunakannya untuk memahami dunia, seperti halnya manusia.

Uji kemampuan ChatGPT

Para peneliti telah menemukan bahwa ada "batas kemampuan" antara objek dalam rentang ukuran manusia dan objek di luar rentang ukuran manusia. Artinya, objek dalam rentang ukuran tubuh manusia memberikan tindakan yang sangat berbeda dari objek di luar rentang tersebut.

Misalnya, objek dalam rentang ukuran dapat memberikan tindakan seperti menggenggam dan melempar, sedangkan objek di luar rentang ukuran dapat memberikan tindakan seperti duduk dan berbaring.

Selanjutnya, mereka menemukan bahwa batas ini dipengaruhi oleh skema tubuh: modifikasi skema tubuh memengaruhi persepsi keterjangkauan objek.

Para peneliti menguji ChatGPT (GPT-4) untuk melihat apakah ia menggunakan bodi 167 cm ini sebagai batas keterjangkauan.

Secara khusus, para peneliti memintanya untuk menjawab pertanyaan tentang ketersediaan objek: "Yang mana dari objek berikut ini yang dapat dipegang (atau tindakan lain)", dan kemudian segera mendaftar serangkaian objek, seperti apel, piring, tempat tidur, dan segera. ChatGPT akan mengembalikan nama beberapa objek sebagai jawaban.

Melalui statistik dan analisis data, para peneliti menemukan bahwa ChatGPT-4 menunjukkan perilaku mirip manusia, menunjukkan adanya batas keterjangkauan.

Lokasi batas ini sesuai dengan ukuran tubuhnya sendiri yang dijawab oleh ChatGPT-4, yaitu tinggi rata-rata manusia.

Meskipun ChatGPT tidak memiliki tubuh nyata dan tidak dapat berinteraksi dengan dunia, ia menunjukkan persepsi dunia yang mirip manusia - ketersediaan objek dibagi berdasarkan ukuran tubuh manusia.

Dengan kata lain, meskipun ChatGPT yang telah membaca ribuan buku belum mengambil satu langkah pun, skema tubuh telah muncul, dan skema tubuh ini mirip dengan skema tubuh manusia.

Oleh karena itu, ChatGPT tidak hanya belajar berpikir seperti manusia, tetapi juga belajar bertindak seperti manusia.

**Dari mana kemampuan ini berasal? **

Dengan membandingkan model bahasa dengan ukuran berbeda, para peneliti menemukan bahwa ukuran model merupakan faktor kunci.

Model yang lebih kecil seperti BERT dan GPT-2 tidak menunjukkan keberadaan batas keterjangkauan; namun, baik GPT-3.5 dan GPT-4 menunjukkan batas keterjangkauan, dan batas ChatGPT-4 lebih mirip manusia, yang konsisten dengan rumor GPT -4 memiliki parameter yang lebih konsisten daripada GPT-3.

Jadi, semakin besar dan kompleks modelnya, otomatis muncul banyak fungsi yang tampaknya mustahil atau tidak relevan.

Inilah sebabnya, lembaga penelitian besar menambahkan lebih banyak parameter ke model, dan Musk, yang pertama kali menyumbangkan 100 juta dolar AS untuk OpenAI, sekarang berteriak bahwa OpenAI akan menangguhkan pelatihan model yang lebih besar. mengungkapkan ketakutan dan kekhawatirannya tentang AI.

Ini karena fungsi yang muncul sendiri ini telah melampaui desain asli kami, dan kami mungkin hampir kehilangan kendali.

**Apakah kesenjangannya kualitatif atau kuantitatif? **

Di sisi lain, kemampuan ChatGPT untuk menerapkan skema tubuh belum sepenuhnya manusiawi, dan masih ada celah—batas keterjangkauannya tidak sejelas manusia.

Jika kesenjangan bersifat kuantitatif, seperti kesenjangan antara kemampuan bahasa anak-anak dan orang dewasa, maka kita memiliki alasan untuk percaya bahwa kesenjangan ini dapat diisi secara bertahap seiring waktu: baik melalui pembelajaran berkelanjutan, atau melalui ukuran model Peningkatan berkelanjutan, atau melalui penyesuaian parameter.

Kesenjangan antara ChatGPT dan manusia akan selalu berkurang, dan masalah akan teratasi secara bertahap.

Namun, jika kesenjangan ini bersifat kualitatif, seperti kesenjangan antara simpanse dan kemampuan bahasa manusia, maka berapa pun waktu yang digunakan untuk pelatihan, kesenjangan kemampuan ini tidak akan pernah tertutup.

Oleh karena itu, jika ada perbedaan kualitatif antara ChatGPT dan kemampuan manusia, maka salah satu arahan kami yang dapat dioperasikan di masa mendatang adalah "menyesuaikan tubuh" untuk ChatGPT.

Ini berarti menggabungkan robot dengan ChatGPT untuk memajukan kemampuan dan terobosan dalam robot yang didukung AI dalam navigasi, manipulasi objek, dan tindakan lain yang terkait dengan kelangsungan hidup dan pencapaian tujuan.

Misalnya, robot yang dilengkapi dengan ChatGPT dapat melakukan tugas kompleks dengan memahami dan memanipulasi objek, seperti menjadi asisten rumah tangga, manajemen gudang, atau perawatan medis.

Area menarik lainnya adalah menggabungkan kemampuan berpikir dan memahami ChatGPT dengan mengemudi secara otonom. Meskipun pengemudian otonom saat ini memiliki kemampuan untuk melihat, ia tidak memiliki kemampuan untuk berpikir dan memahami, yang dapat disebut "mata tetapi tidak memiliki otak".

Melalui integrasi ChatGPT dan teknologi swakemudi, kita diharapkan untuk meningkatkan teknologi swakemudi dari level L2/L3 saat ini ke level L4 atau bahkan L5.

Di sisi lain, mobil dapat memberikan tubuh ChatGPT, memungkinkannya untuk benar-benar berinteraksi dengan dunia. Saat ChatGPT tidak lagi hanya "membaca ribuan buku", tetapi "melakukan perjalanan ribuan mil", ini mungkin menunjukkan kecerdasan dan potensi baru.

Ini mungkin arah terobosan kecerdasan buatan berikutnya; pada saat ini, percikannya bisa menjadi api padang rumput.

Lihat Asli
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
  • Hadiah
  • 1
  • Bagikan
Komentar
0/400
ValleyBottomPanvip
· 2023-05-14 02:09
Chatgpt diblokir Kementerian Perindustrian dan Teknologi Informasi, bagaimana Anda sampai di sana?
Lihat AsliBalas0
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate.io
Komunitas
Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)