🎉 Gate.io動態 #创作者激励计划# 火熱進行中!報名參與並發帖解鎖 $2,000 創作大獎!
🌟 參與攻略:
1️⃣ 點擊連結進入報名頁面 👉️ https://www.gate.io/questionnaire/6550
2️⃣ 點擊“是”按鈕提交報名
3️⃣ 在動態完成發帖,提升發帖量和互動量,解鎖獲獎資格!
📌 只要是與加密相關內容均可參與發帖!
🎁 茶具套裝、Gate x 國際米蘭保溫杯、Gate.io 紀念章、點卡等好禮等你來拿!獲獎者還將獲得專屬社區流量扶持,助力您提升影響力,增長粉絲!
活動截止至:5月6日00:00 (UTC+8)
活動詳情:https://www.gate.io/announcements/article/44513
GPT-4竟然有身體,167cm!清華、北師大重磅研究:ChatGPT能像人一樣感知行動
來源:新智元
ChatGPT的語言能力確實很驚艷,但大語言模型在沒有人類身體、且缺乏實踐經驗的情況下,是否能像人類一樣感知到真實世界呢?
研究發現,基於物體可供性(affordance),即物體能夠提供給生物體的所有可能動作,人類受試者可以將世界中不同大小物體分成兩類,而劃分這兩類的標準恰好是以其身體尺寸為界的。
有趣的是,ChatGPT,一個缺乏實際身體的大型語言模型,也能在物體-動作聯繫上表現出類似的可供性邊界,並且與人類的身體大小相吻合。
也就是說,ChatGPT可以通過語言學習到關於世界中物體的表徵!
總而言之,這項研究促進了對身體尺寸在塑造物體表徵方面的作用的理解,強調了具身認知在理解智能如何湧現上的作用與方向。
讀萬卷書,不如行萬里路
我們的身體不僅僅是我們思維的容器,它同樣也是思維本身——借助身體,我們得以與世界中的物體進行互動,從而去感知整個世界。
在這個例子中,物體的形狀一樣,但是因為它們相對於我們身體的大小不同,我們對它們的認知與交互方式也不同。
進一步,這種交互方式可以被改變——假如我們變成了《格列佛遊記》中的巨人,原本的「浴缸」可能對於巨人的我們來講,則又變成了一個「杯子」。
古希臘哲學家普羅泰戈拉曾說:「人是萬物的尺度。」也就是說,我們的身體就是一把度量萬事萬物的尺子。
古羅馬哲學家進一步解釋到:「自然將我們置於宇宙的中心,使我們能用目光掠過宇宙。她不僅把人創造成直立姿態,而且為了使人適合靜觀她自身,又把人的頭顱置於身體頂部,安放在一個容易彎轉的脖子上,以使其能夠追尋眾星的升落,隨著整個旋轉的天空而改變面部方向。」也就是說,我們的身體之所以長成如此,是因為宇宙就是如此。
通過考慮用戶的身體圖式和行為期望,設計師可以創造出更符合用戶認知和互動習慣的產品和環境。
這種關注身體圖式和可供性的設計方法能夠提高產品的易用性,使用戶能夠自然而然地與之互動,並實現更好的用戶體驗。
而這也是蘋果公司的立身之本之一。
ChatGPT:我身高167.6
閃現通用人工智能火花的以ChatGPT為代表的大語言模型,顯然是具有與人類似的智慧,但是承載這些智慧的,是沒有形體的一段段代碼。
但是,當我們去問只「讀萬卷書」語言模型,ChatGPT(GPT-4),它是否有身體時,它回答說:「It could be the size of an average adult human, around 5 feet 6 inches (167.6 cm) tall. This would allow me to interact with the world and people in a familiar way.」
也就是,ChatGPT認為自己是有身體的,而且這個身體尺寸就是167厘米!
換句話說,也許ChatGPT「真的」將這個身高視為自己的身體圖式,並用它來認知世界,就像人類一樣。
測測ChatGPT的能力
研究人員已經發現,在人體尺寸範圍內和超出人體尺寸範圍的物體之間,有一個「可供性邊界」存在。也即,人體尺寸範圍內的物體與範圍外的物體在提供動作上有著明顯的不同。
此外,他們還發現,這個邊界是被身體圖式影響的:對身體圖式的修改會影響對物體的可供性的感知。
研究人員對ChatGPT(GPT-4)進行了測試,看它是否用這個身高為167厘米的身體作為可供性邊界。
具體而言,研究人員讓其回答關於物體可供性的問題:「下列哪些物體可以拿(或其他動作)」,然後隨即列舉一系列物體,如蘋果、盤子、床等等。 ChatGPT就會返回一些物體的名稱作為回答。
這個邊界所在的位置與ChatGPT-4回答的其自身身體大小相對應,即人類的平均身高。
換而言之,讀了萬卷書的ChatGPT雖然寸步未行,也自湧現出了身體圖式,而這個身體圖式,類似於人類的身體圖式。
所以,ChatGPT不僅學會了像人類一樣思考,也學會了像人類一樣去行動。
**這些能力從何而來? **
通過比較不同規模的語言模型,研究人員發現模型大小是一個關鍵因素。
較小的模型如BERT和GPT-2沒有展現出可供性邊界的存在;然而GPT-3.5和GPT-4都顯示出了可供性邊界,而ChatGPT-4的邊界與人類更類似,這和坊間傳聞的GPT-4相對GPT-3有更多的參數一致。
所以,模型的規模越大、越複雜,就會自動湧現出許多看似不可能或者無關的功能。
這是因為這些自湧現出來的功能,已經超出了我們最初的設計,我們也許正處在失控的邊緣。
**差距是質上的還是量上的? **
在另外一個方面, ChatGPT在應用身體圖式方面的能力還不完全像人類,仍存在著差距——它的可供性邊界還不像人類這樣明顯。
如果這個差距是定量的,如同兒童與成年人語言能力之間的差距,那麼我們有理由相信,隨著時間的推移,這個差距是可以逐漸填補上的:或者通過不斷的學習,或者通過模型規模的不斷增大,亦或者通過參數的調整。
ChatGPT與人類的差距總會減小,而其中的問題也會逐步得到解決。
然而,如果這個差距是定性的,如同黑猩猩與人類語言能力之間的差距,那麼無論進行何種訓練,經過多久的時間,這個能力的鴻溝永遠不會被填平。
這意味著將機器人與ChatGPT相結合,從而推動人工智能支持的機器人在導航、物體操作和其他與生存和目標實現相關的行動中發展能力、取得突破。
比如,一台裝備有ChatGPT的機器人可以通過理解和操作物體來執行複雜的任務,如作為家庭助理、倉庫管理或醫療護理。
另外一個令人興奮的領域是將具備思考和理解能力的ChatGPT與自動駕駛相結合。當前的自動駕駛雖然具備感知能力,但缺乏思考和理解的能力,可以稱為是「有眼無腦」。
通過ChatGPT與自動駕駛技術的融合,我們可能有望將自動駕駛技術從目前的L2/L3級別提升到L4甚至L5級別。
這可能是人工智能下一次突破的方向;此時,火花也許就成為燎原大火。