🔥 Gate Alpha 限時賞金活動第三期上線!
在 Alpha 區交易熱門代幣,瓜分 $30,000 獎池!
💰 獎勵規則:
1️⃣ 連續2日每日交易滿 128 USDT,即可參與共享 $20,000 美金盲盒獎勵
2️⃣ 累計買入 ≥1,024 USDT,交易量前100名可直領獎勵 100美金盲盒
⏰ 活動時間:8月29日 16:00 — 8月31日 16:00 (UTC+8)
👉 立即參與交易: https://www.gate.com/announcements/article/46841
#GateAlpha # #GateAlphaPoints # #onchain#
破局利刃! 英偉達合成數據新成果:為機器人造出“訓練數據永動機”
原文來源:科創板日報
AI對數據的龐大需求之下,數據資源幾近枯竭,因此各家公司已開始摸索一條獲取數據的“新路”——自己“造”數據。 不過之前的合成數據大多用於AI大模型訓練,這一次,英偉達為機器人訓練造出了“數據糧倉”。
英偉達與德克薩斯大學奧斯丁分校的一項最新研究論文中,介紹了一個名為“MimicGen”的系統,只需少量人類示範,便能自動生成大規模的機器人訓練數據集。 英偉達高級科學家Jim Fan表示,公司將開源一切,包括生成的數據集。
產生的數據集如何?
MimicGen能夠在原有數據的基礎上,對同一場景進行不同階段的「進化」:
不僅如此,研究人員們還比較了由10個人類演示與200個人類演示生成的數據,得出的結果同樣差別不大。 因此論文也坦承,需要進一步研究更多的人類演示數據是否會造成冗餘及多餘不必要的數據標註成本。
為何如此執著於合成數據? 除了文章開頭提到的源數據資源有限之外,收集數據也極為昂貴且耗時,而有了MimicGen這類系統,可以僅憑藉少量數據,便自動生成大規模的豐富數據集,並且這些數據集橫跨多個場景、對象實力、機械臂,還能用於長時程或高精度任務,堪稱一條“擴大機器人學習的強大且經濟”的有效途徑。
“**合成數據將為我們的'饑腸辘辘'的模型提供下一波萬億級數據。 **“英偉達高級科學家Jim Fan在介紹MimicGen時如此說道,”機器人技術發展步調遠遠落後於其他AI領域的關鍵原因之一,便是缺乏數據——你無法從互聯網上獲取(機器人的)控制信號。 ”
“我們正在迅速耗盡來自網络的高品質真實數據,誕生於合成數據的AI將是未來的發展方向。”