《時代》雜誌發佈“2023 年最佳發明”榜單,14 個 AI 專案一覽

巴比特訊,10 月 24 日,《時代》雜誌發佈“2023 年最佳發明”榜單,涵蓋瞭人工智慧、綠色能源和可持續發展等重點領域。 據悉,此次評選的標準包括獨創性、效率、影響力等,共計 200 項突破性發明(以及 50 項特別獎發明)入選,這些發明正在改變我們的生活、工作、娛樂方式,以及對可能事物的思考。

以下是 AI 領域 14 項入選發明的簡介:

1. 跳出框框自由編輯:Adobe Photoshop Generative Expand 和 Generative Fill

Adobe 通過在全球最受歡迎的圖像編輯器 Photoshop 中內置人工智慧技術,讓數百萬人掌握了強大的 AI 功能。 在 Adobe 的 AI 圖像產生器 Firefly 的支援下,Photoshop 現在包含了“生成擴展”(Generative Expand)和“生成填充”(Generative Fill)功能。 前者允許使用者在照片的邊界之外無縫填充想像的內容。 後者只需輸入一些簡單的文字,就能在現有圖像中添加或刪除內容。 這兩種功能都不需要專業技術。 Adobe 數位媒體高級副總裁 Ashley Still 說:這些選項使「客戶能夠以想像的速度將他們的願景變為現實」。

2. 改變遊戲規則的聊天機器人:OpenAI GPT-4

OpenAI 的 GPT-4 自 3 月份發布以來已有 8 個月,而它仍然是公眾可以使用的最強大的聊天機器人。 其前身 ChatGPT 的表現僅優於 10% 參加律師資格考試的學生,而 GPT-4 的表現則超過了 90%。 它擅長語言推理,能把複雜的概念分解成簡單的語言,甚至能解釋一個笑話為什麼好笑。 今年 9 月,OpenAI 開始推出通過語音與模型互動以及使用圖像作為輸入的功能。 更新后的 GPT-4 V 在為視障人士提供工具的組織 Be My Eyes 中進行了測試,可以用自然語言口頭描述圖片內容。

3. 別出心裁的電影剪輯:Runway Gen-2

Runway 是一家由谷歌支援的初創公司,其視覺特效工具曾被用於製作奧斯卡獲獎影片《Everything Everywhere All At Once》中令人匪夷所思的畫面。 6 月,Runway 推出了 Gen-2 模型。 新版本允許任何人通過文字提示、圖片或其他視頻生成完整的視頻。 Runway 聯合創始人兼首席執行官 Cristóbal Valenzuela 將這項新技術比作 200 年前照相機的發明。 他說:「人工智慧是一種新型照相機,它將永遠重塑講故事的方式,並帶來完全生成的完整故事片。 ”

4. 人工智慧鑒定真偽:Alitheon FeaturePrint

解決價值數萬億美元的假冒商品問題的方法可能很簡單,只需將手機的攝像頭對準手錶或手錶或手錶包,然後讓智慧軟體確定其真偽即可。 FeaturePrint 是一種光學人工智慧技術,它首先能“看到”實物微小的表面細節,並將其“指紋化”為獨特的數學標識。 然後,只需點擊一下按鈕,它就能告訴你一件物品的真假。 Alitheon 首席執行官 Roei Ganzarski 說:“不需要貼紙、標籤或標記。 客戶之一是 Argor-Heraeus,該公司為各國銀行生產金條。 ”

5. 天空之眼:Dedrone 全城無人機探測

無人機既能帶來破壞,也能帶來益處。 Dedrone 的全城無人機探測產品可在某一地理區域周圍投擲虛擬防護罩,如果無人機進入指定空域,可在數秒內向執法部門發出警告。 Dedrone 跟蹤無人機發出的專有混合信號,包括無線電頻率、ADS-B 數據(也用於飛機)和 RemoteID 信標,以確定入侵位置。 公司首席行銷官 Mary-Lou Smulders 將其比作無人機的空中交通管制系統,這在此前所沒有的。 客戶包括 Con Edison,該公司正在用它來保護自己的基礎設施; 巴塞羅那的警察部隊; 以及數量不詳的機場。

6. 翻譯大師:Meta SeamlessM4T

Meta 公司將其 SeamlessM4 T 人工智慧模型比作《銀河系漫遊指南》中的萬能語言翻譯器巴別魚(Babel Fish)。 該公司的軟體能夠從語音或文本中理解近 100 種語言,並能以語音到語音、文本到文本、語音到文本或文本到語音等多種形式實時翻譯這些語言。 據 Meta 公司稱,除了可處理的語言遠多於前代產品外,該系統的效率更高,出錯率更低,甚至可以破譯同一句子中混合在一起的多種語言。 Meta 已將該模型開源,這意味著全世界的研究人員都可以使用其代碼。

7. 驚人的模仿:So-VITS-SVC

今年早些時候,一位名叫 Ghostwriter 的匿名創作者創作的一首名為《Heart on My Sleeve》的歌曲引起了轟動。 (這首歌很快就被合法的流媒體服務撤下,但在此之前,它已經成為了病毒式的傳播)。 這些聲音是通過名為 So-VITS-SVC 的開源軟體生成的,該軟體允許技術人員對歌手的聲音進行神經網路訓練,然後使用人工智慧生成的聲音製作任何歌曲。 愛好者們在 Discord 社區交換語音模型,從 Bad Bunny 到 Taylor Swift,再到 James Hatfield。 與此同時,採用該軟體的使用者友好型網站也如雨後春筍般湧現。

8. AI 消防員:California 和 Cal Fire AI 野火探測器

在野火蔓延之前對其進行檢測是目前困擾世界許多地區的一項挑戰。 加州大學聖迭戈分校的公共安全專案 California 正在利用人工智慧提供説明。 該專案與加州消防局(Cal Fire)合作,訓練人工智慧從遍佈全州森林的 1050 多個攝像頭網路中檢測煙霧和其他早期火災跡象。 系統一旦發現異常,就會通過簡訊向當地消防部門發出警報。 在最初的兩個月里,該系統在接到任何報警電話之前就正確識別出了 77 起火災。 California 的聯合首席調查員 Falco Kuester 說:“這個(系統)最大的成功案例就是那些你從未聽說過的火災。 ”

9. 輕鬆創建音樂:Stable Audio

Stable Audio 由 Stability AI 公司創建,它利用人工智慧的生成能力,只需幾個簡單的文字提示,就能生成幾乎任何你想要的聲音或歌曲。 (例如,輸入 “ambient techno, drum machine, peaceful, instrumental”,就能生成一首輕鬆的新時代音樂,放在時髦的休息室里也毫不突兀)。 該模型是在一個庫存音訊網站的數據集上訓練出來的(所以都是合法的),其中包含80多萬個音訊檔,總計2萬小時,可用於專業和業餘專案。

10. 動物保護者:TrailGuard AI

在印度和非洲的部分地區,偷獵仍然是大象和大型貓科動物滅絕的最大威脅,即使在保護區內也是如此。 美國環保組織 Resolve 創建的人工智慧蹤跡保護系統(TrailGuard AI)利用英特爾(Intel)技術驅動的微型攝像頭來監控瀕危物種和發現偷獵者。 該系統利用手機或遠距離無線電信號,在短短 30 秒內就能將圖像傳送到當局的手機上。 TrailGuard 定製的人工智慧模型經過訓練后,不僅能偵測人類,還能偵測從老虎到鬣狗等任何感興趣的物種。 該技術在東非的測試階段逮捕了 30 多名偷獵者,目前正在老虎密集的印度中部進行大規模測試。

11. 畫出你的想像:OpenAI Dall-E 3

當 OpenAI 在去年 11 月向全世界發佈 ChatGPT 時,它徹底改變了人工智慧的格局。 該公司希望 DALL-E 3(其人工智慧圖像產生器的全新改進版)也能產生同樣的影響。 DALL-E 3 的發明者、OpenAI 的 Aditya Ramesh 說,以前的圖像產生器需要學習一門新的技術語言,包括在字串中添加減號和數位,才能獲得最佳效果。 而 DALL-E 3 則不同,它可以摺疊到 ChatGPT 中,這樣使用者就可以輸入會話命令,獲得符合其描述的圖像。

12. 聽好了:古騰堡計劃開放式有聲讀物合集

古騰堡計劃(Project Gutenberg)是歷史最悠久的數位圖書館,成立於 1971 年,旨在讓人們更容易獲得電子圖書。 但首席執行官 Greg Newby 說,它“既不擅長創建,也不擅長傳播”。 因此,微軟和麻省理工學院聯手製作了“開放式有聲讀物合集”,利用文本到語音技術將 5000 本圖書轉化為免費的合成旁白有聲讀物,現在可在 Spotify 上下載。 推動該專案的軟體也免費發佈。

13. 節拍:AudioShake

當最偉大的搖滾樂隊之一最近達成協定,在廣告中使用其 1970 年代的熱門歌曲時,其成員欣喜若狂。 但有一個問題:廣告製作人只想要樂器,而樂隊擁有的只是最終的混音。 因此,搖滾樂隊的團隊聯繫了 AudioShake,該公司的人工智慧程式可以隔離預先錄製的音訊元素,將其分解為各個組成部分。 “我們使音頻具有交互性和可編輯性,並能夠推動這些真正實用的用途,幫助藝術家賺錢,”聯合創始人兼首席執行官 Jessica Powell 說。

14. 反思智能手機:Humane Ai Pin

創辦 Humane 的兩位前蘋果公司高管設想了一個無屏幕的未來,Ai Pin 就是他們邁出的第一步。 一旦輕巧的 Humane Ai Pin 通過磁力吸附在你的衣服上,它就會成為你的人工智慧個人助理。 該設備結合使用專有軟體和 OpenAI 的 GPT,讓您可以完成各種操作,從提出複雜的問題到撥打電話和發送簡訊,所有這些都只需你一聲令下即可完成。 同時,內置攝像頭可以識別事物並提供上下文資訊,例如食物的卡路里估值。 每當 Pin 的攝像頭、麥克風或輸入感測器處於激活狀態時,一個名為“信任燈”的顯著隱私指示燈就會亮起,以確保周圍的人都知道它在監聽或錄音。 如果你需要視覺效果,一個微型投影儀會將它們直接投射到你伸出的手掌上。 這款產品計劃於 11 月 9 日推出。

注:Humane 投資者包括《時代》週刊的聯合主席和擁有者 Marc Benioff 和 Lynne Benioff 夫婦

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)