Tạp chí Time công bố danh sách "Những phát minh tốt nhất năm 2023", với 14 dự án AI trong nháy mắt

Ngày 24/10, tạp chí Time đã công bố danh sách "Những phát minh xuất sắc nhất năm 2023", bao gồm các lĩnh vực chính như trí tuệ nhân tạo, năng lượng xanh và phát triển bền vững. Tổng cộng có 200 phát minh đột phá (và 50 phát minh Giải thưởng Đặc biệt) đã được lựa chọn dựa trên sự khéo léo, hiệu quả, tác động và hơn thế nữa, đang thay đổi cách chúng ta sống, làm việc, vui chơi và suy nghĩ về những gì có thể.

Dưới đây là tóm tắt ngắn gọn về 14 phát minh được lựa chọn trong lĩnh vực AI:

**1. Chỉnh sửa miễn phí ngoài hộp: Adobe Photoshop Generative Expand và Generative Fill **

Adobe đặt AI mạnh mẽ vào tay hàng triệu người bằng cách xây dựng trí tuệ nhân tạo vào Photoshop, trình chỉnh sửa hình ảnh phổ biến nhất thế giới. Được hỗ trợ bởi trình tạo hình ảnh AI Firefly của Adobe, Photoshop hiện bao gồm Generative Expand và Generative Fill. Cái trước cho phép người dùng điền liền mạch nội dung tưởng tượng bên ngoài ranh giới của bức ảnh. Cái sau chỉ cần nhập một vài từ đơn giản để thêm hoặc xóa nội dung khỏi hình ảnh hiện có. Cả hai tính năng đều không yêu cầu chuyên môn kỹ thuật. Ashley Still, phó chủ tịch cấp cao về truyền thông kỹ thuật số tại Adobe, cho biết các tùy chọn này cho phép "khách hàng đưa tầm nhìn của họ vào cuộc sống nhanh hơn họ có thể tưởng tượng".

**2. Một chatbot thay đổi cuộc chơi: OpenAI GPT-4 **

GPT-4 của OpenAI đã được 8 tháng kể từ khi phát hành vào tháng 3 và nó vẫn là chatbot mạnh nhất có sẵn cho công chúng. Người tiền nhiệm của nó, ChatGPT, thực hiện tốt hơn 10% sinh viên tham gia kỳ thi thanh, trong khi GPT-4 thực hiện hơn 90%. Nó xuất sắc trong việc lý luận bằng lời nói, chia nhỏ các khái niệm phức tạp thành ngôn ngữ đơn giản và thậm chí giải thích lý do tại sao một trò đùa lại hài hước. Vào tháng Chín, OpenAI đã bắt đầu triển khai khả năng tương tác với các mô hình thông qua giọng nói và sử dụng hình ảnh làm đầu vào. GPT-4 V cập nhật đã được thử nghiệm trong Be My Eyes, một tổ chức cung cấp các công cụ cho người khiếm thị, để mô tả bằng lời nói nội dung hình ảnh bằng ngôn ngữ tự nhiên.

3. Biên tập phim sáng tạo: Runway Gen-2

Runway là một công ty khởi nghiệp được Google hậu thuẫn với các công cụ hiệu ứng hình ảnh đã được sử dụng để tạo ra những hình ảnh kỳ lạ của bộ phim đoạt giải Oscar Everything Everywhere All At Once. Vào tháng 6, Runway đã giới thiệu mẫu Gen-2. Phiên bản mới cho phép mọi người tạo video hoàn chỉnh từ lời nhắc văn bản, hình ảnh hoặc các video khác. Đồng sáng lập và Giám đốc điều hành Runway Cristóbal Valenzuela so sánh công nghệ mới với việc phát minh ra máy ảnh 200 năm trước. "AI là một loại máy ảnh mới sẽ mãi mãi phát minh lại cách kể chuyện và dẫn đến những bộ phim truyện hoàn chỉnh, được tạo ra đầy đủ", ông nói. "

4. Tính xác thực của trí tuệ nhân tạo: Alitheon FeaturePrint

Giải pháp cho vấn đề hàng giả trị giá hàng nghìn tỷ đô la có thể đơn giản như hướng camera điện thoại của bạn vào đồng hồ hoặc túi xách và để phần mềm thông minh xác định tính xác thực của nó. FeaturePrint là một công nghệ trí tuệ nhân tạo quang học đầu tiên "nhìn thấy" các chi tiết bề mặt nhỏ bé của một vật thể vật lý và "dấu vân tay" chúng thành các định danh toán học duy nhất. Sau đó, với một nút bấm, nó cho bạn biết tính xác thực của một mặt hàng. Roei Ganzarski, Giám đốc điều hành của Alitheon, cho biết: "Không cần nhãn dán, nhãn hoặc nhãn hiệu. Một trong những khách hàng là Argor-Heraeus, công ty sản xuất vàng miếng cho các ngân hàng trên toàn thế giới. "

**5. Mắt trên bầu trời: Phát hiện máy bay không người lái trên toàn thành phố Dedrone **

Máy bay không người lái có thể mang lại cả sự hủy diệt và lợi ích. Các sản phẩm phát hiện máy bay không người lái trên toàn thành phố của Dedrone có thể ném lá chắn ảo xung quanh một khu vực địa lý và cảnh báo cơ quan thực thi pháp luật trong vòng vài giây nếu máy bay không người lái đi vào không phận được chỉ định. Dedrone theo dõi các tín hiệu hỗn hợp độc quyền phát ra từ máy bay không người lái, bao gồm tần số vô tuyến, dữ liệu ADS-B (cũng được sử dụng trong máy bay) và đèn hiệu RemoteID để xác định vị trí xâm nhập. Mary-Lou Smulders, giám đốc tiếp thị của công ty, đã so sánh nó với một hệ thống kiểm soát không lưu cho máy bay không người lái chưa từng tồn tại trước đây. Khách hàng bao gồm Con Edison, công ty đang sử dụng nó để bảo vệ cơ sở hạ tầng của mình; lực lượng cảnh sát ở Barcelona; và một số lượng sân bay không xác định.

6. Dịch giả chính: Meta SeamlessM4T

Meta so sánh mô hình AI SeamlessM4 T của mình với Babel Fish, dịch giả ngôn ngữ phổ quát trong The Hitchhiker's Guide to the Galaxy. Phần mềm của công ty có khả năng hiểu gần 100 ngôn ngữ từ giọng nói hoặc văn bản và dịch chúng trong thời gian thực ở nhiều định dạng khác nhau, bao gồm chuyển giọng nói thành giọng nói, chuyển văn bản thành văn bản, chuyển lời nói thành văn bản hoặc chuyển văn bản thành giọng nói. Theo Meta, ngoài việc xử lý nhiều ngôn ngữ hơn so với người tiền nhiệm, hệ thống này hiệu quả hơn, có tỷ lệ lỗi thấp hơn và thậm chí có thể giải mã nhiều ngôn ngữ trộn lẫn với nhau trong cùng một câu. Meta đã mở nguồn mô hình, có nghĩa là mã của nó có sẵn cho các nhà nghiên cứu trên khắp thế giới.

**7. Nhại lại tuyệt vời: So-VITS-SVC **

Đầu năm nay, một bài hát có tên "Heart on My Sleeve" của một người sáng tạo ẩn danh có tên Ghostwriter đã gây xôn xao dư luận. (Bài hát nhanh chóng bị gỡ xuống bởi dịch vụ phát trực tuyến hợp pháp, nhưng trước đó, nó đã lan truyền.) Những âm thanh này được tạo ra thông qua phần mềm mã nguồn mở có tên So-VITS-SVC, cho phép các kỹ thuật viên đào tạo mạng thần kinh giọng hát của ca sĩ và sau đó tạo bất kỳ bài hát nào bằng giọng nói do AI tạo ra. Những người đam mê trao đổi người mẫu giọng nói trong cộng đồng Discord, từ Bad Bunny đến Taylor Swift đến James Hatfield. Đồng thời, các trang web thân thiện với người dùng áp dụng phần mềm đã mọc lên.

**8. Lính cứu hỏa AI: Đầu báo cháy rừng AI của California và Cal Fire **

Phát hiện cháy rừng trước khi chúng lan rộng là một thách thức hiện đang gây khó khăn cho nhiều nơi trên thế giới. California, một chương trình an toàn công cộng tại Đại học California, San Diego, đang sử dụng trí tuệ nhân tạo để giúp đỡ. Dự án, hợp tác với Cal Fire, đã đào tạo AI để phát hiện khói và các dấu hiệu cháy sớm khác từ một mạng lưới hơn 1,050 camera trải rộng khắp các khu rừng trên toàn tiểu bang. Ngay sau khi hệ thống phát hiện bất thường, nó sẽ cảnh báo cho sở cứu hỏa địa phương qua SMS. Trong hai tháng đầu tiên, hệ thống đã xác định chính xác 77 vụ cháy trước khi nhận được bất kỳ cuộc gọi báo động nào. Falco Kuester, đồng điều tra viên chính tại California, cho biết: "Những câu chuyện thành công lớn nhất [của [hệ thống] này là những vụ hỏa hoạn mà bạn chưa bao giờ nghe nói đến. "

9. Tạo nhạc dễ dàng: Âm thanh ổn định

Được tạo bởi Stability AI, Stable Audio khai thác sức mạnh của trí tuệ nhân tạo để tạo ra hầu hết mọi âm thanh hoặc bài hát bạn muốn chỉ với một vài lời nhắc văn bản đơn giản. (Ví dụ: gõ "ambient techno, drum machine, peaceful, instrumental" sẽ tạo ra một bản nhạc thời đại mới thư giãn không nổi bật trong một phòng khách sôi động.) Mô hình được đào tạo trên một tập dữ liệu (vì vậy tất cả đều hợp pháp) trên một trang web âm thanh kiểm kê chứa hơn 800.000 tệp âm thanh trong tổng số 20.000 giờ và có thể được sử dụng cho cả dự án chuyên nghiệp và nghiệp dư.

10. Người bảo vệ động vật: TrailGuard AI

Ở Ấn Độ và một phần của châu Phi, săn trộm vẫn là mối đe dọa lớn nhất đối với sự tuyệt chủng của voi và mèo lớn, ngay cả trong các khu vực được bảo vệ. TrailGuard AI, được tạo ra bởi nhóm môi trường Hoa Kỳ Resolve, sử dụng các camera nhỏ được hỗ trợ bởi công nghệ Intel để theo dõi các loài có nguy cơ tuyệt chủng và phát hiện những kẻ săn trộm. Hệ thống này sử dụng điện thoại di động hoặc tín hiệu vô tuyến tầm xa để truyền hình ảnh đến điện thoại của chính quyền chỉ trong 30 giây. Các mô hình AI được xây dựng tùy chỉnh của TrailGuard được đào tạo để phát hiện không chỉ con người, mà bất kỳ loài nào quan tâm, từ hổ đến linh cẩu. Công nghệ này, đã bắt giữ hơn 30 kẻ săn trộm trong giai đoạn thử nghiệm ở Đông Phi, hiện đang trải qua thử nghiệm quy mô lớn ở miền trung Ấn Độ.

**11. Vẽ trí tưởng tượng của bạn: OpenAI Dall-E 3 **

Khi OpenAI phát hành ChatGPT ra thế giới vào tháng 11 năm ngoái, nó đã cách mạng hóa cảnh quan AI. Công ty hy vọng rằng DALL-E 3, một phiên bản mới và cải tiến của trình tạo hình ảnh hỗ trợ AI, sẽ có tác động tương tự. Aditya Ramesh của OpenAI, người phát minh ra DALL-E 3, cho biết các trình tạo hình ảnh trước đây cần phải học một ngôn ngữ kỹ thuật mới, bao gồm thêm dấu trừ và số vào chuỗi, để có được kết quả tốt nhất. Mặt khác, DALL-E 3 thu gọn vào ChatGPT để người dùng có thể nhập các lệnh phiên và nhận được hình ảnh phù hợp với mô tả của nó.

**12. Nghe: Bộ sưu tập sách nói mở của Project Gutenberg **

Dự án Gutenberg là thư viện kỹ thuật số lâu đời nhất, được thành lập vào năm 1971 để làm cho sách điện tử dễ tiếp cận hơn. Nhưng Giám đốc điều hành Greg Newby nói rằng nó "không tốt trong việc tạo ra cũng như lan truyền". Do đó, Microsoft và MIT đã hợp tác để sản xuất Bộ sưu tập sách nói mở, sử dụng công nghệ chuyển văn bản thành giọng nói để biến 5.000 cuốn sách thành sách nói tường thuật tổng hợp miễn phí, hiện có sẵn để tải xuống trên Spotify. Phần mềm thúc đẩy dự án cũng được phát hành miễn phí.

**13. Beat: AudioShake **

Các thành viên của nó đã ngây ngất khi một trong những ban nhạc rock vĩ đại nhất gần đây đã đạt được thỏa thuận sử dụng các bản hit những năm 1970 của họ trong quảng cáo. Nhưng có một nhược điểm: các nhà sản xuất quảng cáo chỉ muốn các nhạc cụ, và tất cả những gì ban nhạc có là bản phối cuối cùng. Vì vậy, nhóm của ban nhạc rock đã liên hệ với AudioShake, một công ty có chương trình AI cô lập các yếu tố âm thanh được ghi sẵn, chia nhỏ chúng thành các thành phần riêng lẻ. "Chúng tôi làm cho âm thanh tương tác và có thể chỉnh sửa, và có thể thúc đẩy những ứng dụng thực sự thiết thực này giúp các nghệ sĩ kiếm tiền", Jessica Powell, đồng sáng lập và CEO cho biết.

14. Suy nghĩ lại về điện thoại thông minh: Humane Ai Pin

Hai cựu giám đốc điều hành của Apple, những người sáng lập Humane đã hình dung ra một tương lai không màn hình và Ai Pin là bước đầu tiên của họ. Khi Humane Ai Pin nhẹ gắn từ tính vào quần áo của bạn, nó sẽ trở thành trợ lý cá nhân AI của bạn. Sử dụng kết hợp phần mềm độc quyền và GPT của OpenAI, thiết bị cho phép bạn làm mọi thứ từ đặt câu hỏi phức tạp đến thực hiện cuộc gọi và tin nhắn văn bản, tất cả chỉ với một đơn đặt hàng duy nhất. Đồng thời, camera tích hợp có thể xác định mọi thứ và cung cấp thông tin theo ngữ cảnh, chẳng hạn như ước tính calo cho thực phẩm. Bất cứ khi nào máy ảnh, micrô hoặc cảm biến đầu vào của mã PIN đang hoạt động, một chỉ báo bảo mật nổi bật được gọi là Trust Light sẽ sáng lên để đảm bảo rằng mọi người xung quanh đều biết nó đang nghe hoặc ghi âm. Nếu bạn cần hiệu ứng hình ảnh, máy chiếu pico sẽ chiếu chúng trực tiếp lên lòng bàn tay dang rộng của bạn. Sản phẩm dự kiến ra mắt vào ngày 9/11.

*Lưu ý: Các nhà đầu tư nhân đạo bao gồm Marc Benioff và Lynne Benioff, đồng chủ tịch và chủ sở hữu của tạp chí Time *

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
Không có bình luận
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)