Majalah Time menerbitkan daftar "Penemuan Terbaik 2023", dengan sekilas 14 proyek AI

Pada 24 Oktober, majalah Time merilis daftar "Penemuan Terbaik 2023", yang mencakup bidang-bidang utama seperti kecerdasan buatan, energi hijau, dan pembangunan berkelanjutan. Sebanyak 200 penemuan inovatif (dan 50 penemuan Penghargaan Khusus) dipilih untuk dipilih berdasarkan kecerdikan, efisiensi, dampak, dan banyak lagi, yang mengubah cara kita hidup, bekerja, bermain, dan berpikir tentang apa yang mungkin.

Berikut adalah ringkasan singkat dari 14 penemuan terpilih di bidang AI:

1. Pengeditan gratis out-of-the-box: Adobe Photoshop Generative Expand dan Generative Fill

Adobe menempatkan AI yang kuat di tangan jutaan orang dengan membangun kecerdasan buatan ke dalam Photoshop, editor gambar paling populer di dunia. Didukung oleh generator gambar AI Adobe Firefly, Photoshop sekarang menyertakan Generative Expand dan Generative Fill. Yang pertama memungkinkan pengguna untuk mengisi konten imajiner dengan mulus di luar batas foto. Yang terakhir hanya memasukkan beberapa kata sederhana untuk menambah atau menghapus konten dari gambar yang ada. Tidak ada fitur yang memerlukan keahlian teknis. Ashley Still, wakil presiden senior media digital di Adobe, mengatakan opsi ini memungkinkan "pelanggan untuk menghidupkan visi mereka lebih cepat daripada yang dapat mereka bayangkan."

2. Chatbot yang mengubah permainan: OpenAI GPT-4

GPT-4 OpenAI adalah 8 bulan sejak dirilis pada bulan Maret, dan itu masih merupakan chatbot paling kuat yang tersedia untuk umum. Pendahulunya, ChatGPT, berkinerja lebih baik dari 10% siswa yang mengikuti ujian, sementara GPT-4 berkinerja lebih dari 90%. Ini unggul dalam penalaran verbal, memecah konsep kompleks menjadi bahasa sederhana dan bahkan menjelaskan mengapa lelucon itu lucu. Pada bulan September, OpenAI mulai meluncurkan kemampuan untuk berinteraksi dengan model melalui suara dan menggunakan gambar sebagai input. GPT-4 V yang diperbarui diuji di Be My Eyes, sebuah organisasi yang menyediakan alat untuk tunanetra, untuk menggambarkan konten gambar secara verbal dalam bahasa alami.

3. Penyuntingan Film Inventif: Runway Gen-2

Runway adalah startup yang didukung Google yang alat efek visualnya telah digunakan untuk membuat gambar menakutkan dari film pemenang Oscar Everything Everywhere All At Once. Pada bulan Juni, Runway memperkenalkan model Gen-2. Versi baru memungkinkan siapa saja untuk menghasilkan video lengkap dari petunjuk teks, gambar, atau video lainnya. Co-founder dan CEO Runway Cristóbal Valenzuela menyamakan teknologi baru ini dengan penemuan kamera 200 tahun yang lalu. "AI adalah jenis kamera baru yang selamanya akan menemukan kembali cara cerita diceritakan dan mengarah pada film fitur lengkap yang dihasilkan sepenuhnya," katanya. "

4. Keaslian Kecerdasan Buatan: Alitheon FeaturePrint

Solusi untuk masalah barang palsu multi-triliun dolar bisa sesederhana mengarahkan kamera ponsel Anda ke jam tangan atau tas tangan dan membiarkan perangkat lunak pintar menentukan keasliannya. FeaturePrint adalah teknologi kecerdasan buatan optik yang pertama kali "melihat" detail permukaan kecil dari objek fisik dan "sidik jari" mereka menjadi pengidentifikasi matematika yang unik. Kemudian, dengan mengklik tombol, ini memberi tahu Anda keaslian suatu barang. Roei Ganzarski, CEO Alitheon, mengatakan: "Tidak perlu stiker, label atau tanda. Salah satu pelanggannya adalah Argor-Heraeus, yang memproduksi emas batangan untuk bank-bank di seluruh dunia. "

5. Mata di Langit: Deteksi Drone Seluruh Kota Dedrone

Drone dapat membawa kehancuran dan manfaat. Produk deteksi drone Dedrone di seluruh kota dapat melemparkan perisai virtual di sekitar wilayah geografis dan memperingatkan penegak hukum dalam hitungan detik jika drone memasuki wilayah udara yang ditentukan. Dedrone melacak sinyal campuran eksklusif yang dipancarkan oleh drone, termasuk frekuensi radio, data ADS-B (juga digunakan di pesawat terbang), dan suar RemoteID untuk menentukan lokasi intrusi. Mary-Lou Smulders, chief marketing officer perusahaan, menyamakannya dengan sistem kontrol lalu lintas udara untuk drone yang belum ada sebelumnya. Pelanggan termasuk Con Edison, yang menggunakannya untuk mengamankan infrastrukturnya; kepolisian di Barcelona; dan sejumlah bandara yang tidak diketahui.

6. Penerjemah ahli: Meta SeamlessM4T

Meta membandingkan model AI SeamlessM4 T dengan Babel Fish, penerjemah bahasa universal dalam The Hitchhiker's Guide to the Galaxy. Perangkat lunak perusahaan mampu memahami hampir 100 bahasa dari ucapan atau teks dan menerjemahkannya secara real time dalam berbagai format, termasuk ucapan ke ucapan, teks ke teks, ucapan ke teks, atau teks ke ucapan. Menurut Meta, selain menangani lebih banyak bahasa daripada pendahulunya, sistem ini lebih efisien, memiliki tingkat kesalahan yang lebih rendah, dan bahkan dapat menguraikan beberapa bahasa yang dicampur bersama dalam kalimat yang sama. Meta telah membuka sumber model tersebut, yang berarti kodenya tersedia untuk para peneliti di seluruh dunia.

7. Parodi luar biasa: So-VITS-SVC

Awal tahun ini, sebuah lagu berjudul "Heart on My Sleeve" oleh pencipta anonim bernama Ghostwriter menyebabkan kegemparan. (Lagu itu dengan cepat dihapus oleh layanan streaming legal, tetapi sebelum itu, lagu itu menjadi viral.) Suara ini dihasilkan melalui perangkat lunak sumber terbuka yang disebut So-VITS-SVC, yang memungkinkan teknisi untuk jaringan saraf melatih suara penyanyi dan kemudian membuat lagu apa pun menggunakan suara yang dihasilkan AI. Penggemar bertukar model suara di komunitas Discord, dari Bad Bunny hingga Taylor Swift hingga James Hatfield. Pada saat yang sama, situs web yang ramah pengguna yang mengadopsi perangkat lunak bermunculan.

8. Pemadam Kebakaran AI: California dan Cal Fire AI Wildfire Detector

Mendeteksi kebakaran hutan sebelum menyebar adalah tantangan yang saat ini melanda banyak bagian dunia. California, program keselamatan publik di University of California, San Diego, menggunakan kecerdasan buatan untuk membantu. Proyek ini, dalam kemitraan dengan Cal Fire, melatih AI untuk mendeteksi asap dan tanda-tanda awal kebakaran lainnya dari jaringan lebih dari 1.050 kamera yang tersebar di seluruh hutan di seluruh negara bagian. Segera setelah sistem mendeteksi kelainan, itu akan memberi tahu pemadam kebakaran setempat melalui SMS. Dalam dua bulan pertama, sistem mengidentifikasi 77 kebakaran dengan benar sebelum panggilan alarm diterima. Falco Kuester, co-principal investigator di California, mengatakan, "Kisah sukses terbesar [dari [sistem] ini adalah kebakaran yang belum pernah Anda dengar. "

9. Buat musik dengan mudah: Audio Stabil

Dibuat oleh Stability AI, Stable Audio memanfaatkan kekuatan kecerdasan buatan untuk menghasilkan hampir semua suara atau lagu yang Anda inginkan hanya dengan beberapa petunjuk teks sederhana. (Misalnya, mengetik "ambient techno, drum machine, peaceful, instrumental" menghasilkan musik new age yang santai yang tidak menonjol di lounge yang funky.) Model ini dilatih pada dataset (jadi semuanya sah) di situs audio inventaris yang berisi lebih dari 800.000 file audio dengan total 20.000 jam dan dapat digunakan untuk proyek profesional dan amatir.

10. Pembela Hewan: TrailGuard AI

Di India dan sebagian Afrika, perburuan liar tetap menjadi ancaman terbesar bagi kepunahan gajah dan kucing besar, bahkan di kawasan lindung. TrailGuard AI, yang dibuat oleh kelompok lingkungan AS Resolve, menggunakan kamera kecil yang didukung oleh teknologi Intel untuk memantau spesies yang terancam punah dan pemburu spot. Sistem ini menggunakan ponsel atau sinyal radio jarak jauh untuk mengirimkan gambar ke ponsel pihak berwenang hanya dalam 30 detik. Model AI TrailGuard yang dibuat khusus dilatih untuk mendeteksi tidak hanya manusia, tetapi juga spesies apa pun yang menarik, dari harimau hingga hyena. Teknologi tersebut, yang menangkap lebih dari 30 pemburu liar selama fase pengujian di Afrika Timur, saat ini sedang menjalani pengujian skala besar di India tengah yang padat harimau.

11. Gambar Imajinasi Anda: OpenAI Dall-E 3

Ketika OpenAI merilis ChatGPT ke dunia November lalu, OpenAI merevolusi lanskap AI. Perusahaan berharap bahwa DALL-E 3, versi baru dan lebih baik dari generator gambar bertenaga AI, akan memiliki dampak yang sama. Aditya Ramesh dari OpenAI, penemu DALL-E 3, mengatakan generator gambar sebelumnya perlu mempelajari bahasa teknis baru, termasuk menambahkan tanda dan angka minus ke string, untuk mendapatkan hasil terbaik. DALL-E 3, di sisi lain, runtuh ke ChatGPT sehingga pengguna dapat memasukkan perintah sesi dan mendapatkan gambar yang sesuai dengan deskripsinya.

12. Dengarkan: Project Gutenberg Buka Koleksi Buku Audio

Project Gutenberg adalah perpustakaan digital tertua, didirikan pada tahun 1971 untuk membuat e-book lebih mudah diakses. Tetapi CEO Greg Newby mengatakan itu "tidak pandai menciptakan atau menyebarkan." Akibatnya, Microsoft dan MIT telah bekerja sama untuk memproduksi Open Audiobook Collection, yang memanfaatkan teknologi text-to-speech untuk mengubah 5.000 buku menjadi buku audio narasi sintesis gratis, sekarang tersedia untuk diunduh di Spotify. Perangkat lunak yang memicu proyek ini juga dirilis secara gratis.

13. Ketukan: AudioShake

Para anggotanya sangat gembira ketika salah satu band rock terbesar baru-baru ini membuat kesepakatan untuk menggunakan hits tahun 1970-an mereka dalam iklan. Tapi ada tangkapan: produser iklan hanya menginginkan instrumen, dan semua yang dimiliki band adalah campuran akhir. Jadi tim band rock menghubungi AudioShake, sebuah perusahaan yang program AI-nya mengisolasi elemen audio yang direkam sebelumnya, memecahnya menjadi komponen individual. "Kami membuat audio interaktif dan dapat diedit, dan dapat mendorong penggunaan yang sangat praktis ini yang membantu seniman menghasilkan uang," kata Jessica Powell, salah satu pendiri dan CEO.

14. Memikirkan kembali smartphone: Humane Ai Pin

Dua mantan eksekutif Apple yang mendirikan Humane membayangkan masa depan tanpa layar, dan Ai Pin adalah langkah pertama mereka. Setelah Pin Humane Ai yang ringan secara magnetis menempel pada pakaian Anda, itu menjadi asisten pribadi AI Anda. Menggunakan kombinasi perangkat lunak berpemilik dan GPT OpenAI, perangkat ini memungkinkan Anda melakukan segalanya mulai dari mengajukan pertanyaan rumit hingga melakukan panggilan dan pesan teks, semuanya dengan satu pesanan. Pada saat yang sama, kamera built-in dapat mengidentifikasi berbagai hal dan memberikan informasi kontekstual, seperti perkiraan kalori untuk makanan. Setiap kali kamera, mikrofon, atau sensor input PIN aktif, indikator privasi terkemuka yang disebut Trust Light menyala untuk memastikan bahwa semua orang di sekitar tahu itu mendengarkan atau merekam. Jika Anda membutuhkan efek visual, proyektor pico akan memproyeksikannya langsung ke telapak tangan Anda yang terulur. Produk ini dijadwalkan akan diluncurkan pada 9 November.

  • Catatan: Investor manusiawi termasuk Marc Benioff dan Lynne Benioff, ketua bersama dan pemilik majalah Time *
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)