Meta memiliki beberapa ambisi AI yang besar, meskipun tampaknya sudah lama mengejar OpenAI, Microsoft, dan bahkan Google. Untuk membuat sedikit percikan, pada hari Rabu perusahaan memamerkan Model Apapun Segmen berbasis AI baru yang secara mengejutkan mampu mengidentifikasi dan memisahkan objek tertentu dalam gambar dan video. Inilah penendangnya, Meta merilisnya kepada siapa saja dengan membuat perangkat lunak barunya menjadi open source.
Menghasilkan Video Melalui Teks? | Teknologi Masa Depan
Ada beberapa aplikasi bagus untuk menghapus objek yang tidak diinginkan dari gambar, dan semuanya sudah menggunakan model AI untuk menemukan dan mengganti objek di foto. Dalam pengujian demo Segmen Apa Pun saya sendiri, Meta telah melangkah lebih jauh dengan penawarannya sendiri. Sistem demo menawarkan semacam alat ‘Magic Wand’ Photoshop pada steroid. Saya mencobanya menggunakan beberapa gambar yang ramai, seperti foto set Rivendell Lego yang sangat besar. Tidak hanya secara kolektif menebak bahwa saya mencoba untuk memilih minifig tertentu dari latar belakang, tetapi ketika mengambil beberapa piksel yang tidak patuh, saya dengan cepat dapat mengatakannya untuk menghapus apa pun yang bukan karakter Lord of the Rings hanya dengan satu klik.
Setelah menghitung gambar baru, sistem melakukan pekerjaan yang solid dengan menyorot berbagai objek dalam sebuah foto. Dalam gambaran diri saya duduk di kursi pijat yang sangat terbatas, itu dapat mengidentifikasi saya, kursi, dan bahkan janggut saya satu per satu. Tentu saja, Meta tidak sendirian membuat algoritme pembelajaran mesin untuk mengidentifikasi aspek gambar. Apple telah berbicara tentang teknologi segmentasi gambar AI sejak 2021.
Tapi yang membedakan Meta adalah fungsi dan kegunaannya. Dalam pengujian saya sendiri, saya menemukan SAM bahkan lebih baik dalam memilih objek kecil dari foto yang ramai daripada Penghapus Ajaib Google atau alat online gratis Inpaint, meskipun tidak ada fungsi untuk menghapus aspek foto dan mengganti latar belakangnya.
G/O Media dapat memperoleh komisi
Meta mengatakan SAM mampu mengeluarkan banyak topeng bahkan ketika ada “ambiguitas” tentang objek tersebut. Meski begitu, perusahaan menggambarkan ini hanya sebagai “model dasar” yang berguna untuk segmentasi gambar, baik interaktif maupun otomatis. Sistem ini digambarkan sebagai “dapat diminta” yang berarti dapat menerima input seperti tatapan pengguna di headset VR atau melalui klik dan bahkan teks.
Mungkin yang paling mengejutkan dari Meta, adalah ia merilis SAM di bawah lisensi terbuka, dan selanjutnya memberikan detail lengkap tentang kumpulan data topeng 1 miliar, yang diklaim perusahaan sebagai “kumpulan data segmentasi terbesar yang pernah ada”. SA-1B ini adalah kumpulan data segmentasi semantik yang mengklasifikasikan setiap piksel dalam gambar, membuatnya lebih mudah untuk mengatur gaya atau menghapus objek dari foto. Menurut Meta, sistemnya sendiri dilatih pada 11 juta gambar dengan rata-rata 100 topeng per gambar.
Menurut makalah penelitian Meta tentang SAM, kumpulan data tersebut menggunakan gambar “dari penyedia yang bekerja langsung dengan fotografer”, meskipun tidak disebutkan penyedia mana itu. Beberapa dari gambar-gambar yang dilatih oleh sistem itu termasuk wajah dan pelat nomor, meskipun surat kabar itu mengatakan Meta mengaburkannya ketika merilis kumpulan data.
Sangat menyenangkan melihat Meta bersedia untuk membuka sumber salah satu model dan datanya, meskipun tidak seperti kita mengharapkan lebih banyak barang gratis. Meta baru-baru ini melakukan pivot keras ke AI, sedemikian rupa sehingga kepala divisi metaverse perusahaan Andrew Bosworth dan eksekutif lainnya membicarakan bagaimana perusahaan berencana menggunakan AI generatif untuk membuat iklan bersama produk sisi komersial lainnya. Perusahaan masih berupaya membuat rilis publik untuk pesaing ChatGPT bernama LLaMA, meskipun sudah bocor secara online.
Tentu, SAM dapat digunakan baik dalam kemampuan AR atau VR untuk mengidentifikasi objek dengan pandangan pengguna, sesuatu yang cukup penting untuk ambisi Meta untuk headset dan kacamata AR-nya. Masih banyak ruang untuk penyalahgunaan. Sistem deteksi AI DeepMind Google telah terbukti efektif dalam mengidentifikasi sel kanker, tetapi sistem serupa telah digunakan untuk pengenalan wajah. ACLU baru-baru ini mengungkapkan bahwa FBI telah menguji perangkat lunak pengenal wajah pada warga AS selama bertahun-tahun. Karena teknologi ini semakin canggih, AS sangat membutuhkan larangan wajah dan biometrik federal atau setidaknya lebih banyak regulasi.
Ingin tahu lebih banyak tentang AI, chatbots, dan masa depan pembelajaran mesin? Lihat liputan lengkap kami tentang kecerdasan buatan, atau telusuri panduan kami untuk Generator Seni AI Gratis Terbaik, Alternatif ChatGPT Terbaik, dan Semua yang Kami Ketahui Tentang ChatGPT OpenAI.