Zuckerberg Memperkenalkan Jawaban Meta untuk ChatGPT, LLaMA, di Posting Facebook

Pindahkan ChatGPT dari OpenAI, Bard dari Google, dan Prometheus dari Microsoft—masih ada kecerdasan buatan bertenaga model bahasa besar lainnya di kota ini. Meta, perusahaan yang sebelumnya dikenal sebagai Facebook, hari ini memperkenalkan AI-nya sendiri, yang disebut LLaMA. Akronim mirip hewan ini bisa ditebak adalah singkatan dari Large Language Model Meta AI.

CEO Mark Zuckerberg menggambarkan kontribusi perusahaannya pada bidang teknologi AI yang menarik, apa lagi, selain postingan Facebook.

“Hari ini kami merilis model bahasa besar AI canggih baru yang disebut LLaMA yang dirancang untuk membantu para peneliti memajukan pekerjaan mereka,” tulis Zuckerberg di platform media sosialnya. Dia menambahkan bahwa “LLM telah menunjukkan banyak janji dalam menghasilkan teks, melakukan percakapan, meringkas materi tertulis, dan tugas yang lebih rumit seperti memecahkan teorema matematika atau memprediksi struktur protein.” Tetapi eksekutif Meta tidak menjelaskan dengan tepat tugas mana (jika ada) yang dapat diselesaikan LLaMA saat ini.

Faktanya, satu-satunya detail yang ditawarkan Zuckerberg pada model bahasa besar dalam pengumuman hari Jumat adalah bahwa perusahaannya “berkomitmen pada model penelitian terbuka ini dan kami akan membuat model baru kami tersedia untuk komunitas penelitian AI.”

Dalam posting blog perusahaan yang diterbitkan Jumat sore yang menyertakan tautan ke makalah penelitian lengkap tentang AI dan kartu model Github-nya, Meta menawarkan lebih banyak informasi secara signifikan. “Seperti model bahasa besar lainnya, LLaMA bekerja dengan mengambil urutan kata sebagai masukan dan memprediksi kata berikutnya untuk menghasilkan teks secara rekursif,” tulis perusahaan tersebut. Meta menambahkan bahwa LLaMA dilatih tentang teks dari 20 bahasa berbeda. Catatan kartu modelnya bahwa data pelatihan menyertakan teks yang tersedia untuk umum dari CCNet, C4, Wikipedia, ArXiv, dan pertukaran Stack.

Meta menggambarkan AI-nya sebagai “model dasar yang lebih kecil”, yang “membutuhkan daya dan sumber daya komputasi yang jauh lebih sedikit”, daripada model bahasa besar lainnya, dan mengatakan LLaMA akan tersedia dalam berbagai ukuran. Perusahaan lebih lanjut menekankan komitmennya terhadap transparansi dan pengembangan AI yang bertanggung jawab, dan menegaskan kembali bahwa hanya peneliti AI yang akan diberi akses.

“Untuk menjaga integritas dan mencegah penyalahgunaan, kami merilis model kami di bawah lisensi nonkomersial yang berfokus pada kasus penggunaan penelitian. Akses ke model akan diberikan berdasarkan kasus per kasus kepada peneliti akademis; mereka yang berafiliasi dengan organisasi di pemerintahan, masyarakat sipil, dan akademisi; dan laboratorium penelitian industri di seluruh dunia,” tulis perusahaan itu.

Sejauh ini, pada tahap penelitian ini, LLaMA belum dimasukkan ke dalam produk atau platform Meta mana pun (termasuk Instagram dan Facebook), kata juru bicara perusahaan kepada Gizmodo melalui email. Juru bicara lebih lanjut mencatat bahwa perusahaan tidak memiliki apa pun untuk dibagikan, saat ini, tentang pratinjau publik atau perluasan, akses publik.

Saat ini, sulit untuk mengatakan bagaimana LLaMA akan bersaing dengan upaya AI raksasa teknologi lainnya di bidang yang padat dengan cepat. Namun, hampir setiap peluncuran model bahasa besar baru-baru ini sejauh ini telah hadir dengan bagian snafusnya sendiri. Google dan Microsoft sama-sama mengintegrasikan generator teks-AI ke dalam platform pencarian mereka, dan keduanya tanpa sadar mengiklankan informasi yang tidak akurat. Lalu, ada pertanyaan yang belum terselesaikan tentang hak cipta, privasi, apakah AI dapat mengembangkan “perasaan” atau tidak, dan bagaimana mengelola solusi yang ditemukan banyak orang di internet untuk melewati batasan dan menghasilkan konten yang menyinggung atau bahkan malware.

Meta mengakui beberapa jebakan ini di postingan blognya. “Masih banyak penelitian yang perlu dilakukan untuk mengatasi risiko bias, komentar beracun, dan halusinasi dalam model bahasa besar. Seperti model lainnya, LLaMA berbagi tantangan ini,” tulis perusahaan itu. Namun tampaknya Meta yakin pendekatannya yang terbuka dan berorientasi penelitian adalah langkah maju untuk menyelesaikan banyak masalah AI yang sedang berlangsung.

Mereka yang ingin mengakses LLaMA sendiri dapat mendaftar melalui formulir permintaan ini.

Perbarui 2/24/2023, 14:16 ET: Posting ini telah diperbarui dengan informasi tambahan dari juru bicara Meta.

Perbarui 2/24/2023, 14:04 ET: Posting ini telah diperbarui dengan informasi dari blog perusahaan Meta.