ChatGPT Sedang Membaca Posting Anda Secara Online. Ini adalah Mimpi Buruk Privasi.

Foto: Ascannio (Shutterstock)

ChatGPT telah menggemparkan dunia. Dalam waktu dua bulan setelah dirilis, aplikasi ini mencapai 100 juta pengguna aktif, menjadikannya aplikasi konsumen dengan pertumbuhan tercepat yang pernah diluncurkan. Pengguna tertarik dengan kemampuan canggih alat tersebut – dan khawatir dengan potensinya untuk menyebabkan gangguan di berbagai sektor.

Implikasi yang jauh lebih sedikit dibahas adalah risiko privasi yang ditimbulkan ChatGPT bagi kita masing-masing. Baru kemarin, Google meluncurkan AI percakapannya sendiri yang disebut Bard, dan yang lainnya pasti akan mengikuti. Perusahaan teknologi yang mengerjakan AI telah memasuki perlombaan senjata dengan baik dan benar.

Masalahnya itu dipicu oleh data pribadi kita.

300 miliar kata. Berapa banyak milikmu?

ChatGPT didukung oleh model bahasa besar yang membutuhkan data dalam jumlah besar untuk berfungsi dan ditingkatkan. Semakin banyak data yang dilatih model, semakin baik dalam mendeteksi pola, mengantisipasi apa yang akan terjadi selanjutnya, dan menghasilkan teks yang masuk akal.

G/O Media dapat memperoleh komisi

OpenAI, perusahaan di belakang ChatGPT, memasukkan sekitar 300 miliar kata yang diambil secara sistematis dari internet: buku, artikel, situs web, dan postingan – termasuk informasi pribadi yang diperoleh tanpa persetujuan.

Jika Anda pernah menulis posting blog atau ulasan produk, atau mengomentari artikel online, ada kemungkinan besar informasi ini dikonsumsi oleh ChatGPT.

Jadi mengapa itu menjadi masalah?

Pengumpulan data yang digunakan untuk melatih ChatGPT bermasalah karena beberapa alasan.

Pertama, tidak ada dari kami yang ditanya apakah OpenAI dapat menggunakan data kami. Ini jelas merupakan pelanggaran privasi, terutama ketika data bersifat sensitif dan dapat digunakan untuk mengidentifikasi kami, anggota keluarga kami, atau lokasi kami.

Bahkan ketika data tersedia untuk umum, penggunaannya dapat melanggar apa yang kita sebut integritas tekstual. Ini adalah prinsip dasar dalam diskusi hukum tentang privasi. Ini mensyaratkan bahwa informasi individu tidak diungkapkan di luar konteks di mana informasi itu awalnya diproduksi.

Selain itu, OpenAI tidak menawarkan prosedur bagi individu untuk memeriksa apakah perusahaan menyimpan informasi pribadi mereka, atau memintanya dihapus. Ini adalah hak yang dijamin sesuai dengan Peraturan Perlindungan Data Umum Eropa (GDPR) – meskipun masih diperdebatkan apakah ChatGPT mematuhi persyaratan GDPR.

“Hak untuk dilupakan” ini sangat penting dalam kasus di mana informasinya tidak akurat atau menyesatkan, yang tampaknya sering terjadi pada ChatGPT.

Selain itu, data tergores yang dilatih oleh ChatGPT dapat menjadi hak milik atau hak cipta. Misalnya, ketika saya memintanya, alat tersebut menghasilkan beberapa paragraf pertama dari novel Peter Carey “Sejarah Sejati Kelly Gang” – sebuah teks berhak cipta.

ChatGPT tidak mempertimbangkan perlindungan hak cipta saat menghasilkan output. Siapa pun yang menggunakan output di tempat lain dapat secara tidak sengaja menjiplak.

Terakhir, OpenAI tidak membayar data yang diambilnya dari internet. Individu, pemilik situs web, dan perusahaan yang memproduksinya tidak diberi kompensasi. Ini sangat penting mengingat OpenAI baru-baru ini bernilai US$29 miliar, lebih dari dua kali lipat nilainya pada tahun 2021.

OpenAI juga baru saja mengumumkan ChatGPT Plus, paket berlangganan berbayar yang akan menawarkan pelanggan akses berkelanjutan ke alat tersebut, waktu respons lebih cepat, dan akses prioritas ke fitur baru. Rencana ini akan berkontribusi pada pendapatan yang diharapkan sebesar $1 miliar pada tahun 2024.

Semua ini tidak akan mungkin terjadi tanpa data – data kami – yang dikumpulkan dan digunakan tanpa izin kami.

Kebijakan privasi tipis ChatGPT

Risiko privasi lainnya melibatkan data yang diberikan ke ChatGPT dalam bentuk permintaan pengguna. Saat kami meminta alat untuk menjawab pertanyaan atau melakukan tugas, kami mungkin secara tidak sengaja menyerahkan informasi sensitif dan meletakkannya di domain publik.

Misalnya, seorang pengacara dapat meminta alat tersebut untuk meninjau draf perjanjian perceraian, atau seorang pemrogram dapat memintanya untuk memeriksa sepotong kode. Perjanjian dan kode, selain esai yang dihasilkan, sekarang menjadi bagian dari basis data ChatGPT. Ini berarti mereka dapat digunakan untuk melatih alat lebih lanjut, dan disertakan dalam tanggapan atas permintaan orang lain.

Di luar ini, OpenAI mengumpulkan berbagai informasi pengguna lainnya. Menurut kebijakan privasi perusahaan, itu mengumpulkan alamat IP pengguna, jenis dan pengaturan browser, dan data tentang interaksi pengguna dengan situs – termasuk jenis konten yang digunakan pengguna, fitur yang mereka gunakan, dan tindakan yang mereka ambil.

Itu juga mengumpulkan informasi tentang aktivitas penjelajahan pengguna dari waktu ke waktu dan di seluruh situs web. Yang mengkhawatirkan, OpenAI menyatakan dapat membagikan informasi pribadi pengguna dengan pihak ketiga yang tidak ditentukan, tanpa memberi tahu mereka, untuk memenuhi tujuan bisnis mereka.

Saatnya mengendalikan ChatGPT?

Beberapa ahli percaya bahwa ChatGPT adalah titik kritis untuk AI – sebuah realisasi dari perkembangan teknologi yang dapat merevolusi cara kita bekerja, belajar, menulis, dan bahkan berpikir. Terlepas dari potensi manfaatnya, kita harus ingat OpenAI adalah perusahaan swasta nirlaba yang kepentingan dan keharusan komersialnya tidak selalu sejalan dengan kebutuhan masyarakat yang lebih besar.

Risiko privasi yang melekat pada ChatGPT seharusnya menjadi peringatan. Dan sebagai konsumen dari semakin banyak teknologi AI, kita harus sangat berhati-hati tentang informasi apa yang kita bagikan dengan alat tersebut.

The Conversation menghubungi OpenAI untuk memberikan komentar.

Uri Gal, Profesor Sistem Informasi Bisnis, University of Sydney

Artikel ini diterbitkan ulang dari The Conversation di bawah lisensi Creative Commons. Baca artikel aslinya.