Kumpulkan Semua Data dokumen di Internet
“Hal yang menarik adalah Pre-trained Generative Large Language Model dibangunnya secara unsupervised. Jadi ChatGPT itu mengumpulkan semua data dokumen yang ada di Internet, termasuk source code, yang kemudian digabungkan tanpa diberikan label. Semua data ini dimasukkan ke dalam algoritma deep learning yang disebut GPT,” pungkasnya.
ChatGPT menggunakan teknik generative, yang dibangun dari data triliunan kalimat yang kemudian dimasukkan ke dalam deep learning. Ketika kita memberikan input pertanyaan, maka ChatGPT akan memberikan jawaban yang sebenarnya merupakan hasil karangan yang di-generate per kata. Hanya saja karena sumber datanya yang sangat banyak, sehingga karangannya pun sebagian besar benar.
“Sehingga melalui penjelasan ini kita menjadi tahu konsekuensinya, untuk tidak terlalu percaya terhadap hasil dari ChatGPT,” ucap Dr. Ayu.
Ketika kalimat dari data yang sangat banyak itu masuk kedalam algoritma deep learning-nya, ChatGPT sama sekali tidak menyimpan pengetahuan. Yang dilakukan adalah mengatur bobot yang ada di deep learning-nya, sehingga sebenarnya di dalam modelnya tersebut secara implisit tersimpan hubungan antarkata.
Diketahui, ChatGPT telah memberikan kontribusi signifikan dalam memperluas penggunaan kecerdasan buatan dalam percakapan sehari-hari. Diharapkan, dengan kemajuan teknologi ini, kita dapat lebih bijak menyikapi pemanfaatan ChatGPT, serta konsekuensi yang mengiringinya.
Semoga bermanfaat!
Sumber: itb.ac.id
(***)