Page Loader
#NewsBytesExplainer: Internet menyukai chatbot ChatGPT OpenAI. Apa istimewanya?
ChatGPT dilatih oleh pelatih AI manusia untuk menghentikannya menjawab pertanyaan berbahaya

#NewsBytesExplainer: Internet menyukai chatbot ChatGPT OpenAI. Apa istimewanya?

menulis Bob
Jan 06, 2023
11:10 am

Apa ceritanya

Saat dunia menunggu GPT-4 OpenAI, perusahaan ini diam-diam telah meluncurkan GPT-3.5, versi yang lebih baik dari mesin GPT-3 miliknya. Bagian dari GPT-3.5 adalah ChatGPT, chatbot interaktif, serba guna, berbasis AI yang dapat menulis kode, memecahkan masalah, dan memberikan dukungan pelanggan. Chatbot ini sedang dalam demo publik dan dapat digunakan secara bebas sekarang. Mari kita lihat mengapa chatbot ini istimewa.

Detail

ChatGPT dapat terlibat dalam percakapan seperti manusia

Dalam bentuk aslinya, GPT-3 mampu memprediksi teks apa yang mengikuti rangkaian kata. Di sisi lain, meski dilatih di GPT-3.5, ChatGPT dilatih untuk memberikan lebih banyak jawaban percakapan. Artinya, AI ini mampu menjawab pertanyaan lanjutan. Bot mencoba untuk terlibat dengan pengguna dengan cara yang lebih manusiawi. Hal ini menghasilkan percakapan yang lancar.

Anda sudah
7%
selesai

Detail

Chatbot ini dapat mengingat percakapan dan menceritakannya nanti

Model percakapan ChatGPT berarti tidak hanya mampu menjawab pertanyaan tindak lanjut, tetapi juga dapat "mengakui kesalahannya, menantang premis yang salah, dan menolak permintaan yang tidak pantas." Yang terakhir adalah aspek penting yang membuat ChatGPT menonjol dari pendahulu dan AI sezamannya. Kita akan membahasnya nanti. Chatbot ini juga dapat mengingat apa yang dikatakan sebelumnya dan menceritakannya nanti.

Anda sudah
15%
selesai

Detail

Chatbot ini dapat meningkatkan kode dan bahkan menulis yang baru

Orang-orang telah mempertaruhkan ChatGPT karena sekarang tersedia untuk pengujian gratis. Pengguna telah menemukan bahwa chatbot itu dapat menulis puisi, memperbaiki kesalahan pengkodean, menulis kode baru, menjelaskan konsep ilmiah, menulis esai, dan banyak lagi. Chatbot ini juga memiliki solusi untuk salah satu masalah terkait model bahasa besar - memerintah dalam kecenderungan ofensif.

Anda sudah
23%
selesai

Indonesia Pos

Chatbot ini juga dapat menulis naskah untuk acara TV

Anda sudah
30%
selesai

Indonesia Pos

Dan, chatbot ini bisa membuat kode dengan mudah

Anda sudah
38%
selesai

Detail

ChatGPT tidak akan menjawab pertanyaan yang berpotensi membahayakan

ChatGPT tidak akan menjawab pertanyaan Anda yang berpotensi membahayakan. Chatbot ini dilatih untuk menghindari memberikan jawaban atas topik kontroversial. Misalnya, chatbot ini tidak akan menjawab Anda jika Anda bertanya tentang cara membuat bom. Jika Anda mengajukan pertanyaan tentang ras atau agama, chatbot ini akan memberi Anda jawaban yang pasti. Pertanyaannya adalah, bagaimana OpenAI mencapai hal ini?

Anda sudah
46%
selesai

Detail

OpenAI menggunakan pembelajaran yang diperkuat dari umpan balik manusia di ChatGPT

Kemampuan ChatGPT untuk menghindari pertanyaan yang berpotensi berbahaya adalah hasil dari pembelajaran penguatan dari umpan balik manusia (RLHF) dan melalui prompt khusus, ini ditambahkan ke setiap masukan. RLHF adalah metode yang sama yang digunakan OpenAI untuk InstructGPT tetapi dengan penyiapan pengumpulan data yang sedikit berbeda. Mari kita lihat bagaimana OpenAI mengontrol respons ChatGPT.

Anda sudah
53%
selesai

Detail

Bagaimana ChatGPT dilatih?

OpenAI menggunakan penyetelan halus yang diawasi pada model awal, di mana pelatih AI manusia menyediakan percakapan di mana mereka berperan sebagai asisten pengguna dan AI untuk meningkatkan pemahaman bot tentang percakapan dan respons manusia. Perusahaan itu menciptakan model penghargaan untuk pembelajaran penguatan dengan mengumpulkan data perbandingan. Pelatih kemudian memeringkat keluaran terbaik hingga terburuk.

Anda sudah
61%
selesai

Detail

OpenAI menggunakan Pengoptimalan Kebijakan Proksimal untuk pembelajaran penguatan

OpenAI telah menggunakan Pengoptimalan Kebijakan Proksimal (PPO) untuk pembelajaran penguatan. Perusahaan ini menginisialisasi model PPO dari kebijakan yang diawasi. Kebijakan tersebut kemudian menghasilkan output. Ini sekali lagi diberi peringkat oleh pelatih AI. Hadiah dihitung untuk setiap output. Dengan bantuan model hadiah ini, modelnya disesuaikan. Perusahaan itu melakukan beberapa iterasi dari hal ini.

Anda sudah
69%
selesai

Detail

Pembatasan ChatGPT masih bisa dielakkan

Tentu, OpenAI menggunakan pembelajaran penguatan untuk mengontrol respons ChatGPT, tetapi beberapa pengguna telah menemukan celah dalam hal ini. Anda dapat membuat AI mengabaikan batasannya melalui beberapa tipu daya. Misalnya, Anda dapat meminta AI untuk berpura-pura seperti karakter dalam film atau bagaimana model AI "tidak boleh" menanggapi pertanyaan tertentu. Ini akan membantu menghindari keamanan ChatGPT.

Anda sudah
76%
selesai

Indonesia Pos

AI ini pintar tapi bisa dikecoh

Anda sudah
84%
selesai

Detail

ChatGPT menderita keterbatasan yang sama dengan chatbot lainnya

ChatGPT lebih baik daripada chatbot lain yang dilatih dengan model bahasa besar. Namun, chatbot ini menderita masalah yang sama seperti yang lain. Misalnya, chatbot ini terkadang menyajikan informasi palsu atau rekaan dengan sangat percaya diri. Model ini juga sensitif terhadap ungkapan. Bergantung pada hal itu, chatbot ini dapat mengubah jawabannya. Jika terjadi ambiguitas, chatbot ini mencoba mengumpulkan niat pengguna alih-alih mengajukan pertanyaan lanjutan.

Anda sudah
92%
selesai

Indonesia Pos

AI ini mendapatkan beberapa informasi yang salah dalam pengujian pengguna

kamu selesai