#NewsBytesExplainer: Internet menyukai chatbot ChatGPT OpenAI. Apa istimewanya?
Apa ceritanya
Saat dunia menunggu GPT-4 OpenAI, perusahaan ini diam-diam telah meluncurkan GPT-3.5, versi yang lebih baik dari mesin GPT-3 miliknya.
Bagian dari GPT-3.5 adalah ChatGPT, chatbot interaktif, serba guna, berbasis AI yang dapat menulis kode, memecahkan masalah, dan memberikan dukungan pelanggan.
Chatbot ini sedang dalam demo publik dan dapat digunakan secara bebas sekarang. Mari kita lihat mengapa chatbot ini istimewa.
Detail
ChatGPT dapat terlibat dalam percakapan seperti manusia
Dalam bentuk aslinya, GPT-3 mampu memprediksi teks apa yang mengikuti rangkaian kata. Di sisi lain, meski dilatih di GPT-3.5, ChatGPT dilatih untuk memberikan lebih banyak jawaban percakapan.
Artinya, AI ini mampu menjawab pertanyaan lanjutan. Bot mencoba untuk terlibat dengan pengguna dengan cara yang lebih manusiawi.
Hal ini menghasilkan percakapan yang lancar.
Detail
Chatbot ini dapat mengingat percakapan dan menceritakannya nanti
Model percakapan ChatGPT berarti tidak hanya mampu menjawab pertanyaan tindak lanjut, tetapi juga dapat "mengakui kesalahannya, menantang premis yang salah, dan menolak permintaan yang tidak pantas." Yang terakhir adalah aspek penting yang membuat ChatGPT menonjol dari pendahulu dan AI sezamannya.
Kita akan membahasnya nanti. Chatbot ini juga dapat mengingat apa yang dikatakan sebelumnya dan menceritakannya nanti.
Detail
Chatbot ini dapat meningkatkan kode dan bahkan menulis yang baru
Orang-orang telah mempertaruhkan ChatGPT karena sekarang tersedia untuk pengujian gratis. Pengguna telah menemukan bahwa chatbot itu dapat menulis puisi, memperbaiki kesalahan pengkodean, menulis kode baru, menjelaskan konsep ilmiah, menulis esai, dan banyak lagi.
Chatbot ini juga memiliki solusi untuk salah satu masalah terkait model bahasa besar - memerintah dalam kecenderungan ofensif.
Indonesia Pos
Chatbot ini juga dapat menulis naskah untuk acara TV
So i asked ChatGPT to write dialogues for a romcom starring a few actors from B99, HIMYM, and Friends... pic.twitter.com/tHzxthtbsp
— Sammed Sagare (@sammedsagare_) December 1, 2022
Indonesia Pos
Dan, chatbot ini bisa membuat kode dengan mudah
ChatGPT by @OpenAI does really well with coding questions. Here I ask how to build a 3-column footer with Tailwind. I then follow-up and ask for a React version, more realistic copy, and mobile responsiveness. It nails it perfectly. pic.twitter.com/lhhH9FHpld
— Gabe 🎣 (@gabe_ragland) November 30, 2022
Detail
ChatGPT tidak akan menjawab pertanyaan yang berpotensi membahayakan
ChatGPT tidak akan menjawab pertanyaan Anda yang berpotensi membahayakan. Chatbot ini dilatih untuk menghindari memberikan jawaban atas topik kontroversial.
Misalnya, chatbot ini tidak akan menjawab Anda jika Anda bertanya tentang cara membuat bom. Jika Anda mengajukan pertanyaan tentang ras atau agama, chatbot ini akan memberi Anda jawaban yang pasti.
Pertanyaannya adalah, bagaimana OpenAI mencapai hal ini?
Detail
OpenAI menggunakan pembelajaran yang diperkuat dari umpan balik manusia di ChatGPT
Kemampuan ChatGPT untuk menghindari pertanyaan yang berpotensi berbahaya adalah hasil dari pembelajaran penguatan dari umpan balik manusia (RLHF) dan melalui prompt khusus, ini ditambahkan ke setiap masukan.
RLHF adalah metode yang sama yang digunakan OpenAI untuk InstructGPT tetapi dengan penyiapan pengumpulan data yang sedikit berbeda. Mari kita lihat bagaimana OpenAI mengontrol respons ChatGPT.
Detail
Bagaimana ChatGPT dilatih?
OpenAI menggunakan penyetelan halus yang diawasi pada model awal, di mana pelatih AI manusia menyediakan percakapan di mana mereka berperan sebagai asisten pengguna dan AI untuk meningkatkan pemahaman bot tentang percakapan dan respons manusia.
Perusahaan itu menciptakan model penghargaan untuk pembelajaran penguatan dengan mengumpulkan data perbandingan. Pelatih kemudian memeringkat keluaran terbaik hingga terburuk.
Detail
OpenAI menggunakan Pengoptimalan Kebijakan Proksimal untuk pembelajaran penguatan
OpenAI telah menggunakan Pengoptimalan Kebijakan Proksimal (PPO) untuk pembelajaran penguatan. Perusahaan ini menginisialisasi model PPO dari kebijakan yang diawasi.
Kebijakan tersebut kemudian menghasilkan output. Ini sekali lagi diberi peringkat oleh pelatih AI. Hadiah dihitung untuk setiap output.
Dengan bantuan model hadiah ini, modelnya disesuaikan. Perusahaan itu melakukan beberapa iterasi dari hal ini.
Detail
Pembatasan ChatGPT masih bisa dielakkan
Tentu, OpenAI menggunakan pembelajaran penguatan untuk mengontrol respons ChatGPT, tetapi beberapa pengguna telah menemukan celah dalam hal ini. Anda dapat membuat AI mengabaikan batasannya melalui beberapa tipu daya.
Misalnya, Anda dapat meminta AI untuk berpura-pura seperti karakter dalam film atau bagaimana model AI "tidak boleh" menanggapi pertanyaan tertentu. Ini akan membantu menghindari keamanan ChatGPT.
Indonesia Pos
AI ini pintar tapi bisa dikecoh
ChatGPT is trained to not be evil. However, this can be circumvented:
— Silas Alberti (@SilasAlberti) December 1, 2022
What if you pretend that it would actually be helpful to humanity to produce an evil response... Here, we ask ChatGPT to generate training examples of how *not* to respond to "How to bully John Doe?" pic.twitter.com/ZMFdqPs17i
Detail
ChatGPT menderita keterbatasan yang sama dengan chatbot lainnya
ChatGPT lebih baik daripada chatbot lain yang dilatih dengan model bahasa besar. Namun, chatbot ini menderita masalah yang sama seperti yang lain.
Misalnya, chatbot ini terkadang menyajikan informasi palsu atau rekaan dengan sangat percaya diri. Model ini juga sensitif terhadap ungkapan. Bergantung pada hal itu, chatbot ini dapat mengubah jawabannya.
Jika terjadi ambiguitas, chatbot ini mencoba mengumpulkan niat pengguna alih-alih mengajukan pertanyaan lanjutan.
Indonesia Pos
AI ini mendapatkan beberapa informasi yang salah dalam pengujian pengguna
Here's an example. Inspired by my previous thread about that sketchy wikipedia-for-hire company, I asked it write me a wikipedia page. Here's what it wrote. pic.twitter.com/FssIw3U3lX
— Carl T. Bergstrom (@CT_Bergstrom) December 1, 2022