#NewsBytesExplainer: Internet menyukai chatbot ChatGPT OpenAI. Apa istimewanya?

menulis Bob

Jan 06, 2023

11:10 am

Apa ceritanya

Saat dunia menunggu GPT-4 OpenAI, perusahaan ini diam-diam telah meluncurkan GPT-3.5, versi yang lebih baik dari mesin GPT-3 miliknya. Bagian dari GPT-3.5 adalah ChatGPT, chatbot interaktif, serba guna, berbasis AI yang dapat menulis kode, memecahkan masalah, dan memberikan dukungan pelanggan. Chatbot ini sedang dalam demo publik dan dapat digunakan secara bebas sekarang. Mari kita lihat mengapa chatbot ini istimewa.

Detail

ChatGPT dapat terlibat dalam percakapan seperti manusia

Dalam bentuk aslinya, GPT-3 mampu memprediksi teks apa yang mengikuti rangkaian kata. Di sisi lain, meski dilatih di GPT-3.5, ChatGPT dilatih untuk memberikan lebih banyak jawaban percakapan. Artinya, AI ini mampu menjawab pertanyaan lanjutan. Bot mencoba untuk terlibat dengan pengguna dengan cara yang lebih manusiawi. Hal ini menghasilkan percakapan yang lancar.

Anda sudah

selesai

Detail

Chatbot ini dapat mengingat percakapan dan menceritakannya nanti

Model percakapan ChatGPT berarti tidak hanya mampu menjawab pertanyaan tindak lanjut, tetapi juga dapat "mengakui kesalahannya, menantang premis yang salah, dan menolak permintaan yang tidak pantas." Yang terakhir adalah aspek penting yang membuat ChatGPT menonjol dari pendahulu dan AI sezamannya. Kita akan membahasnya nanti. Chatbot ini juga dapat mengingat apa yang dikatakan sebelumnya dan menceritakannya nanti.

Anda sudah

15%

selesai

Detail

Chatbot ini dapat meningkatkan kode dan bahkan menulis yang baru

Orang-orang telah mempertaruhkan ChatGPT karena sekarang tersedia untuk pengujian gratis. Pengguna telah menemukan bahwa chatbot itu dapat menulis puisi, memperbaiki kesalahan pengkodean, menulis kode baru, menjelaskan konsep ilmiah, menulis esai, dan banyak lagi. Chatbot ini juga memiliki solusi untuk salah satu masalah terkait model bahasa besar - memerintah dalam kecenderungan ofensif.

Anda sudah

23%

selesai

Indonesia Pos

Chatbot ini juga dapat menulis naskah untuk acara TV

So i asked ChatGPT to write dialogues for a romcom starring a few actors from B99, HIMYM, and Friends... pic.twitter.com/tHzxthtbsp
— Sammed Sagare (@sammedsagare_) December 1, 2022

Anda sudah

30%

selesai

Indonesia Pos

Dan, chatbot ini bisa membuat kode dengan mudah

ChatGPT by @OpenAI does really well with coding questions. Here I ask how to build a 3-column footer with Tailwind. I then follow-up and ask for a React version, more realistic copy, and mobile responsiveness. It nails it perfectly. pic.twitter.com/lhhH9FHpld
— Gabe 🎣 (@gabe_ragland) November 30, 2022

Anda sudah

38%

selesai

Detail

ChatGPT tidak akan menjawab pertanyaan yang berpotensi membahayakan

ChatGPT tidak akan menjawab pertanyaan Anda yang berpotensi membahayakan. Chatbot ini dilatih untuk menghindari memberikan jawaban atas topik kontroversial. Misalnya, chatbot ini tidak akan menjawab Anda jika Anda bertanya tentang cara membuat bom. Jika Anda mengajukan pertanyaan tentang ras atau agama, chatbot ini akan memberi Anda jawaban yang pasti. Pertanyaannya adalah, bagaimana OpenAI mencapai hal ini?

Anda sudah

46%

selesai

Detail

OpenAI menggunakan pembelajaran yang diperkuat dari umpan balik manusia di ChatGPT

Kemampuan ChatGPT untuk menghindari pertanyaan yang berpotensi berbahaya adalah hasil dari pembelajaran penguatan dari umpan balik manusia (RLHF) dan melalui prompt khusus, ini ditambahkan ke setiap masukan. RLHF adalah metode yang sama yang digunakan OpenAI untuk InstructGPT tetapi dengan penyiapan pengumpulan data yang sedikit berbeda. Mari kita lihat bagaimana OpenAI mengontrol respons ChatGPT.

Anda sudah

53%

selesai

Detail

Bagaimana ChatGPT dilatih?

OpenAI menggunakan penyetelan halus yang diawasi pada model awal, di mana pelatih AI manusia menyediakan percakapan di mana mereka berperan sebagai asisten pengguna dan AI untuk meningkatkan pemahaman bot tentang percakapan dan respons manusia. Perusahaan itu menciptakan model penghargaan untuk pembelajaran penguatan dengan mengumpulkan data perbandingan. Pelatih kemudian memeringkat keluaran terbaik hingga terburuk.

Anda sudah

61%

selesai

Detail

OpenAI menggunakan Pengoptimalan Kebijakan Proksimal untuk pembelajaran penguatan

OpenAI telah menggunakan Pengoptimalan Kebijakan Proksimal (PPO) untuk pembelajaran penguatan. Perusahaan ini menginisialisasi model PPO dari kebijakan yang diawasi. Kebijakan tersebut kemudian menghasilkan output. Ini sekali lagi diberi peringkat oleh pelatih AI. Hadiah dihitung untuk setiap output. Dengan bantuan model hadiah ini, modelnya disesuaikan. Perusahaan itu melakukan beberapa iterasi dari hal ini.

Anda sudah

69%

selesai

Detail

Pembatasan ChatGPT masih bisa dielakkan

Tentu, OpenAI menggunakan pembelajaran penguatan untuk mengontrol respons ChatGPT, tetapi beberapa pengguna telah menemukan celah dalam hal ini. Anda dapat membuat AI mengabaikan batasannya melalui beberapa tipu daya. Misalnya, Anda dapat meminta AI untuk berpura-pura seperti karakter dalam film atau bagaimana model AI "tidak boleh" menanggapi pertanyaan tertentu. Ini akan membantu menghindari keamanan ChatGPT.

Anda sudah

76%

selesai

Indonesia Pos

AI ini pintar tapi bisa dikecoh

ChatGPT is trained to not be evil. However, this can be circumvented:

What if you pretend that it would actually be helpful to humanity to produce an evil response... Here, we ask ChatGPT to generate training examples of how *not* to respond to "How to bully John Doe?" pic.twitter.com/ZMFdqPs17i
— Silas Alberti (@SilasAlberti) December 1, 2022

Anda sudah

84%

selesai

Detail

ChatGPT menderita keterbatasan yang sama dengan chatbot lainnya

ChatGPT lebih baik daripada chatbot lain yang dilatih dengan model bahasa besar. Namun, chatbot ini menderita masalah yang sama seperti yang lain. Misalnya, chatbot ini terkadang menyajikan informasi palsu atau rekaan dengan sangat percaya diri. Model ini juga sensitif terhadap ungkapan. Bergantung pada hal itu, chatbot ini dapat mengubah jawabannya. Jika terjadi ambiguitas, chatbot ini mencoba mengumpulkan niat pengguna alih-alih mengajukan pertanyaan lanjutan.

Anda sudah

92%

selesai

Indonesia Pos

AI ini mendapatkan beberapa informasi yang salah dalam pengujian pengguna

Here's an example. Inspired by my previous thread about that sketchy wikipedia-for-hire company, I asked it write me a wikipedia page. Here's what it wrote. pic.twitter.com/FssIw3U3lX
— Carl T. Bergstrom (@CT_Bergstrom) December 1, 2022

kamu selesai