
Akankah Gemini dari Google mengganggu ruang AI?
Apa ceritanya
Google telah meluncurkan Gemini, model kecerdasan buatan (AI) tercanggih hingga saat ini, yang bertujuan untuk menyaingi GPT-4 OpenAI.
Sistem AI multimodal yang kuat ini dapat menghasilkan keluaran dalam berbagai format, termasuk gambar, video, dan audio.
Tersedia dalam tiga versi—Nano, Pro, dan Ultra—Gemini diharapkan merevolusi cara konsumen, pengembang, dan bisnis bekerja dengan AI.
Google mengklaim Gemini jauh lebih bertenaga dibandingkan GPT-4. Mari kita lihat bagaimana kedua model AI ini saling melengkapi.
2
Pertama, lihatlah tiga tingkatan Gemini
Ultra adalah "model terbesar dan paling mampu untuk tugas-tugas yang sangat kompleks." Pro adalah "model terbaik untuk melakukan penskalaan pada berbagai tugas" dan Nano untuk tugas pada perangkat.
Gemini Ultra dapat memahami dan membuat kode berkualitas tinggi dengan Python, Java, C++, dan Go.
Google mengklaim, Gemini Ultra unggul dalam beberapa tolok ukur pengkodean, termasuk HumanEval, standar industri untuk mengevaluasi kinerja pada tugas pengkodean dan Natural2Code, kumpulan data internal yang bersumber dari penulis, bukan dari web.
3
Gemini Ultra melampaui pakar manusia dalam beberapa parameter
Menurut Google, Gemini Ultra berkinerja lebih baik dalam tugas-tugas seperti memahami gambar, audio, video, dan matematika, melampaui standar saat ini dalam 30 dari 32 tolok ukur akademik yang banyak digunakan.
Salah satu tolok ukur yang menonjol di mana Google Gemini memimpin adalah MMLU (pemahaman bahasa multitask yang masif).
Ini menangani 57 topik, menguji pengetahuan dan pemecahan masalah seperti matematika, fisika, sejarah, hukum, kedokteran, dan etika.
Gemini mencapai 90%, melampaui pakar manusia, sementara GPT-4 mencetak 86,4% dalam tes yang sama.
4
GPT-4 vs Gemini Ultra: Kemampuan memahami teks
Gemini memimpin dalam tolok ukur Big-Bench Hard (penalaran multilangkah) dan DROP (pemahaman membaca), dengan skor masing-masing sebesar 83,6% dan 82,4%, sementara GPT-4 memperoleh skor 83,1% dan 80,9%.
Ia juga unggul dalam aritmatika dasar (GSM8K) dengan 94,4% dan matematika kompleks (MATH) dengan 53,2%, melampaui skor GPT-4 sebesar 92% dan 52,9% pada tes yang sama.
Namun, GPT-4 mencetak skor sebesar 95,3% di HellaSwag (penalaran masuk akal untuk tugas sehari-hari), mengalahkan Gemini yang hanya mendapat skor 87,8%.
5
GPT-4 vs Gemini Ultra: Kemampuan gambar, video, dan audio
Dalam penilaian multimodal, Gemini menunjukkan pemahaman gambar yang unggul, mengungguli GPT-4 di semua tolok ukur.
Dalam tugas video, Gemini menonjol dalam teks video berbahasa Inggris (VATEX) dan menjawab pertanyaan video (MCQA).
Untuk tolok ukur audio, Gemini unggul dalam terjemahan ucapan otomatis dengan skor 40,1 dibandingkan dengan GPT-4 yang meraih 29,1.
Namun, performanya tertinggal dalam pengenalan ucapan otomatis, dengan skor 7,6%, jauh lebih rendah dibandingkan GPT-4 yang meraih 17,6%.
6
Gemini Pro sekarang mendukung chatbot Google Bard AI
Mulai tanggal 6 Desember, Google meningkatkan Bard AI dengan versi Gemini Pro yang telah disempurnakan, yang menawarkan kemampuan penalaran, perencanaan, dan pemahaman tingkat lanjut.
Gemini Pro mengungguli GPT-3.5 dalam enam dari delapan tolok ukur, menjadikan Bard sebagai chatbot gratis yang lebih unggul dibandingkan alternatif terkemuka.
Google juga menghadirkan Gemini Nano ke Pixel 8 Pro.
Dalam beberapa bulan mendatang, Gemini akan tersedia di lebih dari 170 negara di seluruh produk dan layanan Google seperti Penelusuran, Iklan, Chrome, dan Duet AI.
7
Rilis Gemini Ultra
Dalam waktu dekat, Google berencana menggabungkan Gemini Ultra ke dalam versi Bard Advanced baru dan bereksperimen dengan Gemini dalam Penelusuran untuk meningkatkan kecepatan.
Mulai 13 Desember, pengembang dan pelanggan perusahaan dapat mengakses Gemini Pro melalui Gemini API di Google AI Studio atau Google Cloud Vertex AI.
Pengembang Android juga dapat membangun dengan Gemini Nano.