AI rekayasa wawancara fiktif antara Joe Rogan dan Steve Jobs

menulis Taufiq Al Jufri

Jan 06, 2023

11:10 am

Apa ceritanya

Joe Rogan akhirnya mendapat kesempatan untuk mewawancarai Steve Jobs. Tidak, Steve Jobs tidak bangkit dari kubur dan berbicara dengan Rogan. Rogan juga tidak menemukan cara untuk berkomunikasi dengan orang-orang yang sudah meninggal. Sebaliknya, pertemuan Rogan dan Jobs adalah rekayasa teknologi kecerdasan buatan. Podcast fiksi itu dikembangkan oleh perusahaan sintesis suara yang berbasis di Dubai.

Konteks

Mengapa artikel ini penting?

Setiap hari, kita mendengar hal baru mengenai kecerdasan buatan. Berkat inovasi tersebut, kesenjangan antara realitas dan AI berkurang setiap hari. Podcast Rogan dan Jobs adalah contoh hal-hal yang mampu dilakukan AI dengan sisa transkrip orang yang sudah meninggal. Rekayasa itu jauh dari kata sempurna, tetapi setelah melalui pengembangan, apa yang akan terjadi? Pertanyaan itu bisa kita jawab di lain waktu.

Podcast

Rogan menyebut Jobs 'kenangan dari masa lalu'

Episode pertama di Podcast.ai dimulai dengan Joe Rogan yang mengundang "temannya yang aneh dan cerdas." Dia menyebut tamunya "kenangan dari masa lalu." Kemudian, kita mendengar suara Steve Jobs. Percakapan lantas beralih ke masa-masa pendiri Apple itu berkuliah di Reed College, minatnya pada spiritualitas, dan agama Buddha. Kita pun mendengar Jobs berbicara dengan penuh semangat perihal reinkarnasi, Macintosh, LSD, dan topik-topik lainnya.

Rekayasa AI

Podcast Rogan dan Jobs dihasilkan alat pengubah teks menjadi suara

Kami tahu apa yang Anda pikirkan dan Anda benar. Podcast tersebut adalah Joe Rogan dan Steve Jobs palsu. Tetapi kalau Anda mendengarkan podcast-nya, sulit untuk mengetahuinya. Podcast.ai merupakan kreasi Play.ht, yang menjual layanan sintesis suara. Wawancara itu dibuat oleh alat pengubah teks menjadi suara yang berbasis AI. Perusahaan itu mengklaim, transkrip wawancara "dihasilkan dengan model bahasa yang telah disesuaikan."

Kualitas

Suara Steve Jobs terdengar kurang natural

Wawancara itu bukan tanpa kekurangan. Steve Jobs kerap terdengar seperti robot dan sebagian besar hal yang dia katakan tampaknya diambil dari wawancara lama. Itu tidak mengherankan, mengingat suara Jobs dihasilkan dari rekaman-rekamannya yang ditemukan di internet. Namun, terlepas dari kekurangannya, kesamaan suara yang dihasilkan AI dengan rekaman sebelumnya cukup mengesankan sekaligus menakutkan.

Model bahasa

AI meniru nada dan emosi secara otomatis

Play.ht menggunakan model bahasa berdasarkan konsep-konsep yang mirip seperti DALL-E dan GPT OpenAI. AI tersebut meniru nada dan emosi manusia secara otomatis. Syed Hammad, pendiri Play.ht, mengatakan bahwa suara Steve Jobs dihasilkan "hanya dengan beberapa menit pidatonya dari video-video di atas panggung atau wawancara dengan latar yang bising sehingga masih ada gangguan pada hasil akhirnya."