Alat AI Meta dapat memotong objek dari gambar: Begini caranya
Bukankah kita semua memiliki satu gambar bagus yang tidak dapat diposting di mana pun karena ada sesuatu yang mengganggu di latar belakang? Nah, Meta punya solusi untuk masalah ini - SAM. SAM atau Segment Anything Model dapat memotong apa saja dari sebuah gambar. Perusahaan mengklaim model AI-nya dapat mempermudah segmentasi. Mereka juga telah merilis dataset kedok Segment Anything 1-Billion (SA-1B).
Mengapa artikel ini penting?
Visi komputer adalah bidang AI yang berkembang pesat. Perusahaan seperti Google dan Amazon telah mengerjakan visi komputer untuk sementara waktu. Segmentasi gambar adalah bagian integral dari teknologi dan algoritma visi komputer. Namun, membuat model segmentasi yang akurat untuk data tertentu berada di luar jangkauan sebagian besar peneliti AI karena kompleksitas yang terlibat. Meta bertujuan untuk memecahkan masalah itu dengan SAM.
Apa itu SAM?
SAM adalah model segmentasi umum. Ini adalah campuran dari segmentasi interaktif dan otomatis, dua pendekatan klasik untuk segmentasi. Tujuan model ini adalah untuk mengurangi kebutuhan akan "keahlian pemodelan khusus tugas, komputasi pelatihan, dan anotasi data khusus". SAM adalah model 'dapat diminta' yang cukup umum untuk mencakup berbagai tugas.
SA-1B adalah kumpulan data segmentasi gambar terbesar di dunia
Sifat umum SAM berasal dari kumpulan data yang digunakan untuk melatihnya. SA-1B memiliki lebih dari 1,1 miliar kedok segmentasi (bagian tertentu dari gambar yang diisolasi dari yang lain), yakni 400 kali lebih banyak kedok daripada kumpulan data lain yang ada. Besarnya kumpulan data memberi SAM kemampuan untuk menggeneralisasi gambar dan objek yang bukan bagian dari pelatihannya juga.
SAM dapat diminta dengan berbagai cara
Dengan SAM, pengguna dapat mengelompokkan gambar dengan mengklik objek apa pun dalam gambar atau dengan "mengklik secara interaktif pada titik untuk menyertakan dan mengecualikan dari gambar," kata Meta. Untuk meminta model ini untuk menyegmentasikan objek, pengguna juga dapat menggambar kotak pembatas. Jika ada ambiguitas, SAM dapat menampilkan beberapa kedok yang valid. Kemampuan perintah teks belum dirilis.
SAM akan cocok dengan model AI lainnya
SAM akan berguna di bidang apa pun yang membutuhkan pencarian dan segmentasi objek. Desainnya yang dapat diminta akan mempermudah penggunaan SAM dengan sistem AI lain yang lebih besar. Salah satu kasus penggunaan yang ditunjukkan oleh Meta adalah AR/VR. SAM dapat menjadi bagian dari pandangan pengguna dan kemudian diangkat menjadi 3D. Ini juga akan berguna untuk studi ilmiah dan pembuatan konten.