Alat AI Meta dapat memotong objek dari gambar: Begini caranya

menulis Bob

Apr 07, 2023

01:35 pm

Apa ceritanya

Bukankah kita semua memiliki satu gambar bagus yang tidak dapat diposting di mana pun karena ada sesuatu yang mengganggu di latar belakang? Nah, Meta punya solusi untuk masalah ini - SAM. SAM atau Segment Anything Model dapat memotong apa saja dari sebuah gambar. Perusahaan mengklaim model AI-nya dapat mempermudah segmentasi. Mereka juga telah merilis dataset kedok Segment Anything 1-Billion (SA-1B).

_Card_

Mengapa artikel ini penting?

Visi komputer adalah bidang AI yang berkembang pesat. Perusahaan seperti Google dan Amazon telah mengerjakan visi komputer untuk sementara waktu.

Segmentasi gambar adalah bagian integral dari teknologi dan algoritma visi komputer. Namun, membuat model segmentasi yang akurat untuk data tertentu berada di luar jangkauan sebagian besar peneliti AI karena kompleksitas yang terlibat.

Meta bertujuan untuk memecahkan masalah itu dengan SAM.

_Card_

Apa itu SAM?

SAM adalah model segmentasi umum. Ini adalah campuran dari segmentasi interaktif dan otomatis, dua pendekatan klasik untuk segmentasi.

Tujuan model ini adalah untuk mengurangi kebutuhan akan "keahlian pemodelan khusus tugas, komputasi pelatihan, dan anotasi data khusus".

SAM adalah model 'dapat diminta' yang cukup umum untuk mencakup berbagai tugas.

_Card_

SA-1B adalah kumpulan data segmentasi gambar terbesar di dunia

Sifat umum SAM berasal dari kumpulan data yang digunakan untuk melatihnya. SA-1B memiliki lebih dari 1,1 miliar kedok segmentasi (bagian tertentu dari gambar yang diisolasi dari yang lain), yakni 400 kali lebih banyak kedok daripada kumpulan data lain yang ada.

Besarnya kumpulan data memberi SAM kemampuan untuk menggeneralisasi gambar dan objek yang bukan bagian dari pelatihannya juga.

_Card_

SAM dapat diminta dengan berbagai cara

Dengan SAM, pengguna dapat mengelompokkan gambar dengan mengklik objek apa pun dalam gambar atau dengan "mengklik secara interaktif pada titik untuk menyertakan dan mengecualikan dari gambar," kata Meta.

Untuk meminta model ini untuk menyegmentasikan objek, pengguna juga dapat menggambar kotak pembatas. Jika ada ambiguitas, SAM dapat menampilkan beberapa kedok yang valid.

Kemampuan perintah teks belum dirilis.

_Card_

SAM akan cocok dengan model AI lainnya

SAM akan berguna di bidang apa pun yang membutuhkan pencarian dan segmentasi objek. Desainnya yang dapat diminta akan mempermudah penggunaan SAM dengan sistem AI lain yang lebih besar.

Salah satu kasus penggunaan yang ditunjukkan oleh Meta adalah AR/VR. SAM dapat menjadi bagian dari pandangan pengguna dan kemudian diangkat menjadi 3D.

Ini juga akan berguna untuk studi ilmiah dan pembuatan konten.