Stabilitas AI Berusaha Unggul dengan Model AI Pembangkit Gambar Baru

Stability AI, perusahaan teknologi kecerdasan buatan (AI), telah meluncurkan model terbarunya untuk generasi gambar yang disebut Stable Cascade. Model ini dijanjikan akan lebih cepat dan lebih kuat daripada pendahulunya yang terkenal di industri, Stable Diffusion, yang menjadi dasar bagi banyak alat AI generasi teks ke gambar lainnya.

Stable Cascade mampu menghasilkan foto-foto dan memberikan variasi dari gambar yang sama, atau mencoba meningkatkan resolusi gambar yang sudah ada. Fitur pengeditan teks ke gambar lainnya meliputi inpainting dan outpainting, di mana model akan mengedit hanya bagian tertentu dari gambar, serta canny edge, di mana pengguna dapat membuat foto baru hanya dengan menggunakan garis tepi dari gambar yang sudah ada.

Model baru ini tersedia di GitHub untuk para peneliti namun tidak untuk penggunaan komersial, dan menawarkan lebih banyak opsi meskipun perusahaan seperti Google dan Apple juga merilis model generasi gambar mereka sendiri.

Berbeda dengan model flagship Stability AI, Stable Diffusion, Stable Cascade bukanlah satu model bahasa besar. Sebaliknya, model ini terdiri dari tiga model yang berbeda yang mengandalkan arsitektur Würstchen. Tahap pertama, tahap C, mengompresi teks permintaan menjadi laten (atau bagian kode yang lebih kecil) yang kemudian diteruskan ke tahap A dan B untuk didekodekan.

Pemecahan permintaan menjadi bagian-bagian yang lebih kecil mengompresi permintaan sehingga membutuhkan lebih sedikit memori (dan lebih sedikit waktu pelatihan pada GPU yang sulit ditemukan) dan berjalan lebih cepat, sambil memberikan performa yang lebih baik dalam “penyesuaian permintaan dan kualitas estetika”. Dibutuhkan sekitar 10 detik untuk membuat gambar dibandingkan dengan 22 detik untuk model SDXL yang digunakan saat ini.

Stability AI telah membantu mempopulerkan metode Stable Diffusion dan juga menjadi subjek beberapa gugatan hukum yang menuduh bahwa Stable Diffusion dilatih dengan menggunakan data berhak cipta tanpa izin dari pemegang hak. Gugatan di Inggris oleh Getty Images melawan Stability AI dijadwalkan akan diadili pada bulan Desember. Perusahaan ini mulai menawarkan lisensi komersial melalui langganan pada bulan Desember, yang menurut perusahaan diperlukan untuk mendanai penelitian mereka.

MEMBACA  Kamera keamanan baru dari Eufy mengambil rekaman berwarna penuh seperti siang hari bahkan di malam yang gelap.