Pendekatan Red Hat terhadap kecerdasan buatan sumber terbuka: Pragmatisme lebih dari mimpi utopia

Open-source AI sedang mengubah segalanya yang orang pikirkan tentang kecerdasan buatan. Cukup lihat DeepSeek, program open-source asal China yang meledakkan pintu keuangan industri AI. Red Hat, perusahaan Linux terkemuka di dunia, memahami kekuatan open source dan AI lebih baik dari kebanyakan.

Pendekatan pragmatis Red Hat terhadap open-source AI mencerminkan komitmen mereka selama beberapa dekade terhadap prinsip open source sambil berurusan dengan kompleksitas unik dari sistem AI modern. Alih-alih mengejar mimpi kecerdasan buatan umum (AGI), Red Hat seimbang dengan kebutuhan praktis perusahaan dengan apa yang dapat disampaikan AI hari ini.

Juga: Mistral AI mengatakan model Small 3-nya adalah alternatif lokal, open-source untuk mini GPT-4o

Secara bersamaan, Red Hat mengakui ketidakjelasan seputar “open-source AI.” Pada Linux Foundation Members Summit pada November 2024, Richard Fontana, penasihat komersial utama Red Hat, menyoroti bahwa sementara perangkat lunak open-source tradisional bergantung pada kode sumber yang dapat diakses, AI memperkenalkan tantangan dengan data pelatihan dan bobot model yang tidak transparan.

Selama diskusi panel, Fontana mengatakan, “Apa analogi untuk [kode sumber] untuk AI? Itu tidak jelas. Beberapa orang percaya data pelatihan harus terbuka, tetapi itu sangat tidak praktis untuk LLMs [large language models]. Ini menunjukkan bahwa open-source AI mungkin adalah tujuan utopia pada tahap ini.”

Tegangan ini terlihat dalam model-model yang dirilis di bawah lisensi yang membatasi namun dilabeli “open-source.” Program-program open-source palsu ini termasuk LLama Meta, dan Fontana mengkritik tren ini, mencatat bahwa banyak lisensi mendiskriminasi bidang usaha atau kelompok sementara masih mengklaim keterbukaan.

Tantangan inti adalah mendamaikan transparansi dengan realitas bersaing dan hukum. Sementara Red Hat mendukung keterbukaan, Fontana memperingatkan agar tidak memberikan definisi yang kaku yang mensyaratkan pengungkapan penuh data pelatihan: Mengungkapkan data pelatihan terperinci berisiko menargetkan pencipta model di lingkungan yang penuh tuntutan hukum saat ini. Penggunaan yang adil dari data yang tersedia secara publik mempersulit harapan transparansi.

MEMBACA  Warga Palestina melarikan diri dari Khan Younis saat pasukan Israel menyerang selatan Gaza

Juga: Red Hat bertaruh besar pada AI dengan akuisisi Neural Magic-nya

CTO Red Hat Chris Wright menekankan langkah-langkah pragmatis menuju reproduktibilitas, memperjuangkan model-model terbuka seperti Granite LLMs dan alat-alat seperti InstructLab, yang memungkinkan penyesuaian yang didorong oleh komunitas. Wright menulis: “InstructLab memungkinkan siapa pun berkontribusi pada model, membuat AI benar-benar kolaboratif. Itu bagaimana open source menang dalam perangkat lunak – sekarang kita melakukannya untuk AI.”

Wright menggambarkan ini sebagai evolusi dari warisan Linux Red Hat: “Sama seperti Linux menstandarisasi infrastruktur TI, RHEL AI menyediakan dasar bagi AI perusahaan – terbuka, fleksibel, dan hibrid oleh desain.”

Red Hat membayangkan pengembangan AI mencerminkan etos kolaboratif perangkat lunak open-source. Wright berargumen: “Model-model harus menjadi artefak open-source. Berbagi pengetahuan adalah misi Red Hat – inilah cara kami menghindari keterikatan vendor dan memastikan AI bermanfaat bagi semua orang.”

Juga: AI terbaik untuk coding pada tahun 2025 (dan apa yang tidak boleh digunakan – termasuk DeepSeek R1)

Itu tidak akan mudah. Wright mengakui bahwa “AI, khususnya model bahasa besar yang mendorong AI generatif, tidak dapat dilihat dengan cara yang sama seperti perangkat lunak open-source. Berbeda dengan perangkat lunak, model AI pada dasarnya terdiri dari bobot model, yang merupakan parameter numerik yang menentukan bagaimana model memproses input, serta koneksi yang dibuatnya antara berbagai titik data. Bobot model yang terlatih adalah hasil dari proses pelatihan yang ekstensif melibatkan jumlah data pelatihan yang sangat besar yang dipersiapkan, dicampur, dan diproses dengan hati-hati.”

Meskipun model bukanlah perangkat lunak, Wright melanjutkan:
“Dalam beberapa hal, mereka berfungsi mirip dengan kode. Mudah untuk membuat perbandingan bahwa data adalah, atau analog dengan, kode sumber model. Data pelatihan sendiri tidak sesuai dengan peran ini. Sebagian besar perbaikan dan peningkatan pada model AI yang kini sedang terjadi dalam komunitas tidak melibatkan akses atau manipulasi data pelatihan asli. Sebaliknya, mereka adalah hasil modifikasi pada bobot model atau proses penyesuaian, yang juga dapat digunakan untuk mengatur kinerja model. Kebebasan untuk melakukan perbaikan model tersebut memerlukan bahwa bobot dilepaskan dengan semua izin yang diterima pengguna di bawah lisensi open-source.”

MEMBACA  5 hal yang perlu diperbaiki oleh Android untuk menjadi rival iOS yang lebih layak pada tahun 2024

Namun, Fontana juga memperingatkan agar tidak terlalu jauh dalam mendefinisikan keterbukaan, memperjuangkan standar minimal daripada idealisme utopia. “Definisi Open Source (OSD) berhasil karena menetapkan dasar, bukan langit-langit. Definisi AI harus fokus pada kejelasan lisensi terlebih dahulu, bukan membebani pengembang dengan mandat transparansi yang tidak praktis.”

Pendekatan ini mirip dengan Definisi Open Source AI (OSAID) 1.0 Inisiatif Open Source (OSI), tapi bukan hal yang sama. Sementara Yayasan Mozilla, Yayasan OpenInfra, Insinyur Bloomberg, dan SUSE telah mendukung OSAID, Red Hat belum memberikan restu dokumen tersebut. Sebaliknya, Wright mengatakan, “Pandangan kami hingga saat ini hanya pendapat kami tentang apa yang membuat AI open-source dapat dicapai dan dapat diakses oleh sebanyak mungkin komunitas, organisasi, dan vendor.”

Juga: Laptop Linux terbaik tahun 2025: Diuji dan ditinjau oleh pakar

Wright menyimpulkan: “Masa depan AI adalah terbuka, tetapi ini adalah perjalanan. Kami sedang menangani transparansi, keberlanjutan, dan kepercayaan – satu proyek open-source pada satu waktu.” Perspektif peringatan Fontana mengakarakan visi ini, yaitu bahwa open-source AI harus menghormati realitas bersaing dan hukum. Komunitas harus merumuskan definisi secara bertahap, bukan memaksa idealisme ke dalam teknologi yang belum matang.

OSI, sambil fokus pada sebuah definisi, setuju. OSAID 1.0 hanya versi pertama yang tidak sempurna. Kelompok tersebut sudah bekerja menuju versi lain. Sementara itu, Red Hat akan terus bekerja dalam membentuk masa depan AI yang terbuka dengan membangun jembatan antara komunitas pengembang dan perusahaan sambil menavigasi etika transparansi AI yang berliku.