Pintu air telah terbuka untuk membangun model AI reasoning dengan harga murah. Para peneliti di Stanford dan University of Washington telah mengembangkan model yang berperforma sebanding dengan model OpenAI o1 dan DeepSeek R1 dalam matematika dan pemrograman – dengan biaya kurang dari $50 kredit komputasi awan. Apa yang lebih, model ini dilatih hanya dengan 1.000 pertanyaan, dan hanya membutuhkan 26 menit dan 16 Nvidia H100 GPUs. Peneliti dari Stanford, Niklas Muennighoff, mengatakan dalam email kepada Mashable bahwa biaya ini adalah perkiraan berdasarkan waktu GPU dan jumlah GPU H100 yang digunakan.
Industri AI belakangan ini fokus pada bagaimana pendekatan baru terhadap proses pelatihan sebelum dan sesudah dapat menghemat biaya komputasi secara besar-besaran, seperti dampak yang dihasilkan oleh DeepSeek. Selain itu, pengembang sekarang dapat membangun di atas model AI yang ada dengan biaya sedikit atau tanpa biaya, melalui API, akses open-source, dan bahkan model closed-source dengan menyuling data mereka, sehingga mengurangi biaya lebih jauh.
Menurut paper penelitian tim yang dipublikasikan Jumat lalu, s1 dilatih dengan dataset yang terdiri dari “1.000 pertanyaan yang dipilih dengan teliti yang dipasangkan dengan jejak penalaran dan jawaban yang disuling dari Gemini Thinking Experimental.” Model Gemini Thinking Experimental dari Google dapat diakses dengan batasan harian melalui AI Studio. Meskipun ini adalah model closed-source, ini tidak menghentikan para peneliti untuk memanfaatkan responsnya.
Selanjutnya, para peneliti menggunakan model pra-pelatihan “off the shelf” dari lab milik Alibaba, Qwen, dan melakukan fine-tuning terawasi dari dataset yang dipilihnya. Kemudian, tim membuat anggaran token untuk mengontrol jumlah waktu komputasi untuk pengujian model. Jika s1 melebihi anggaran pada token berpikir, maka akan dipotong dan dipaksa untuk menghasilkan jawaban apapun yang muncul. Jika para peneliti ingin model tersebut menghabiskan lebih banyak “waktu komputasi uji” pada suatu masalah, mereka hanya perlu memberitahu model untuk “menunggu,” yang memperpanjang waktu berpikirnya dan menghasilkan hasil yang lebih akurat.
Dengan mengontrol jumlah waktu dan komputasi yang dihabiskan untuk suatu masalah, para peneliti dapat menunjukkan bagaimana peningkatan tim berpikir menghasilkan kinerja yang lebih baik. S1 adalah contoh dari model penalaran open-source yang telah dikembangkan dengan sebagian biaya dari model unggulan dari Google dan OpenAI. Pada bulan Januari, peneliti UC Berkeley merilis model penalaran open-source bernama Sky-T1 yang biayanya $450, “menunjukkan bahwa memungkinkan untuk mereplikasi kemampuan penalaran tingkat tinggi secara terjangkau dan efisien,” sesuai dengan pos blog mereka. Ada juga model penalaran open-source rStar-Math dari peneliti Microsoft Asia, Tulu 3 dari lembaga riset nirlaba Ai2, dan HuggingFace memiliki inisiatif sendiri untuk mereplikasi DeepSeek R1.
Saat model-model berkualitas tinggi menjadi lebih mudah diakses dan lebih murah, kita mulai melihat pergeseran kekuatan dari sedikit pemain berat AI, menjadi banyak.