Nomos 1: Kecerdasan Buatan “Open-Source” yang Mengguncang Kompetisi Matematika Elite Dunia

Dunia teknologi kembali dikejutkan oleh pencapaian signifikan dari Nous Research, sebuah perusahaan rintisan kecerdasan buatan (AI) yang berbasis di San Francisco. Pada hari Selasa lalu, mereka merilis Nomos 1, sebuah sistem penalaran matematika berbasis open-source yang berhasil mencatatkan prestasi luar biasa dalam Kompetisi Matematika William Lowell Putnam tahun ini.

Kompetisi Putnam dikenal luas sebagai salah satu ujian matematika tingkat sarjana yang paling bergengsi dan brutal di dunia. Tingkat kesulitannya tak main-main; dari skor sempurna 120, nilai median peserta tahun ini hanya berada di angka 2. Namun, Nomos 1 berhasil menorehkan skor 87 poin. Menurut klaim perusahaan, hasil ini menempatkan AI tersebut di peringkat kedua dari total 3.988 peserta manusia yang mengikuti kompetisi pada tahun 2024.

Efisiensi Arsitektur di Balik Kecerdasan Nomos 1

Pencapaian ini menandai titik balik dalam perlombaan membangun sistem AI yang mampu melakukan penalaran matematika tingkat lanjut. Berbeda dengan model raksasa yang boros komputasi milik perusahaan teknologi besar, Nomos 1 bekerja dengan arsitektur yang relatif ringkas. Model ini memiliki 30 miliar parameter, dengan hanya sekitar 3 miliar yang aktif pada satu waktu tertentu, menggunakan desain mixture-of-experts yang didasarkan pada model Qwen3 milik Alibaba.

Hal yang paling mencolok adalah lonjakan performa Nomos 1 dibandingkan model dasarnya. Ketika Nous Research menguji model dasar Qwen3 tanpa pelatihan khusus mereka, model tersebut hanya mampu mencetak skor 24 dari 120. Perusahaan menyatakan bahwa lonjakan skor menjadi 87 dengan 8 jawaban sempurna ini sebagian besar disebabkan oleh optimalisasi pasca-pelatihan dan kualitas data, bukan sekadar skala model. Hasil ini pun telah diverifikasi melalui penilaian buta (blind grading) oleh pakar manusia yang pernah menembus peringkat 200 besar di kompetisi Putnam sebelumnya.

Kompetisi Putnam: Ujian Tertinggi Nalar Matematika

Untuk memahami betapa signifikannya pencapaian ini, kita perlu melihat betapa kerasnya Kompetisi Putnam. Diselenggarakan oleh Mathematical Association of America, ajang ini lebih menyerupai “olahraga” matematika daripada sekadar ujian akademis biasa. Ujian terdiri dari dua sesi berdurasi tiga jam dengan total 12 pertanyaan. Soal-soal Putnam bukanlah tipe kalkulasi standar yang ada di buku teks, melainkan teka-teki rumit yang menuntut kreativitas tinggi untuk menemukan solusi.

Banyak alumni Putnam yang kemudian menjadi peneliti terkemuka, termasuk peraih Fields Medal dan pemenang Nobel Fisika seperti Richard Feynman. Fakta bahwa sebuah AI mampu bersaing di level ini menunjukkan lompatan besar dalam kemampuan mesin untuk memahami struktur logika dan pembuktian matematika.

Mekanisme Berpikir Nomos 1

Nomos 1 beroperasi dengan kerangka kerja penalaran canggih yang dikembangkan bersama Hillclimb AI. Sistem ini meniru struktur kompetisi Putnam yang sebenarnya dengan batasan waktu tiga jam. Dalam fase penyelesaian, pekerja paralel menangani masalah secara simultan dan menilai pekerjaan mereka sendiri pada skala 1 hingga 7. Sistem memprioritaskan masalah yang paling sedikit mendapatkan skor sempurna, memastikan daya komputasi terfokus pada tantangan tersulit.

Menjelang akhir waktu, fase finalisasi dimulai dengan proses seleksi dua tahap. Langkah konsolidasi mengelompokkan jawaban berdasarkan kesimpulan, diikuti oleh turnamen eliminasi tunggal untuk menentukan jawaban akhir yang paling akurat.

Pentingnya Fondasi Logika Matematika: Sebuah Ilustrasi

Keberhasilan AI dalam memecahkan masalah kompleks seperti di Putnam mengingatkan kita bahwa matematika, pada intinya, adalah tentang struktur dan aturan yang konsisten. Sebelum mencapai level pembuktian rumit yang dilakukan Nomos 1, logika matematika dimulai dari pemahaman dasar terhadap persamaan linear dan hubungannya. Sebagai contoh relevan mengenai bagaimana logika matematika bekerja dari tingkat dasar, kita bisa meninjau konsep gradien pada persamaan garis lurus.

Dalam matematika dasar, menentukan kemiringan atau gradien adalah fundamental. Dilansir dari Math is Fun, persamaan garis lurus memiliki bentuk umum $y = mx + c$, di mana $m$ merepresentasikan gradien. Logikanya sederhana: jika sebuah persamaan sudah mematuhi format ini, maka koefisien $x$ adalah gradiennya. Misalnya pada persamaan $y = 5x + 9$, karena formatnya sudah sesuai, kita bisa langsung menyimpulkan bahwa gradiennya ($m$) adalah 5.

Transformasi Persamaan untuk Menemukan Solusi

Tantangan muncul ketika persamaan tidak tersaji dalam bentuk standar, sebuah analogi sederhana dari masalah yang perlu “dipecahkan”. Jika kita menghadapi persamaan linear dalam bentuk $ax + by + c = 0$, kita memerlukan langkah tambahan. Menurut Cuemath, kita harus mengubahnya menjadi bentuk $y = mx + c$ atau menggunakan rasio perbandingan koefisien.

Mari kita ambil contoh persamaan $2x + 4y + 4 = 0$. Untuk mencari gradiennya, kita bisa menggunakan rumus cepat $m = -a/b$. Di sini, $a$ adalah 2 dan $b$ adalah 4. Maka perhitungannya menjadi $-2/4$, yang disederhanakan menjadi $-1/2$.

Alternatifnya, kita bisa menggunakan metode manipulasi aljabar untuk mengubah bentuk persamaan:

  1. Mulai dengan $2x + 4y + 4 = 0$.

  2. Pindahkan komponen lain sehingga $4y = -2x – 4$.

  3. Bagi kedua sisi dengan 4, menghasilkan $y = -2/4 x – 1$.

Dari hasil akhir tersebut, terlihat jelas bahwa koefisien $x$ adalah $-2/4$ atau $-1/2$. Baik menggunakan rumus cepat maupun manipulasi bentuk persamaan, hasil akhirnya tetap konsisten. Konsistensi logika inilah yang menjadi basis dari seluruh pengembangan matematika, mulai dari persamaan garis sederhana yang dipelajari siswa sekolah, hingga algoritma rumit yang memungkinkan Nomos 1 menaklukkan kompetisi matematika tersulit di dunia.