2026-04-01 11:33:36

#ClaudeCode500KCodeLeak

Kemarin dunia AI diam-diam meledak. Seseorang menyadari bahwa paket npm Anthropic's Claude Code dikirimkan dengan file .npmignore yang salah konfigurasi, dan di dalam paket tersebut terdapat peta sumber — sebuah file .map — yang berisi sekitar 512.000 baris kode sumber TypeScript mentah yang mencakup hampir 1.900 file. Seluruh lapisan orkestrasi dari salah satu agen pengkodean AI paling canggih di pasar, hanya duduk di sana, dapat diunduh, diindeks, dan bersifat publik. Bukan bobot model. Bukan data pelatihan. Sesuatu yang mungkin lebih menarik: seluruh kerangka kerja, struktur pendukung, dan wiring yang membuat Claude Code benar-benar berperilaku seperti saat ia duduk di terminal Anda dan menulis kode Anda.

Komunitas bergerak cepat. Cermin-cermin muncul dalam beberapa jam. Para peneliti mulai memasukkan kembali kode tersebut ke dalam Claude sendiri dan memintanya menjelaskan apa yang sedang dibacanya. Output analisis diri yang dikembalikan, tergantung dari sudut pandang Anda, bisa sangat mengesankan atau diam-diam mengkhawatirkan — mungkin keduanya.

Inilah apa yang sebenarnya diungkapkan oleh kode yang bocor, dan mengapa hal ini jauh melampaui siklus meme.

Arsitektur prompt sistem bukanlah sebuah dokumen tunggal yang koheren. Ia adalah potongan-potongan lebih dari seratus fragmen kondisional, masing-masing disuntikkan secara dinamis tergantung pada tool yang aktif, mode apa yang sedang digunakan pengguna, dan konteks apa yang terdeteksi. Komponen monitor keamanan saja memiliki lebih dari 5.600 token — sekitar 22.000 kata instruksi kondisional yang didedikasikan hanya untuk mengawasi input yang bersifat adversarial. Itu bukan fitur keamanan yang dipasang di akhir. Itu adalah lapisan kognitif paralel yang berjalan bersamaan dengan semuanya, selalu, membaca file dan potongan kode yang sama yang dibaca Claude dan mencari tanda-tanda injeksi prompt sebelum setiap panggilan tool diizinkan untuk dilanjutkan.

Mode Plan, fitur yang dipicu oleh Shift+Tab, bukanlah jeda "berpikir sebelum bertindak" yang sederhana. Ia memunculkan tiga agen paralel. Satu memetakan basis kode. Satu melakukan apa yang disebut proses wawancara oleh kode. Eksekusi itu sendiri terjadi di dalam worktree git yang terisolasi, dikarantina dari direktori kerja langsung. Logika koordinasi antara agen-agen ini eksplisit, terstruktur, dan cukup kompleks untuk sesuatu yang dikirim sebagai alat pengembang.

Memori disusun secara berlapis yang hampir pasti tidak disadari oleh kebanyakan pengguna. Ada memori tingkat sesi, seperti yang diharapkan. Ada memori yang dibagikan tim. Dan kemudian ada sesuatu yang disebut autoDream oleh basis kode — sebuah proses konsolidasi latar belakang yang berjalan secara asinkron, memangkas entri yang redundan dan menggabungkan memori terkait. Nama ini cukup evocative sehingga memunculkan reaksi tersendiri saat orang menemukannya, tetapi mekanismenya sendiri cukup sederhana: ini adalah proses pemeliharaan yang dirancang untuk menjaga agar penyimpanan memori tetap berguna dalam jangka waktu yang panjang daripada membengkak menjadi noise.

Verifier adversarial layak mendapatkan paragraf tersendiri. Setelah kode dihasilkan, agen terpisah diaktifkan dengan satu tugas: mencoba merusaknya. Menemukan kasus pinggiran. Mengungkap kesalahan logika. Mengembalikan PASS atau FAIL sebelum output disampaikan ke pengguna. Ini bukan pemeriksaan lint post-hoc. Ini adalah sub-agen adversarial yang tertanam dalam pipeline pengiriman. Kode tersebut juga menunjukkan bahwa verifier ini dapat dikonfigurasi, yang mengimplikasikan bahwa Anthropic memperlakukannya sebagai dial daripada saklar — Anda dapat menyetel seberapa keras ia mencoba merusak sesuatu.

Fitur yang belum dirilis dalam basis kode adalah tempat hal-hal benar-benar berspekulasi, karena tidak satupun dari fitur ini yang dikirimkan. BUDDY tampaknya adalah pendamping AI yang bersifat permanen dengan status yang melacak sesuatu yang serupa dengan metrik emosional atau keterlibatan — perbandingan Tamagotchi yang beredar di X bersifat reduktif tetapi tidak sepenuhnya salah. KAIROS adalah sistem notifikasi proaktif, artinya agen yang menghubungi pengguna daripada menunggu dipanggil. ULTRAPLAN mengarah ke mode perencanaan berbasis cloud menggunakan model kelas Opus, yang berarti lapisan perencanaan paling mampu dialihkan daripada dijalankan secara lokal. Apakah salah satu dari ini akan dikirimkan, kapan, atau dalam bentuk apa, sama sekali tidak diketahui, tetapi keberadaannya dalam basis kode pada tingkat pengembangan ini memberi tahu Anda sesuatu tentang ambisi peta jalan produk.

Pertahanan anti-distilasi adalah hal yang paling menarik secara filosofis dalam bocoran ini. Kode tersebut berisi logika yang dirancang untuk menyajikan output tool palsu kepada siapa saja yang mencoba mengikis atau menyuling perilaku model melalui probing otomatis. Tujuannya adalah untuk meracuni sinyal pelatihan bagi siapa saja yang mencoba menyalin perilaku Claude dengan mengawasinya bekerja. Ironi bahwa mekanisme pertahanan ini — yang disebut Undercover Mode secara internal — sendiri bocor dalam paket yang sama tidak luput dari perhatian. Ini adalah hal yang akan terasa dibuat-buat jika dibaca dalam sebuah novel.

Pengamatan tentang kualitas kode layak disebutkan karena mereka memberi cerita yang berbeda dari arsitektur. Di antara pipeline multi-agen yang dirancang secara elegan dan sistem memori yang disusun dengan hati-hati, terdapat fungsi yang melebihi 3.000 baris. Ada apa yang akan disebut oleh insinyur berpengalaman sebagai spaghetti di beberapa tempat. Ini bukan kritik — ini pengingat bahwa bahkan infrastruktur AI paling canggih pun dibangun oleh manusia di bawah tekanan pengiriman, dan jarak antara perilaku eksternal yang elegan dan implementasi internal yang berantakan adalah konstanta universal dalam perangkat lunak. Ini juga berarti bahwa kode yang bocor bukanlah sebuah referensi implementasi yang murni. Itu adalah basis kode yang berfungsi lengkap dengan semua luka yang menyertainya.

Apa arti ini bagi lanskap AI yang lebih luas patut dipertimbangkan. Lapisan orkestrasi — kerangka kerja, struktur pendukung, logika koordinasi agen — secara historis diperlakukan sebagai rahasia milik yang membedakan alat-alat ini. Bobot model sebagian besar tidak dapat diakses. Data pelatihan dilindungi. Tetapi lapisan perilaku, bagian yang menentukan bagaimana model benar-benar bertindak saat terintegrasi dalam sebuah produk, kini telah terbuka sepenuhnya untuk salah satu agen pengkodean terkemuka. Tim lain akan membaca ini. Peneliti akademik akan membaca ini. Kompetitor akan membaca ini. Teknik spawning agen paralel, verifikasi adversarial, konsolidasi memori berlapis, dan deteksi injeksi prompt yang dikembangkan Anthropic dengan waktu rekayasa yang cukup sekarang secara efektif menjadi pengetahuan publik.

Anthropic belum mengeluarkan pernyataan resmi saat tulisan ini dibuat. Paket npm tersebut diduga telah diperbaiki. Cermin-cermin sudah terlalu tersebar luas untuk secara bermakna menekan. Diskursus akan berlanjut dalam beberapa hari, seperti biasanya. Tetapi artefak itu sendiri — 512.000 baris yang menggambarkan bagaimana agen pengkodean AI frontier benar-benar berpikir dan berkoordinasi — akan dipelajari dengan cermat oleh orang-orang yang membangun sistem ini untuk waktu yang lama.

Pelajaran utamanya bukanlah bahwa Anthropic melakukan kesalahan. Melainkan bahwa jarak antara "AI kotak hitam" dan "sistem AI yang sepenuhnya dapat dibaca" jauh lebih kecil daripada narasi tentang produk ini biasanya mengisyaratkan. Keajaiban itu nyata, tetapi juga TypeScript.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

1 Suka