
Perusahaan Tiongkok DeepSeek telah membuat langkah lain dalam perlombaan kecerdasan buatan global saat mengumumkan DeepSeek-V3.2 dan variannya V3.2-SpecialeKedua model sumber terbuka ini ditujukan langsung ke pasar kelas atas. Perusahaan mengklaim sistem penalarannya sebanding dengan benchmark terkemuka seperti GPT-5 dan Gemini-3 Pro, memberikan tekanan pada raksasa Amerika tersebut di tengah persaingan teknologi yang ketat.
Di Eropa, dimana perdebatan tentang AI yang bertanggung jawab, regulasi, dan kedaulatan teknologi Tren ini sudah umum, dan langkah DeepSeek tidak luput dari perhatian. Fakta bahwa sebuah laboratorium Tiongkok telah menerbitkan bobot, dokumentasi teknis yang terperinci, dan model penalaran tingkat lanjut dalam sumber terbuka memperkuat kesan bahwa ekosistem sumber terbuka kembali mendapatkan kekuatan terhadap solusi yang sepenuhnya bersifat kepemilikan, sesuatu yang mungkin sangat menarik bagi universitas, pusat penelitian, dan UKM teknologi di Eropa.
DeepSeek-V3.2: penalaran pada tingkat model terkemuka
Startup yang berbasis di Hangzhou telah mempersembahkan Pencarian Dalam-V3.2 sebagai versi final dan stabil dari model penalarannya, menggantikan edisi eksperimental yang dirilis beberapa minggu sebelumnya. Menurut perusahaan itu sendiri, V3.2 mencapai kinerja yang mirip dengan GPT-5 dalam berbagai Benchmark audiens penalaran dan pemikiran multi-tahap, dan diposisikan sedikit di bawah Gemini-3.0 Profesional dalam beberapa uji patokan.
Model ini menggabungkan Penalaran tipe manusia dengan kemampuan menggunakan alat eksternalseperti mesin pencari web, kalkulator, lingkungan eksekusi kode, atau sistem pihak ketiga seperti Claude Code. Idenya adalah bahwa sistem ini tidak hanya menghasilkan teks, tetapi juga dapat merencanakan, meminta sumber daya, menjalankan fungsi, dan kemudian mengintegrasikan hasil tersebut menjadi respons yang lebih lengkap tanpa memerlukan pengawasan terus-menerus.
DeepSeek telah menyoroti bahwa model tersebut menawarkan dua mode interaksi dengan alatSatu dengan penalaran yang terlihat, di mana pengguna dapat mengikuti langkah-langkah perantara, dan satu lagi tanpa menunjukkan proses berpikir. Dalam kedua kasus, “Memori penalaran” tetap ada di tengah seruan untuk menggunakan alat dalam percakapan yang sama dan memulai ulang hanya saat pesan baru tiba dari pengguna, sesuatu yang sangat berguna untuk tugas yang panjang atau alur tipe agen.
Mode "berpikir" terintegrasi ke dalam penggunaan alat
Salah satu fitur baru yang paling mencolok dari DeepSeek-V3.2 adalah Integrasi langsung mode berpikir dalam penggunaan alatSelagi bernalar, model tersebut dapat mengirimkan pertanyaan ke mesin pencari, memanggil kalkulator, mengeksekusi kode, atau berinteraksi dengan layanan lain, menggabungkan siklus analisis internal dan panggilan eksternal untuk mencoba memberikan jawaban. lebih rinci dan tepat ketika tugas memerlukannya.
Menurut perusahaan, pendekatan ini menjadikan V3.2 sebagai model pertama yang mampu bernalar dan menggunakan alat secara aslibaik dalam mode standar maupun mode berpikir intensif. Ini adalah komitmen yang jelas terhadap apa yang disebut alur kerja berbasis agenDalam kasus ini, AI tidak hanya menjawab satu pertanyaan, tetapi bertindak sebagai agen otonom yang memecah masalah, mencari informasi, menghitung, lalu menggabungkan semuanya menjadi solusi yang koheren.
DeepSeek juga menekankan bahwa model ini tersedia secara luas: DeepSeek-V3.2 dapat digunakan melalui web, aplikasi dan APIHal ini memudahkan integrasinya ke dalam produk, asisten virtual, atau perangkat bisnis, termasuk proyek yang dikembangkan di Eropa. Bagi komunitas pengembang dan perusahaan Eropa yang mencari alternatif terbuka, kemampuan untuk mengeksplorasi dan mengadaptasi model tanpa bergantung pada satu platform utama merupakan keuntungan yang signifikan.
Arsitektur DeepSeek Sparse Attention (DSA) dan efisiensi komputasi
Pada tingkat teknis, inti dari DeepSeek-V3.2 adalah Perhatian Jarang DeepSeek (DSA), mekanisme perhatian yang dirancang untuk menangani urutan yang sangat panjang sambil mengurangi biaya komputasi. DeepSeek telah meluncurkan sistem file paralel yang dioptimalkan untuk AI yang melengkapi upayanya dalam efisiensi dan penerapan. Model ini memiliki sekitar 671.000 miliar total parametertetapi pada setiap langkah inferensi mereka hanya diaktifkan sekitar 37.000 miliar parameter per tokenHal ini memungkinkan kapasitas dipertahankan tanpa meningkatkan konsumsi sumber daya.
Arsitektur terdistribusi ini memungkinkan bekerja dengan jendela konteks hingga 128.000 token Dalam produksi, ukuran ini sangat berguna untuk menganalisis dokumen ekstensif, penelitian akademis, atau meninjau informasi hukum dan teknis dalam jumlah besar—area yang sangat diminati oleh lembaga-lembaga Eropa. Menurut data yang disediakan oleh perusahaan, DSA mengurangi biaya inferensi sekitar setengahnya dibandingkan dengan arsitektur padat sebelumnya dalam konteks yang panjang.
Bagi organisasi di Spanyol dan negara-negara Uni Eropa lainnya yang menghadapi kendala anggaran komputasi, ini peningkatan efisiensi Hal ini membuka peluang untuk bereksperimen dengan model-model yang sangat canggih tanpa memerlukan infrastruktur mahal yang digunakan oleh perusahaan-perusahaan teknologi besar AS. Meskipun demikian, DeepSeek mengakui bahwa mereka masih memiliki ruang untuk perbaikan dibandingkan para pesaingnya dalam efisiensi token dan luasnya pengetahuan dunia, dua area utama untuk penerapan berskala besar.
DeepSeek-V3.2 dengan penguatan intensif menggunakan RL dan data sintetis untuk agen
Di luar arsitektur, DeepSeek menegaskan bahwa sebagian besar lompatan dalam penalaran berasal dari pasca pelatihan besar-besaran melalui pembelajaran penguatan (RL)Perusahaan telah mengalokasikan lebih dari 10% dari total perhitungan pra-latihan hanya pada fase ini, persentase yang tidak biasa di sektor ini, dengan tujuan memperkuat kapasitas model untuk memperbaiki kesalahan, bernalar secara mendalam, menggunakan alat, dan bertindak dalam lingkungan interaktif.
Tim telah membangun ekosistem data sintetis yang kompleks yang mencakup lebih dari 1.800 lingkungan pelatihan dan sekitar 85.000 instruksi lanjutan Khusus untuk agen. Tugas-tugas ini mencakup pencarian di dunia nyata, simulasi dinamis, eksekusi kode, masalah berantai, dan skenario yang dihasilkan dan diverifikasi secara otomatis untuk meminimalkan kesalahan dalam kumpulan data.
Pendekatan ini diarahkan untuk menciptakan Agen AI yang mampu beroperasi dengan tingkat otonomi tertentuMenganalisis informasi, membuat keputusan, dan bertindak dalam alur kerja multi-tahap. Bagi perusahaan Eropa yang mengeksplorasi otomatisasi proses kompleks—mulai dari analisis keuangan hingga dukungan teknis tingkat lanjut—kemajuan ini mungkin sangat menarik, meskipun masih harus dilihat bagaimana kinerja model tersebut di luar lingkungan pengujian yang terkontrol.
DeepSeek-V3.2-Speciale: matematika, ilmu komputer, dan pemikiran lanjutan
Bersamaan dengan model generalis, DeepSeek telah meluncurkan DeepSeek-V3.2-Spesial, varian yang ditujukan untuk kalkulus tingkat lanjut, pembuktian matematika, dan proses berpikir yang diperluasPerusahaan mengklaim versi ini setara dengan Gemini-3 Profesional Kinerja Google dalam tugas-tugas penalaran yang kompleks dan kinerjanya mendekati hasil medali emas dalam kompetisi internasional.
Secara khusus, Speciale akan mencapai tingkat yang sebanding dengan medali emas di Olimpiade Matematika Internasional (IMO), yang Olimpiade Internasional Informatika (IOI), The Final Dunia ICPC dan Olimpiade Matematika Tiongkok. Selain itu, ia mengintegrasikan kemampuan yang berasal dari model DeepSeek-Matematika-V2, yang mengkhususkan diri dalam pembuktian teorema dan pemecahan masalah yang sangat sulit, yang memperkuat posisinya di segmen model untuk penelitian ilmiah dan teknis.
Tidak seperti versi standar, DeepSeek-V3.2-Speciale tidak ditujukan untuk tugas sehari-hari atau integrasi generalis dengan alat. Perusahaan menekankan bahwa ini adalah model yang dirancang terutama untuk penelitian dan karya akademis, dengan konsumsi token unggul, jadi untuk saat ini Ini hanya ditawarkan melalui API dan tidak melalui aplikasi tujuan umum.
Ketersediaan DeepSeek-V3.2, aperture dan kontras dengan raksasa Amerika
DeepSeek telah menerbitkan bobot DeepSeek-V3.2 lengkap dan laporan teknis terperinci mengenai pelatihan mereka, sesuatu yang kontras dengan kebijakan yang semakin ketat dari beberapa perusahaan teknologi besar AS, yang sering membatasi akses ke kode atau ukuran model tercanggih mereka. Bahkan dalam kasus open source Sebagian, seperti beberapa versi Llama, pembukaannya disertai kondisi dan nuansa khusus.
Dalam konteks Eropa, tingkat ini transparansi dan keterbukaan Hal ini dapat menjadi kunci bagi proyek-proyek yang memerlukan auditabilitas, kepatuhan terhadap peraturan, atau kemampuan untuk mengadaptasi model ke dalam kerangka peraturan seperti Undang-Undang AI Uni EropaUniversitas, pusat penelitian, dan administrasi publik dapat mempelajari model tersebut secara lebih rinci, mengulangi eksperimen, atau bahkan menyesuaikan beberapa bagian dengan kebutuhan mereka sendiri tanpa sepenuhnya bergantung pada API eksternal yang tertutup.
Perusahaan telah menempatkan DeepSeek-V3.2 tersedia untuk komunitas di platform seperti Hugging Face dan ModelScopeSelain menawarkan akses melalui API, varian Speciale, di sisi lain, saat ini terbatas pada konsumsi melalui antarmuka terprogram karena permintaan komputasi dan biaya per token yang lebih tinggiStrategi distribusi campuran ini sesuai dengan minat banyak pemain Eropa untuk memiliki model penelitian yang kuat, meskipun penerapan komersialnya mungkin memerlukan perencanaan yang lebih cermat.
Peran Tiongkok dalam perlombaan AI global
Rilis DeepSeek-V3.2 hadir pada saat Tiongkok ingin memperkuat kepemimpinannya dalam AI Meskipun adanya pembatasan akses ke semikonduktor canggih dan meningkatnya ketegangan geopolitik, DeepSeek telah menjadi salah satu nama yang paling banyak dibicarakan di ekosistem Tiongkok setelah muncul ke permukaan awal tahun ini dengan model yang mengejutkan semua orang dengan rasio daya terhadap biaya, dan sekarang ia menggandakannya dengan kemampuan agen dan penalaran tingkat tinggi.
Untuk Eropa, dimana diskusi berpusat pada bagaimana menyeimbangkan inovasi, perlindungan data dan keamananJenis pengembangan ini menghadirkan peluang sekaligus tantangan. Di satu sisi, keberadaan model terbuka berkapasitas tinggi dari Tiongkok memperluas jangkauan alat yang tersedia bagi laboratorium dan perusahaan Eropa. Di sisi lain, muncul pertanyaan mengenai kesesuaian dengan peraturan setempat, aliran data lintas batas dan dampaknya peraturan konten di Tiongkok, yang oleh beberapa ahli dianggap sebagai hambatan yang mungkin terjadi terhadap perluasan penuh sistem ini secara internasional.
DeepSeek juga telah mendapatkan visibilitas di luar pasar domestiknya setelah model V3.1 berpartisipasi dalam eksperimen investasi otomatis dibandingkan dengan sistem seperti GPT-5 dan Gemini 2.5 Pro, yang menunjukkan hasil yang kompetitif. Strategi ini dilengkapi dengan peluncuran model lain seperti DeepSeek-OCR, bertujuan untuk mengompresi teks melalui persepsi visual dan memprosesnya dengan lebih sedikit sumber daya, memperkuat citra perusahaan sebagai aktor yang berfokus pada efisiensi dan sumber terbuka.
Harapan, batasan, dan langkah selanjutnya
Meskipun klaim perusahaan tersebut, DeepSeek mengakui bahwa V3.2 masih tertinggal dari beberapa pesaingnya di AS dalam aspek-aspek seperti pengetahuan dunia umum, pemahaman konteks budaya yang luas, atau efisiensi dalam penggunaan token. Lebih lanjut, para pemimpin proyek sendiri mengakui bahwa perbandingan berdasarkan tolok ukur publik Mereka tidak selalu mencerminkan kinerja dunia nyata dalam lingkungan produksi, terutama dalam tugas terbuka dan dengan pengguna akhir.
Hal lain yang perlu dipertimbangkan adalah bahwa integrasi alat dalam mode penalaran Hal ini masih perlu divalidasi secara menyeluruh dalam kasus penggunaan dunia nyata yang kompleks, mulai dari layanan kesehatan hingga pengambilan keputusan keuangan atau hukum. Penghematan biaya komputasi yang ditawarkan oleh DSA memang signifikan, tetapi dapat terabaikan jika kualitas respons tidak dipertahankan secara konsisten ketika tugas menjadi lebih ambigu atau membutuhkan konteks yang sangat spesifik.
Dengan hadirnya DeepSeek-V3.2 dan varian Speciale-nya, lanskap AI penalaran tingkat lanjut mendapatkan pemain baru dengan aspirasi global, bertaruh pada model terbuka, alat terintegrasi, dan biaya terkendaliPerkembangan ini memperluas jangkauan pilihan yang tersedia dalam penelitian, bisnis, dan administrasi publik, sekaligus memaksa pemikiran ulang tentang cara menyesuaikan evolusi AI yang cepat ke dalam kerangka regulasi yang menuntut dan persaingan yang semakin ketat antara blok teknologi.
