ChatGPT 5.5: Ini adalah lompatan baru OpenAI dalam hal otonomi, biaya, dan penggunaan profesional.

  • ChatGPT 5.5 meningkatkan penalaran, otonomi, dan penggunaan komputer dibandingkan dengan GPT-5.4, sambil mempertahankan latensi yang serupa.
  • Dia unggul dalam pemrograman agen, pekerjaan kantor, analisis data, dan penelitian ilmiah, mencapai hasil terbaik dalam tolok ukur utama.
  • Harga per token meningkat, tetapi efisiensi yang lebih tinggi dan konsumsi yang lebih rendah berarti biaya efektif dapat lebih rendah dalam tugas-tugas yang kompleks.
  • OpenAI memperkuat keamanan di bidang keamanan siber dan biologi serta meluncurkan GPT-5.5 dan versi Pro-nya untuk pengguna Plus, Pro, Business, dan Enterprise.

ObrolanGPT 5.5

OpenAI telah membuat pernyataan berani lainnya dengan peluncuran de GPT-5.5, model yang menempatkan generasi terbaru ChatGPT pada tingkat otonomi dan penalaran yang jauh lebih tinggi. Berdasarkan apa yang telah kita lihat sejauh ini, perusahaan tersebut menyajikannya sebagai sistem yang paling intuitif dan mumpuni untuk menangani tugas-tugas kompleks dari awal hingga akhir, mengurangi kebutuhan akan pengawasan pengguna secara terus-menerus.

Langkah ini diambil pada saat yang tepat. persaingan untuk kepemimpinan dalam kecerdasan buatan generatifDengan Anthropic dan Google juga mempercepat model mereka sendiri, GPT-5.5 diluncurkan pertama kali di ChatGPT dan Codex untuk pengguna berbayar, dan menggabungkan peningkatan dalam pemrograman, pekerjaan perkantoran, penelitian ilmiah, dan penggunaan komputer di dunia nyata, dengan biaya tertentu. Kenaikan harga yang coba dibenarkan oleh OpenAI dengan efisiensi luar biasa dalam penggunaan token..

Apa itu GPT-5.5 dan apa perannya dalam strategi OpenAI?

Menurut OpenAI, GPT-5.5 menandai langkah baru dalam penalaran berkelanjutan dan kerja mandiri dengan komputer.Model ini dirancang untuk menangani tugas-tugas panjang dan bertahap: model ini dapat menerima instruksi yang tidak teratur, memecahnya, merencanakan apa yang harus dilakukan terlebih dahulu, memilih dan menangani alat, meninjau hasilnya sendiri, dan melanjutkan meskipun ada ambiguitas dalam pernyataan tersebut.

Perusahaan tersebut mendefinisikannya sebagai AI miliknya. paling intuitif hingga saat iniAlih-alih hanya menjawab pertanyaan-pertanyaan terpisah, GPT-5.5 bertindak sebagai agen: ia mempertahankan konteks selama proses yang ekstensif, menavigasi informasi di web, mengeksekusi perintah, memanipulasi dokumen dan aplikasi perkantoran, dan mengembalikan hasil yang telah terstruktur sebelumnya, siap untuk digunakan di lingkungan profesional.

Peluncuran ini mencakup sebuah GPT-5.5 versi Pro, dirancang untuk tugas-tugas yang lebih kompleks. Saat ini, ChatGPT sudah memiliki pengguna yang membutuhkan jawaban yang lebih akurat di berbagai bidang seperti hukum, bisnis, pendidikan, atau analisis data tingkat lanjut. ChatGPT juga memiliki fitur mode tertentu. Berpikir GPT-5.5dirancang untuk masalah-masalah yang sangat sulit dalam pemrograman, penelitian, atau analisis informasi.

Otonomi dan penggunaan komputer di dunia nyata: dari chatbot menjadi agen kerja.

Salah satu taruhan besar OpenAI adalah pada kemampuan GPT-5.5 untuk berkinerja sebagai agen otonom di komputer. Model ini dapat mencari informasi, menentukan apa yang relevan, menggabungkan sumber, menjalankan perangkat lunak dan alat secara berurutan, dan mengubah materi yang tersebar menjadi hasil yang bermanfaat, tanpa pengguna harus secara teliti menentukan setiap langkahnya.

Dalam kehidupan sehari-hari, hal ini diterjemahkan menjadi tugas-tugas seperti: Membuat dokumen, spreadsheet, atau presentasi yang kompleks.Meninjau kontrak, menyiapkan laporan, menganalisis basis data, atau membuat ringkasan ekstensif dari berbagai file. Perusahaan mengklaim bahwa GPT-5.5 lebih cepat memahami kebutuhan pengguna dan menangani sebagian besar pekerjaan sendiri dibandingkan versi sebelumnya.

Untuk mengilustrasikan perubahan ini, OpenAI mengutip contoh internal: Tim keuangan menggunakan Codex dan GPT-5.5 untuk meninjau puluhan ribu formulir pajak. Dalam waktu yang jauh lebih singkat, departemen komunikasi mengotomatiskan penilaian dan kerangka kerja risiko pada volume permintaan yang besar, atau area pemasaran dan produk telah secara signifikan mengurangi waktu yang dihabiskan untuk laporan berkala berkat alur kerja otomatis.

Kinerja dalam pemrograman agen dan pengembangan perangkat lunak

GPT-5.5 menunjukkan peningkatan dalam pemrograman dan apa yang disebut OpenAI sebagai "pengkodean agen"—penggunaan AI sebagai agen yang menulis, men-debug, dan memelihara kode ujung-ke-ujung. Dalam lingkungan pengembangan, model ini dapat mengelola repositori besar, mengusulkan refaktorisasi kompleks, mengidentifikasi sumber kesalahan, dan mengantisipasi bagian mana dari sistem yang akan terpengaruh oleh perubahan.

Dalam tolok ukur Terminal-Bangku 2.0, yang mengukur alur kerja baris perintah yang kompleks, GPT-5.5 mencapai 82,7%, jelas mengungguli GPT-5.4, dan melakukannya sambil mengonsumsi lebih sedikit token. Dalam SWE-Bench ProBerfokus pada penyelesaian masalah GitHub di dunia nyata, model ini mencapai 58,6%dan dalam evaluasi internal Pakar-SWEDengan tugas-tugas yang perkiraan waktu pengerjaannya sekitar 20 jam, sistem ini juga lebih unggul daripada pendahulunya.

Para insinyur yang menguji versi awal menunjukkan bahwa GPT-5.5 lebih memahami arsitektur keseluruhan dari sistem yang kompleks.Dalam pengujian internal, kasus-kasus seperti penggabungan cabang dengan ratusan perubahan diselesaikan dalam waktu sekitar dua puluh menit, perancangan ulang subsistem yang hampir lengkap (misalnya, sistem komentar dalam editor kolaboratif) atau deteksi dini kesalahan yang sebelumnya membutuhkan lebih banyak iterasi, sering dikutip.

Di Codex, lingkungan rekayasa perangkat lunak OpenAI, GPT-5.5 memiliki jendela konteks hingga 400.000 token, memungkinkannya untuk bekerja dengan basis kode yang sangat besar. Ia juga memiliki mode cepat yang menghasilkan sekitar [jumlah token yang dibutuhkan]. 1,5 kali lebih cepat, meskipun dengan biaya per token yang lebih tinggi, dirancang untuk mereka yang memprioritaskan kecepatan respons.

Pekerjaan berbasis pengetahuan, bisnis, dan penggunaan kantor sehari-hari.

Selain pengembangan perangkat lunak, GPT-5.5 dirancang sebagai alat untuk pekerjaan profesional di lingkungan perkantoran, konsultasi, atau analisis data. OpenAI berpendapat bahwa kemampuan yang sama yang meningkatkan pemrograman kini memungkinkan tugas dokumentasi dan analisis yang lebih efektif.

Dalam tolok ukur PDBval, yang menilai kemampuan untuk menghasilkan karya ahli tertentu dalam 44 pekerjaanGPT-5.5 memperoleh 84,9% dari jawaban yang benar atau seri. Dalam Terverifikasi oleh OSWorldSebuah pengujian yang dirancang untuk memverifikasi apakah model tersebut dapat menangani lingkungan komputasi dunia nyata secara mandiri, tiba di 78,7%. Di Tau2-bench Telecom, yang berfokus pada layanan pelanggan di sektor telekomunikasi, mencapai sebuah 98% tanpa perlu menyesuaikan perintah, yang menunjukkan kinerja tinggi dalam skenario dukungan.

Untuk penggunaan perusahaan, OpenAI menekankan bahwa Lebih dari 85% staf mereka menggunakan Codex setiap minggu. di bidang-bidang seperti teknik, keuangan, pemasaran, data, atau produk. Kasus-kasus seperti otomatisasi laporan mingguan, yang menghemat antara lima hingga sepuluh jam per orang per minggu, menggambarkan jenis manfaat yang dikaitkan perusahaan dengan model baru ini ketika diintegrasikan ke dalam proses bisnis.

Penelitian ilmiah, biologi, dan matematika tingkat lanjut

Penelitian ilmiah merupakan tema sentral lain dalam presentasi GPT-5.5. OpenAI menargetkan alur kerja di mana ia dibutuhkan. Menjelajahi hipotesis, mengumpulkan bukti, menguji asumsi, menafsirkan hasil, dan memutuskan eksperimen selanjutnya., sebuah lingkungan di mana penalaran kontekstual yang berkelanjutan sangat penting.

Dalam tes seperti GeneBenchBerfokus pada tugas-tugas biologi dan genetika, GPT-5.5 meningkatkan hasil dari GPT-5.4, dan variannya GPT-5.5 Pro Ia memperoleh skor yang lebih tinggi lagi. Dalam BixBenchBerfokus pada bioinformatika dan biologi kuantitatif, model baru ini juga mencapai kinerja terbaik di antara sistem dengan data yang telah dipublikasikan hingga saat ini, menurut informasi yang diberikan oleh perusahaan tersebut.

OpenAI bahkan telah memberikan contoh penggunaan dalam matematika tingkat lanjut, di mana sebuah Versi internal GPT-5.5 berkolaborasi dalam pencarian tes baru yang terkait dengan bilangan Ramsey di luar diagonal.Hal ini kemudian diverifikasi menggunakan asisten formal Lean. Perusahaan menyajikan kasus ini sebagai contoh bagaimana model tersebut tidak hanya menghasilkan kode atau penjelasan, tetapi juga dapat berkontribusi pada argumen matematis di bidang yang kompleks.

Secara praktis, disebutkan testimoni dari para peneliti yang telah menggunakan GPT-5.5 Pro untuk menganalisis kumpulan data ekspresi gen dengan puluhan ribu variabel dan sejumlah besar sampelmemperoleh laporan terperinci, sudut pandang analisis baru, dan pertanyaan kunci dalam jangka waktu yang, menurut perhitungan mereka, akan jauh lebih lama jika ditangani sepenuhnya dengan tenaga manusia.

Latensi, waktu penalaran, dan efisiensi token

Di balik peluncuran GPT-5.5 terdapat pesan yang terus-menerus disampaikan: Hal ini meningkatkan kecerdasan model tanpa mengurangi kecepatan respons.OpenAI mengklaim bahwa sistem baru ini menyamai latensi per token GPT-5.4 dalam layanan dunia nyata, meskipun memiliki kemampuan yang lebih tinggi, yang merupakan hal yang tidak biasa pada model yang lebih besar dan lebih kompleks.

Salah satu poin penting adalah waktu penalaran yang dibutuhkan untuk menyelesaikan tugas-tugas kompleksPara pengguna awal yang telah membandingkan kinerja sistem dengan versi sebelumnya melaporkan bahwa proses yang sebelumnya membutuhkan waktu antara 20 hingga 40 menit kini dapat diselesaikan hanya dalam tiga atau empat menit, dengan tetap mempertahankan—dan bahkan meningkatkan—kualitas respons.

Keuntungan ini tidak hanya berasal dari kecepatan mentah, tetapi juga dari... manajemen token yang lebih baikGPT-5.5 membutuhkan lebih sedikit token untuk mencapai hasil yang sebanding atau lebih baik daripada GPT-5.4, sehingga mengurangi total waktu pemrosesan dan biaya yang terkait dengan setiap alur kerja. Dalam skenario dengan volume kueri yang tinggi atau otomatisasi yang intensif, perbedaan ini dapat menjadi sangat penting.

OpenAI menjelaskan bahwa, untuk menjaga latensi, mereka harus mendesain ulang inferensi sebagai sistem terintegrasiGPT-5.5 telah dirancang bersama, dilatih, dan diimplementasikan pada infrastruktur berbasis perangkat keras NVIDIA canggih (GB200 dan GB300 NVL72), dan GPT-5.5 sendiri serta Codex telah digunakan untuk mengoptimalkan heuristik penyeimbangan beban dan partisi, dengan peningkatan lebih dari 20% dalam kecepatan pembuatan token pada sistem mereka.

Harga, biaya sebenarnya, dan perbandingan dengan GPT-5.4

Meskipun GPT-5.5 terletak di kisaran harga tinggi per tokenOpenAI menegaskan bahwa, dalam praktiknya, ia bisa lebih ekonomis daripada pendahulunya dan beberapa pesaingnya. Alasannya adalah kombinasi dari efisiensi token yang lebih besar dan kebutuhan percobaan ulang yang lebih sedikit. atau koreksi.

Dalam API, harga referensi yang dilaporkan untuk GPT-5.5 adalah $5 per juta token input dan $30 per juta token outputdengan jendela konteks yang mencapai hingga satu juta token. Untuk GPT-5.5 Pro, suku bunga naik menjadi $30 per juta token yang dimasukkan dan $180 per juta token yang dikeluarkan.Secara jelas menargetkan penggunaan di mana nilai tambah dari respons tersebut lebih besar daripada biayanya.

OpenAI juga menawarkan mode seperti Batch dan Flex, dengan tarif sekitar setengah dari harga standar.dan mode Prioritas yang melipatgandakan biaya sebesar 2,5 kali lipat sebagai imbalan atas prioritas antrian yang lebih tinggi dan waktu respons yang lebih singkat. Perusahaan mengakui bahwa GPT-5.5 lebih mahal daripada GPT-5.4 secara nominal, tetapi berpendapat bahwa pengurangan token yang dibutuhkan per tugas dan waktu penalaran yang lebih singkat membenarkan biaya tersebut. Mereka dapat mengurangi biaya keseluruhan proyek kompleks dibandingkan dengan model lain..

Di pasar, kebijakan ini menempatkan GPT-5.5 di atas model OpenAI sebelumnya dan di bawah alternatif kelas atas yang, menurut perkiraan yang dibagikan selama presentasi, dapat lima hingga sepuluh kali lebih mahal dalam praktiknya jika mempertimbangkan kombinasi harga, token yang dikonsumsi, dan kualitas hasilnya.

Konteks panjang dan kinerja dalam tolok ukur penalaran

Peningkatan nyata lainnya pada GPT-5.5 adalah kemampuannya untuk bekerja dengan konteks yang sangat luas tanpa kehilangan fokus.Dalam tes seperti Graphwalks BFS 1Mmodel tersebut mencapai 45,4% dibandingkan dengan 9,4% untuk GPT-5.4, dan dalam OpenAI MRCR v2 dengan konteks antara 512 ribu dan 1 juta token, jumlahnya meningkat menjadi 74,0%, dibandingkan dengan 36,6% pada versi sebelumnya.

Dalam bidang penalaran abstrak, GPT-5.5 mencatat sebuah 95,0% di ARC-AGI-1 dan 85,0% di ARC-AGI-2, dengan peningkatan signifikan dibandingkan GPT-5.4. Dalam tes pengetahuan tingkat lanjut seperti Berlian GPQADengan berfokus pada pertanyaan-pertanyaan yang sangat sulit, metode ini memperoleh nilai yang baik. 93,6%dan dalam penilaian seperti Ujian Terakhir Kemanusiaan Angka tersebut melebihi 50% jika diperbolehkan menggunakan alat eksternal.

OpenAI menekankan bahwa banyak dari penilaian ini telah dilakukan di lingkungan penelitian dengan konfigurasi penalaran pada tingkat yang sangat tinggiOleh karena itu, hasilnya mungkin sedikit berbeda dari yang dirasakan oleh pengguna ChatGPT di lingkungan produksi. Meskipun demikian, perusahaan ingin menyampaikan gagasan bahwa GPT-5.5 mewakili sebuah Lompatan praktis dalam tugas-tugas dunia nyata, bukan hanya peningkatan akademis dalam tabel tolok ukur..

Keamanan, keamanan siber, dan penggunaan yang bertanggung jawab

Peningkatan kemampuan tersebut memerlukan penguatan terhadap... pengamananOpenAI menyatakan bahwa GPT-5.5 diluncurkan dengan sistem perlindungan tercanggih hingga saat ini, setelah melalui evaluasi internal dan eksternal, kerangka kerja kesiapan khusus, dan proses pengujian keamanan siber (red teaming) dengan spesialis keamanan siber dan biologi.

Dalam kerangkanya, Kerangka KesiapsiagaanPerusahaan mengklasifikasikan kemampuan GPT-5.5 sebagai Biologi, kimia, dan keamanan siber di tingkat "Tinggi"tanpa mencapai level "Kritis". Meskipun demikian, diakui bahwa model ini lebih efektif daripada GPT-5.4 dalam menemukan dan mengeksploitasi kerentanan, dan oleh karena itu telah diterapkan. pengklasifikasi yang lebih ketat untuk permintaan sensitif dan mekanisme untuk mencegah penggunaan berisiko yang berulang, sesuatu yang mungkin lebih membatasi bagi sebagian pengguna yang memiliki pengetahuan teknis.

Secara paralel, OpenAI bertujuan untuk memperluas akses ke kemampuan yang lebih canggih bagi penggunaan defensif yang terverifikasi melalui program seperti Akses Tepercaya untuk Keamanan SiberAlat-alat ini secara khusus ditujukan untuk organisasi yang bertanggung jawab melindungi infrastruktur penting. Idenya adalah untuk menyediakan alat pertahanan yang ampuh tanpa melonggarkan kontrol terhadap potensi penggunaan ofensif.

Di bidang penelitian biologi, perusahaan telah meluncurkan berbagai inisiatif seperti: program penghargaan untuk mendeteksi kesalahan biologis dalam perilaku modeldengan tujuan agar komunitas ilmiah dapat membantu mengidentifikasi kekurangan dan meningkatkan pengamanan sebelum diterapkan secara lebih luas.

Ketersediaan GPT-5.5 dan penerapannya dalam produk

Penerapan GPT-5.5 telah dimulai untuk Pengguna ChatGPT dan Codex Plus, Pro, Business, dan Enterprisebaik dalam lingkungan pribadi maupun korporat. Di Codex, model ini diintegrasikan ke dalam alur kerja pengembangan perangkat lunak dengan jendela konteks yang diperluas dan mode respons cepat.

La Versi GPT-5.5 Pro Fitur ini secara bertahap diaktifkan untuk pengguna Pro, Bisnis, dan Perusahaan yang membutuhkan tingkat detail dan presisi ekstra, terutama di bidang yang diatur atau berdampak tinggi di mana kesalahan dapat berakibat fatal. Di ChatGPT, pengguna juga mulai melihat opsi spesifik seperti: Berpikir GPT-5.5 untuk masalah penelitian atau analisis yang kompleks.

Terkait API, OpenAI sedang mengerjakannya. Integrasikan GPT-5.5 dan GPT-5.5 Pro ke dalam endpoint Respons dan Penyelesaian Obrolan Anda. dengan jendela konteks yang mencapai satu juta token. Perusahaan tersebut menyatakan bahwa akses akan diperluas seiring terpenuhinya persyaratan keamanan internal dan kapasitas infrastruktur, sehingga pengembang dapat mengintegrasikan model tersebut ke dalam aplikasi mereka sendiri setelah fase ini selesai.

Hadirnya GPT-5.5 memperkuat perubahan tahapan dalam evolusi ChatGPT: Fokusnya bergeser dari sekadar menghasilkan teks ke otomatisasi komprehensif tugas-tugas digital, dengan model yang lebih otonom yang mampu bernalar dalam jangka waktu lebih lama dan bekerja pada sistem nyata, dengan konsekuensi harga yang lebih tinggi dan perdebatan yang semakin meningkat seputar keamanan dan tata kelola.Dalam konteks Eropa di mana regulasi AI semakin maju dan perusahaan berupaya mencapai efisiensi tanpa kehilangan kendali, cara organisasi, pengembang, dan administrasi mengadopsi—atau membatasi—penggunaan GPT-5.5 mungkin sama relevannya dengan angka-angka acuan yang menyertai model baru ini.

Agen ChatGPT
Artikel terkait:
Agen ChatGPT: Lompatan OpenAI ke agen otonom untuk mengotomatiskan tugas-tugas kompleks