OpenAI resmi meluncurkan GPT-5.2, model kecerdasan buatan terbaru yang difokuskan untuk kebutuhan kerja profesional. Model ini disebut sebagai versi paling matang sejauh ini, dengan peningkatan signifikan pada akurasi, kecepatan, serta pemahaman konteks panjang. Chief Product Officer OpenAI, Fidji Simo, menegaskan bahwa GPT-5.2 dirancang untuk membantu pekerjaan kantoran sehari-hari, mulai dari pengolahan spreadsheet, pembuatan presentasi, penulisan kode, hingga pengelolaan proyek kompleks.
Sejak penggunaan awal, OpenAI mengklaim perbedaan performa GPT-5.2 langsung terasa. Model ini dinilai lebih terstruktur, konsisten mengikuti instruksi, serta tetap stabil untuk percakapan panjang dan kolaborasi intensif.
Tiga Varian untuk Kebutuhan Berbeda
GPT-5.2 hadir dalam tiga varian utama. GPT-5.2 Instant menangani tugas ringan dengan respons cepat, sementara GPT-5.2 Thinking fokus pada logika, analisis mendalam, dan perencanaan kompleks. Sementara itu, GPT-5.2 Pro menawarkan presisi tertinggi untuk penyelesaian masalah tingkat lanjut.
Peluncuran ini terjadi di tengah persaingan ketat industri AI, terutama setelah muncul kekhawatiran internal OpenAI terhadap perkembangan pesat kompetitor seperti Google Gemini.
Unggul dalam Benchmark Profesional
Dalam berbagai pengujian, GPT-5.2 menunjukkan performa kuat untuk kebutuhan profesional. Varian Thinking memimpin di SWE-Bench Pro, tolok ukur pemrograman dunia nyata, serta GPQA Diamond, tes penalaran ilmiah tingkat pascasarjana. Selain itu, evaluasi internal GDPval menunjukkan GPT-5.2 Thinking mampu menyamai atau melampaui kinerja profesional industri pada 70,9 persen tugas di 44 bidang pekerjaan.
OpenAI menilai model ini dapat menyelesaikan pekerjaan serupa hingga 11 kali lebih cepat dengan biaya yang jauh lebih rendah dibanding tenaga ahli manusia.
Akurasi Lebih Baik dan Konteks Super Panjang
Dari sisi keandalan, GPT-5.2 tercatat 30 persen lebih jarang menghasilkan jawaban keliru dibanding GPT-5.1 Thinking. Peningkatan ini dianggap penting bagi profesional yang mengandalkan AI untuk riset dan pengambilan keputusan, meski verifikasi tetap disarankan untuk tugas kritis.
Selain itu, GPT-5.2 Thinking mencetak rekor dalam evaluasi MRCRv2, dengan akurasi nyaris sempurna pada konteks hingga 256.000 token. Dengan kemampuan ini, GPT-5.2 semakin mendekati peran asisten kerja profesional lintas bidang. Baca berita lain disini.


