Claude 4 kode tujuh jam berturut -turut – produktivitas Anda baru saja berubah

Sebagian besar model AI berhenti pada Anda setelah beberapa menit. Claude Opus 4 Just Kode selama tujuh jam berturut -turut tanpa berkeringat. Itu bukan hiperbola – itulah yang terjadi ketika Rakuten melempar proyek refactoring yang kompleks di model andalan terbaru Anthropic.

Tes kinerja nyata yang penting

Lupakan tolok ukur pemasaran sebentar. Inilah yang terjadi: Racuten memvalidasi kemampuan Claude Opus 4 dengan refaktor open-source yang menuntut berjalan secara mandiri untuk 7 jam dengan kinerja berkelanjutan. Asisten AI khas Anda akan menyerah atau kehilangan konteks setelah jam pertama.

Kedua model disetel untuk berkinerja baik pada tugas pemrograman, membuatnya cocok untuk menulis dan mengedit kode. Tapi di sinilah itu menjadi menarik – mereka bukan hanya kode. Model ini bisa Cari webgunakan beberapa alat secara bersamaan, dan bangun apa yang disebut antropik “pengetahuan diam -diam” dari waktu ke waktu.

Pikirkan seperti ini: alih-alih meminta Anda untuk mengasuh anak di setiap langkah, Claude Opus 4 memberikan kinerja yang berkelanjutan pada tugas yang sudah berjalan lama yang membutuhkan upaya yang terfokus dan ribuan langkahdengan kemampuan untuk bekerja terus menerus selama beberapa jam. Perbedaan antara mempekerjakan seorang pekerja suhu dan membawa seseorang yang menyelesaikan pekerjaan.

Apa arti “penalaran hibrida” sebenarnya bagi Anda

Opus 4 Dan Sonnet 4 adalah “model hibrida” yang mampu melakukan respons hampir instan dan pemikiran yang diperluas untuk penalaran yang lebih dalam. Anda tidak terjebak menunggu tiga menit bagi Claude untuk memberi tahu Anda cuaca, tetapi ketika Anda membutuhkannya untuk memecahkan masalah yang rumit, itu bisa dipikirkan selama diperlukan.

Model menunjukkan kepada Anda ringkasan “ramah pengguna” dari proses pemikiran mereka daripada rantai penalaran penuh. Mengapa tidak menunjukkan semuanya? Sebagian untuk melindungi Keuntungan kompetitif antropikperusahaan mengakui. Cukup adil-Anda mungkin tidak ingin membaca melalui jam-jam aliran kesadaran AI.

Tim perusahaan sudah beralih

Pengadopsi awal melihat transformasi alur kerja langsung. Kursor menyebutnya canggih untuk pengkodean dan lompatan ke depan dalam pemahaman basis kode yang kompleks. Replit Laporan meningkatkan presisi dan kemajuan dramatis untuk perubahan kompleks di beberapa file.

Alur kerja tim pengembangan Anda mendapatkan upgrade yang sama dengan ponsel Anda saat Anda beralih dari memeriksa voicemail ke membaca teks. Perbedaan antara mengasuh anak melalui setiap langkah versus menugaskannya sebuah proyek dan memeriksa kembali beberapa jam kemudian bukan hanya kenyamanan – itu a Pergeseran mendasar dalam cara Anda berkolaborasi dengan AI.

Alur kerja tim pengembangan Anda baru saja mendapatkan upgrade yang sama dengan ponsel Anda saat Anda beralih dari memeriksa voicemail ke membaca teks. Perbedaan antara mengasuh AI melalui setiap langkah versus menugaskannya sebuah proyek dan memeriksa kembali beberapa jam kemudian bukan hanya kenyamanan – ini adalah perubahan mendasar dalam cara Anda berkolaborasi dengan AI. Dalam paradigma baru ini, Claude adalah Asisten Eksekutif Digital Anda, Tugas Pengkodean Multi-Langkah Kompleks secara otonom sehingga tim Anda dapat fokus pada tujuan tingkat yang lebih tinggi.

GitHub Keputusan untuk menggabungkan Claude Sonnet 4 sebagai model dasar untuk agen pengkodean baru mereka mengirimkan sinyal yang jelas. Kapan Microsoft Memilih AI Anda daripada model perusahaan induknya, itulah yang setara dengan pemilihan wifi tetangga Anda sendiri.

Pemeriksaan Realitas Harga

Untuk API Anthropic, melalui platform landasan Amazon dan Google Vertex AIOpus 4 akan dihargai $ 15/$ 75 per juta token (input/output) dan soneta 4 di $ 3/$ 15 per juta token. Kemitraan ini bukan kebetulan – Amazon menggandakan AI dengan investasi $ 4 miliar dalam antropik, menandakan komitmen mendalam mereka untuk masa depan AI generatif dan memastikan kemampuan Claude tersedia dalam skala untuk pelanggan perusahaan.

Jika Anda seorang pengguna gratis, Anda mendapatkan Sonnet 4, tetapi bukan Opus 4. Baik pengguna yang membayar dan pengguna aplikasi chatbot gratis perusahaan akan mendapatkan akses ke Sonnet 4 tetapi hanya pengguna yang membayar akan mendapatkan akses ke Opus 4. Ini adalah pendekatan yang masuk akal – memberi setiap orang pemain yang solid, biaya untuk pembangkit tenaga listrik.

Mengapa ini penting

Kapan Girub Kata Claude Sonnet 4 melonjak dalam skenario agen dan akan memberi daya pada agen pengkodean baru mereka di Github Copilot, perhatikan. Microsoft tidak membuat kemitraan ini ringan.

Itu Pengkodean otonom tujuh jam Kemampuan bukan hanya demo teknologi – itu adalah bukti bahwa AI akhirnya dapat menangani jenis pekerjaan yang berkelanjutan dan kompleks itu memajukan proyek. Apakah Anda ingin mengaudit penalaran AI tujuh jam, atau Anda menginginkan hasil yang berhasil?

Langkah Anda, Openai.