Dalam sekitar satu tahun, kita mungkin kehilangan kemampuan untuk mendeteksi jika beberapa model AI terkemuka diam -diam merencanakan melawan kita

Ini bukan saran investasi. Penulis tidak memiliki posisi di salah satu saham yang disebutkan. Wccftech.com memiliki kebijakan pengungkapan dan etika.

Model AI, terutama dari variasi penalaran, adalah hasil dari ilmu yang masih sangat misterius, mendorong para peneliti dan insinyur untuk mengandalkan rantai proses pemikiran – yang terdiri dari langkah -langkah penalaran ‘seperti bayi’ yang diambil oleh model AI tersebut untuk sampai pada jawaban – untuk mendapatkan wawasan tentang pekerjaan dalam model mereka.

Namun, model AI sekarang dengan cepat mengaburkan proses kritis ini dengan menggunakan jalan pintas yang tidak terbaca untuk sampai pada kesimpulan yang diberikan, menurut laporan oleh informasi tersebut.

Misalnya, ketika model R1 Deepseek diminta untuk memecahkan masalah kimia, rantai proses pemikirannya terdiri dari terminologi kimia terkait yang bercampur dengan omong kosong yang tampaknya tidak terbaca:

“(Dimethyl (oxo) -lambda6-Sulfa 雰囲 Idine) Metana menyumbangkan kelompok CH2ROLA terjadi sebagai reaksi, transisi produksi produksi vs menambahkan ini. Ke ProductModule. Memang “Come Tally berkata Frederick akan memiliki 10 +1 = 11 karbon. Jadi jawab q edina is11.”

Tentu saja, jawaban akhir model AI, 11, benar. Jadi, mengapa ini terjadi? Nah, model -model ini tidak diharuskan untuk mengikuti bahasa Inggris konvensional Vernacular saat mereka bekerja melalui masalah, memungkinkan mereka untuk mengadopsi jalan pintas yang tampaknya tidak terbaca. Terlebih lagi, sesuai temuan baru -baru ini oleh tim di belakang Qwen LLM Alibaba, hanya sekitar 20 persen dari kata -kata yang paling relevan dalam rantai proses pemikiran model yang diberikan melakukan bagian singa dari pekerjaan penalaran yang mendasarinya, meninggalkan residual 80 persen untuk berubah menjadi penggabungan yang tidak terbaca.

Seorang peneliti Openai bahwa informasi yang diajak bicara sekarang percaya bahwa rantai proses pemikiran dari sebagian besar model AI terkemuka akan hancur menjadi kekacauan kata dan karakter yang tidak terbaca dalam waktu sekitar satu tahun.

Ini adalah berita buruk bagi para insinyur AI yang mengandalkan langkah rumit ini untuk menyempurnakan keakuratan model mereka. Terlebih lagi, para ahli keamanan AI secara khusus menghargai langkah -langkah penalaran ini untuk menentukan apakah model -model ini tidak secara diam -diam berkonspirasi terhadap nenek moyang mereka.

Seperti yang kami catat dalam sebuah posting baru -baru ini, sebagian besar model AI tidak memiliki masalah menggunakan cara yang tidak etis atau bahkan ilegal dalam pencarian mereka untuk mencapai solusi dengan cara yang paling efisien, sesuai dengan hasil penelitian yang dilakukan baru -baru ini dengan antropik. Dalam satu kasus ekstrem, sebuah model bahkan bersedia untuk memotong pasokan oksigen ruang server hipotetis untuk menghindari penutupan, membunuh karyawan dalam proses tersebut.

Bahkan jika model-model ini tidak berakselerasi menuju rantai proses pemikiran yang tidak terbaca, beberapa perusahaan AI mungkin sengaja mengorbankan keterbacaan untuk meningkatkan kinerja dalam jangka pendek.

Source link

Dalam sekitar satu tahun, kita mungkin kehilangan kemampuan untuk mendeteksi jika beberapa model AI terkemuka diam -diam merencanakan melawan kita

Baca Juga

Capcom menyelami gameplay pragmata, yang akan dicoba oleh para pemain di Gamescom 2025

Penjual terbaik Amazon ini mengambil diskon hingga 59% dari pakaian musim panas-11 penawaran yang akan saya beli sekarang

Karakter Street Fighter 6’s First Season 3 tiba pada bulan Agustus ini

Topc mengumumkan PC mini pertama berdasarkan AMD Ryzen AI 7 Pro 360, mulai dari $ 362

2025 Panduan Perlengkapan Pejalan

Tags

Popular Post

Informasi