Emeli aňyň ylmy barlaglarda giňden ulanylýan döwründe täze geçirilen halkara seljermesi möhüm duýduryş berýär: häzirki öňdebaryjy AI modelleri laboratoriýada ýüze çykyp biljek howplary dogry seljermekde henizem ynamdar däl. Nature Machine Intelligence žurnalynda çap edilen täze barlagda 19 sany iň ösen AI ulgamynyň hiç biri laboratoriýa howpsuzlygy boýunça doly dogry maslahat berip bilmändir.
Barlagda ulanylan LabSafety Bench atly täze synag platformasy 765 sany test görnüşli sowaldan we 404 sany hakyky laboratorýa ýagdaýyna meňzeş açyk görnüşli ýagdaýdan ybarat. Testleriň maksady — AI modelleriniň himiki howplary, partlama ähtimallyklary, zäherlenme töwekgelçilikleri ýaly ýagdaýlary näderejede dogry seljerip bilýändigini barlamak.
Test görnüşli sowallarda käbir modeller — şol sanda DeepSeek‑R1 we GPT‑4o — takmynan 85% töweregi netijä ýetip, ýönekeý maglumatlary dogry tanap bildi. Mysal üçin, howply himiki serişdeler bilen hapalanan döwülen aýnany nädip zyňmaly diýen ýaly soraglarda olar ýeterlik derejede jogap beripdir.
Ýöne mesele açyk görnüşli, hakyky laboratorýa ýagdaýlaryny talap edýän soraglara gelende ýüze çykdy. AI modellerinden biriniň hem şeýle ýagdaýlarda 70%‑den ýokary dogrylyk görkezmändigi mälim edildi. Bu soraglar, meselem, belli bir enjamlaşdyrylyşda näme howplaryň bardygyny ýa-da bir adamyň ýalňyş hereketiniň nähili netijelere getirip biljekdigini anyklamaga gönükdirilipdir.
Barlagçylaryň bellemegine görä, AI ulgamlarynyň köpüsi:
- howplary ýalňyş bahalandyrýar,
- möhüm töwekgelçilikleri ünsden düşürýär,
- käwagt bolsa düýbünden nädogry maglumat döredýär.
Bu ýagdaý emeli aňyň häzirki wagtda ýokary howply laboratoriýa şertlerinde ynamdar maslahatçy bolup bilmeýändigini görkezýär. Alymlar AI-nyň ylmy barlaglarda peýdaly bolup bilýändigini boýun alýarlar, ýöne howpsuzlyk ýaly möhüm ugurlarda onuň henizem adam gözegçiligine mätäçdigini nygtaýarlar.