Təhlükəli süni zəkalar üçün yeni "AGI" meyarı hazırlanıb

Təhlükəli süni zəkalar üçün yeni "AGI" meyarı hazırlanıb

Alimlər yeni bir "AGI" – yəni süni ümumi zəka ölçütü üzərində işləyirlər. Bu ölçüt, gələcək süni zəka modellərinin "zərərli təsir" lərini ölçmək üçün 75 çətin testdən ibarət olacaq.

Süni zəka sahəsindəki inkişaflar sürətlə davam edərkən, OpenAI alimləri yeni bir ölçüt yaratdılar. "MLE-bench" adlanan bu ölçüt, gələcəkdə inkişaf etmiş süni zəkaların öz kodlarını dəyişdirə və özlərini inkişaf etdirə bilmək qabiliyyətlərini dəyərləndirmək üçün nəzərdə tutulmuş 75 çox çətin testdən ibarətdir.

MLE-bench ölçütü, hər biri maşın öyrənməsi mühəndisliyini sınayan 75 Kaggle testindən ibarət bir dəstdir. Bu tədqiqat, süni zəka modellərinin hazırlanmasını, verilənlər toplusunun təşkilini və elmi təcrübələrin icrasını əhatə edir. Testlər, süni zəka modellərinin real dünyadakı spesifik tapşırıqları nə dərəcədə yaxşı yerinə yetirə biləcəyini qiymətləndirir.

Alimlər qeyd edirlər ki, MLE-bench süni zəka modellərinin performansını "avtonom maşın öyrənməsi mühəndisliyi" sahəsində ölçmək üçün hazırlanmışdır. Bu testlər, süni zəkanın qarşılaşacağı ən çətin sınaqlardan biri hesab olunur.


Risklər və qazanclar böyükdür

Tədqiqatçılar qeyd edirlər ki, süni zəka agentlərinin maşın öyrənməsi və elmi tədqiqat tapşırıqlarını avtonom şəkildə yerinə yetirməsi sağlamlıq, iqlim elmi və digər sahələrdə elmi inkişafı sürətləndirə bilər. Lakin bu qabiliyyətlərin nəzarətsiz inkişaf etməsi, ciddi fəlakətlərə səbəb ola biləcək nəticələrə gətirib çıxara bilər. Süni zəka agentləri insan müdaxiləsi olmadan müəyyən tapşırıqları yerinə yetirən avtonom ağıllı sistemlər kimi izah edilə bilər.

Tədqiqatçılar süni zəka sahəsində yeniliklərin sürətləndiyi halda, bu modellərin "yıxıcı təsirləri""qeyri-qanuni istifadə" riski daşıdığını vurğulayırlar. MLE-bench testlərinin "əksəriyyətini" həll edə bilən hər hansı bir modelin avtonom maşın öyrənməsi tapşırıqlarını müstəqil şəkildə yerinə yetirə biləcəyi ehtimal edilir.

Alimlər, indiyə qədər hazırlanmış ən güclü süni zəka modeli olan OpenAI o1 modelini MLE-bench üzərində də sınayıblar. OpenAI o1 modeli, 75 testin 16.9%-də ən azı bir Kaggle bürünc medal səviyyəsinə çatıb. Daha çox sınaq aparıldıqca bu göstərici artıb. Bronz medal qazanmaq, Kaggle iştirakçıları arasında ən yaxşı 40%-lik nəticəyə sahib olmaq deməkdir. OpenAI o1 modeli, ortalama yeddi qızıl medal qazanıb, bu da insanın "Kaggle Grandmaster" olaraq tanınması üçün tələb olunan səviyyənin iki qatıdır.

Şərhlər