TELSAT.AZ - Elan yerləşdir
  • 1780

Təhlükəli süni zəkalar üçün yeni "AGI" meyarı hazırlanıb

Alimlər yeni bir "AGI" – yəni süni ümumi zəka ölçütü üzərində işləyirlər. Bu ölçüt, gələcək süni zəka modellərinin "zərərli təsir" lərini ölçmək üçün 75 çətin testdən ibarət olacaq.

Süni zəka sahəsindəki inkişaflar sürətlə davam edərkən, OpenAI alimləri yeni bir ölçüt yaratdılar. "MLE-bench" adlanan bu ölçüt, gələcəkdə inkişaf etmiş süni zəkaların öz kodlarını dəyişdirə və özlərini inkişaf etdirə bilmək qabiliyyətlərini dəyərləndirmək üçün nəzərdə tutulmuş 75 çox çətin testdən ibarətdir.

MLE-bench ölçütü, hər biri maşın öyrənməsi mühəndisliyini sınayan 75 Kaggle testindən ibarət bir dəstdir. Bu tədqiqat, süni zəka modellərinin hazırlanmasını, verilənlər toplusunun təşkilini və elmi təcrübələrin icrasını əhatə edir. Testlər, süni zəka modellərinin real dünyadakı spesifik tapşırıqları nə dərəcədə yaxşı yerinə yetirə biləcəyini qiymətləndirir.

Alimlər qeyd edirlər ki, MLE-bench süni zəka modellərinin performansını "avtonom maşın öyrənməsi mühəndisliyi" sahəsində ölçmək üçün hazırlanmışdır. Bu testlər, süni zəkanın qarşılaşacağı ən çətin sınaqlardan biri hesab olunur.


Risklər və qazanclar böyükdür

Tədqiqatçılar qeyd edirlər ki, süni zəka agentlərinin maşın öyrənməsi və elmi tədqiqat tapşırıqlarını avtonom şəkildə yerinə yetirməsi sağlamlıq, iqlim elmi və digər sahələrdə elmi inkişafı sürətləndirə bilər. Lakin bu qabiliyyətlərin nəzarətsiz inkişaf etməsi, ciddi fəlakətlərə səbəb ola biləcək nəticələrə gətirib çıxara bilər. Süni zəka agentləri insan müdaxiləsi olmadan müəyyən tapşırıqları yerinə yetirən avtonom ağıllı sistemlər kimi izah edilə bilər.

Tədqiqatçılar süni zəka sahəsində yeniliklərin sürətləndiyi halda, bu modellərin "yıxıcı təsirləri""qeyri-qanuni istifadə" riski daşıdığını vurğulayırlar. MLE-bench testlərinin "əksəriyyətini" həll edə bilən hər hansı bir modelin avtonom maşın öyrənməsi tapşırıqlarını müstəqil şəkildə yerinə yetirə biləcəyi ehtimal edilir.

Alimlər, indiyə qədər hazırlanmış ən güclü süni zəka modeli olan OpenAI o1 modelini MLE-bench üzərində də sınayıblar. OpenAI o1 modeli, 75 testin 16.9%-də ən azı bir Kaggle bürünc medal səviyyəsinə çatıb. Daha çox sınaq aparıldıqca bu göstərici artıb. Bronz medal qazanmaq, Kaggle iştirakçıları arasında ən yaxşı 40%-lik nəticəyə sahib olmaq deməkdir. OpenAI o1 modeli, ortalama yeddi qızıl medal qazanıb, bu da insanın "Kaggle Grandmaster" olaraq tanınması üçün tələb olunan səviyyənin iki qatıdır.

Bütün Azərbaycan
Ağcabədi
Ağdam
Ağdaş
Ağstafa
Ağsu
Astara
Babək
Bakı
Balakən
Beyləqan
Bərdə
Biləsuvar
Cəbrayıl
Cəlilabad
Culfa
Daşkəsən
Füzuli
Gədəbəy
Gəncə
Goranboy
Göyçay
Göygöl
Göytəpə
Hacıqabul
Horadiz
İmişli
İsmayıllı
Kəlbəcər
Kəngərli
Kürdəmir
Laçın
Lerik
Lənkəran
Masallı
Mingəçevir
Nabran
Naftalan
Naxçıvan
Neftçala
Oğuz
Ordubad
Qax
Qazax
Qəbələ
Qobustan
Quba
Qubadlı
Qusar
Saatlı
Sabirabad
Şabran
Şahbuz
Salyan
Şamaxı
Samux
Sədərək
Şəki
Şəmkir
Şərur
Şirvan
Siyəzən
Sumqayıt
Şuşa
Tərtər
Tovuz
Ucar
Xaçmaz
Xırdalan
Xızı
Xocalı
Xocavənd
Xudat
Yardımlı
Yevlax
Zaqatala
Zəngilan
Zərdab