OpenAI tərəfindən dəstəklənən humanoid robot şirkəti 1X-dən təsirli iş videosu

OpenAI tərəfindən dəstəklənən humanoid robot şirkəti 1X-dən təsirli iş videosu

OpenAI tərəfindən dəstəklənən bir insanabənzər robot şirkəti olan 1X, Eve adlı robotu ilə tapşırıqları zəncirləməyə yönəldir. Ardıcıl tapşırıqları yerinə yetirə bilən robot tam muxtariyyətə yaxınlaşır.

ChatGPT-nin 2022-ci ilin noyabrında buraxılmasından sonra yaşanan süni intellekt inkişafları kimi, insanabənzər robotlar tərəfində də bənzər bir inkişaf baş verdi. İlk ChatGPT və ya ondan əvvəl oxşar olanlar yalnız sual-cavab formatında işləyirdi. Halbuki, bu gün biz onlara tapşırıq verib, həmin tapşırığın tələblərini yerinə yetirə bilərik. ChatGPT tərtibatçısı OpenAI tərəfindən dəstəklənən humanoid robot şirkəti 1X məhz bunu öz robotu Eve-ə daxil etməyə çalışır.
 


Robotlar zəncirvari tapşırıqları yerinə yetirirlər

1X təhlükəsiz, ağıllı androidlər vasitəsilə fiziki əməyi təmin etmək istəsə də, atdığı addımlar da bu məqsədə xidmət edir. Şirkət tərəfindən yayımlanan yeni videoda insanabənzər robot Həvvanın bir-birinin ardınca avtonom tapşırıqları yerinə yetirmə qabiliyyəti nümayiş etdirilir. Bununla belə, şirkət bunun səyahətin yalnız başlanğıcı olduğunu da vurğulayır.

Şirkət əvvəllər bir çox tapşırıqları vahid hədəf şərti neyron şəbəkəsində birləşdirə bilən avtonom model hazırlamışdı. Bununla belə, multitask modelləri kiçik olduqda (<100M parametrlər), bir tapşırığın davranışını düzəltmək üçün məlumatların əlavə edilməsi çox vaxt digər tapşırıqlardakı davranışa mənfi təsir göstərirdi. Parametrlərin sayını artırmaq bunun üçün ilk həll yolu kimi ağla gəlsə də, bu dəfə təlim daha uzun çəkir və robotun davranışını yaxşılaşdırmaq üçün hansı göstəricilərin toplanması lazım olduğunu gecikdirir.

Beləliklə, bir neyron şəbəkəsi ilə bir çox işi yerinə yetirə bilən ümumi robot yaratarkən məlumatları necə tez təkrarlaya bilərik? 1X-in buna cavabı olduqca ağıllıdır. Firma deyir ki, o, tapşırıq performansını tez bir zamanda təkmilləşdirmək qabiliyyətini çoxsaylı imkanların vahid neyron şəbəkəsində birləşdirilməsi prosesindən ayırır. Buna nail olmaq üçün firma qısamüddətli imkanları bir neçə kiçik modeldə daha uzun imkanlara zəncirləmək üçün səslə idarə olunan təbii dil interfeysi yaratdı.

Bu məqamda sizə aşağıdakı yeni videoya baxmağı tövsiyə edirəm. Bu video göstərir ki, uzunmüddətli davranışlar bacarıq zəncirini idarə edən insanlar sayəsində əldə edilir.

İnsanlar uzunmüddətli tapşırıqları asanlıqla yerinə yetirə bilsələr də, çoxsaylı avtonom robot bacarıqlarını ardıcıllıqla zəncirləmək çətindir, çünki hər bir sonrakı bacarıq əvvəlki bacarığın nəticələrinə dair ümumiləşdirmə tələb edir. Bu vəziyyət hər bir ardıcıl bacarıqla artır: buna görə də üçüncü bacarıq ikinci bacarığın nəticələrinin dəyişkənliyini idarə etməlidir və bu davam edir.

 

İnsan diktəsi yeni məlumat fondu yaradır

İnsanlar uzunmüddətli tapşırıqları çətinliklə yerinə yetirə bilsələr də, bunu robotlarla təkrarlamaq bu ardıcıl variasiyaların mürəkkəbliyini aradan qaldırmağı tələb edir. İstifadəçi nöqteyi-nəzərindən robot bir çox təbii dil tapşırıqlarını yerinə yetirə bilər və robotu idarə edən modellərin faktiki sayı mücərrəddir. Bu, bizə zamanla tək vəzifəli modelləri hədəf şərtləndirilmiş modellərlə birləşdirməyə imkan verir.
 


Tək tapşırıqlı modellər kölgə rejiminin qiymətləndirilməsi üçün möhkəm zəmin yaradır və komandaya sınaq zamanı yeni modelin proqnozlarını mövcud baza ilə müqayisə etməyə imkan verir. Hədəf şərti model tək vəzifəli modelin proqnozlarına yaxşı uyğunlaşdıqdan sonra 1X istifadəçi iş axını dəyişdirmədən daha güclü, vahid modelə keçə biləcəklərini söyləyir.

Robotlara rəhbərlik etmək üçün bu yüksək səviyyəli dil interfeysindən istifadə məlumatların toplanması üçün tamamilə yeni bir qapı açır. Tək bir robotu idarə etmək üçün VR-dən istifadə etmək əvəzinə, operator birdən çox robotu təbii dillə idarə edə bilər. Bu təlimat nadir hallarda göndərildiyi üçün insanlar robotların yanında olmaq məcburiyyətində deyil və onları uzaqdan idarə edə bilərlər.

Eyni zamanda, 1X videodakı robotların insan rəhbərliyinə əsaslanaraq vəzifələri dəyişdirdiyini və buna görə də avtonom olmadığını söyləyir. Görmə və təbii dil əmr cütlərinin verilənlər toplusunu yaratdıqdan sonra növbəti addım yüksək səviyyəli hərəkətlərin proqnozlarını avtomatlaşdırmaqdır. 1X deyir ki, bunlar GPT-4o, VILAGemini Vision kimi multimodal, görmə qabiliyyətinə malik dil modelləri ilə baş verə bilər.

Şərhlər