OpenAI-nin baş direktoru Sem Altman bildirib ki, onun ən çox sevdiyi film Spike Jonzenin rejissoru olduğu "Her" filmi olub. İndi Altman GPT-4o ilə sevimli filmini canlandırır.
OpenAI indicə real vaxt rejimində səs, şəkil və mətn arasında fikir mübadiləsi apara bilən yeni qabaqcıl AI modeli GPT-4o-nu elan etdi. Cəmi saatlar keçməsinə baxmayaraq, yeni modelin etdikləri olduqca şokedicidir. Şirkətə görə, üz ifadələrinizi oxuya bilən və danışıq dilini real vaxtda tərcümə edə bilən GPT-4o həm də müxtəlif duyğu növlərini təqlid edə bilir. Kino gurusu bu ifadələri dərhal Spike Jonzenin rejissoru olduğu "Her" filmi ilə əlaqələndirə bilər. Çünki vəziyyət tam olaraq belədir.
Bilməyənlər üçün deyim ki, Spike Jonze-nin 2013-cü ildə çəkdiyi "Her" filmində Joaquin Phoenix, Scarlett Johansson tərəfindən səsləndirilən Samantha adlı süni intellekt virtual köməkçisinə aşiq olan, boşanma yolu ilə gedən ürəyi qırılan bir adamı canlandırır. 2023-cü ilin sonlarına doğru OpenAI-nin baş direktoru Sam Altman qatıldığı bir tədbirdə ən çox sevdiyi filmlərdən birinin Onun olduğunu, insanların süni intellektdən necə istifadə etdiyini sevdiyini və filmin son dərəcə proqnozlaşdırıcı olduğunu söylədi.
OpenAI dünən gecə canlı yayımda GPT-4o-nu təqdim edərkən, ondan robotlar və sevgi haqqında hekayə danışmasını istədilər. GPT-4o OpenAI mühəndislərinin və texniki direktor Mira Muratinin istedadlarını nümayiş etdirir, ondan sözlərini kəsməyi və hekayəni müxtəlif tonlarda danışmasını xahiş edir. Süni intellekt otaqda biri kimi gördüklərini etməyə davam edirdi.
Maraqlıdır ki, Sam Altman tədbirdən sonra X-də yerləşdirib və sadəcə olaraq “Onun” yazısını yazıb. Əlbəttə ki, indiki formada GPT-4o filmdəki Samanta qədər bacarıqlı və təkmil deyil, lakin o, olduqca yaxındır. Digər tərəfdən, OpenAI-nin öz inkişafına baxdıqda, GPT-4o ilə atılan addımın miqyasını daha yaxşı başa düşürük.
GPT-4o-nun təfərrüatlarını yuxarıda qeyd etdiyimiz məzmunumuzda dediyimiz kimi, GPT-4o şirkətin digər modelləri kimi deyil. Bütün əvvəlki GPT modelləri bir neçə fərqli modeldən istifadə edərək işləyirdi. Məsələn, səs analizinə üç model cəlb edilib. Bununla belə, GPT-4o ilə hər şey bir modeldə birləşir. Audio, mətn və vizual məlumatlar vahid modellə təhlil edilir və çıxışa çevrilir. Bu, daha sürətli və daha bacarıqlı bir modellə nəticələnir.
Məsələn, əvvəlki versiyada səs rejimi var idi, amma ondan nəsə istəyəndə onun sözünü bitirməsini gözləmək lazım idi. Bununla belə, GPT-4o-da indi danışarkən onun sözünü kəsə və yeni yönləndirmə edə bilərsiniz. Bundan əlavə, o, indi kameranız vasitəsilə dünyanı görə bilər və gördüklərini sizə kəskin dəqiqliklə çatdıra bilər.
Yeni funksiyalar yaxın həftələrdə məhdud "alfa" buraxılışda əlçatan olacaq və daha geniş yayılmağa başlayan kimi ilk olaraq ChatGPT Plus abunəçiləri üçün əlçatan olacaq. Bəzi qabaqcıl xüsusiyyətlər də bu gündən etibarən pulsuz versiyaya və digər ödənişli səviyyələrə əlavə edildi.
Məzmunumuzun son hissəsini Sam Altmanın dünən dərc olunmuş bloq yazısından cümlələrlə bitirək: "Yeni audio (və video) rejimi indiyə qədər istifadə etdiyim ən yaxşı kompüter interfeysidir. Bu, filmlərdəki süni intellekt kimi hiss olunur; və o Onun real olması mənim üçün hələ də bir az təəccüblüdür. Onun insan səviyyəsində reaksiya müddəti var və ifadəli gücə nail olmaq böyük bir dəyişiklik kimi görünür."