Ar šiandieniniai dirbtinio intelekto modeliai tikrai prisimena, mąsto, planuoja ir samprotauja, kaip tai darytų žmogaus smegenys? Kai kurios AI laboratorijos norėtų patikėti, kad taip yra, tačiau, pasak „Meta“ vyriausiojo AI mokslininko Yann LeCun, atsakymas yra ne. Tačiau jis mano, kad tai galėtume pasiekti per dešimtmetį, taikydami naują metodą, vadinamą „pasaulio modeliu“.
Anksčiau šiais metais „OpenAI“ išleido naują funkciją, vadinamą „atmintimi“, kuri leidžia „ChatGPT“ „atsiminti“ jūsų pokalbius. Naujausios kartos paleidimo modeliai o1 generuojant išvestį rodo žodį „mąstymas“, o „OpenAI“ teigia, kad tie patys modeliai gali „sudėtingai mąstyti“.
Atrodo, kad esame gana artimi AGI. Tačiau per neseniai Hudsono forume įvykusią pokalbį LeCunas nuvertino dirbtinio intelekto optimistus, tokius kaip xAI įkūrėjas Elonas Muskas ir „Google DeepMind“ įkūrėjas Shane’as Leggas, kurie teigia, kad žmogaus lygio AI yra visai šalia.
„Mums reikia mašinų, kurios supranta pasaulį; (mašinos), kurios gali atsiminti dalykus, turi intuiciją, sveiką protą, dalykus, kurie gali mąstyti ir planuoti tokiu pat lygiu kaip žmonės“, – pokalbio metu sakė LeCunas. „Nepaisant to, ką galbūt girdėjote iš kai kurių entuziastingiausių žmonių, dabartinės AI sistemos to nepajėgia.
LeCun teigia, kad šiandieniniai dideli kalbų modeliai, tokie kaip ChatGPT ir Meta AI, toli gražu nėra „žmogaus lygio AI“. Vėliau jis sakė, kad žmonijai gali pritrūkti „metų ar dešimtmečių“ iki tokio dalyko. (Tačiau tai netrukdo jo viršininkui Markui Zuckerbergui paklausti, kada įvyks AGI.)
Priežastis aiški: tie LLM veikia numatydami kitą žetoną (dažniausiai kelias raides arba trumpą žodį), o šiandieniniai vaizdo / vaizdo įrašų modeliai numato kitą pikselį. Kitaip tariant, kalbos modeliai yra vienmačiai prognozuotojai, o AI vaizdo / vaizdo modeliai yra dvimačiai. Šie modeliai gana gerai nuspėjo savo atitinkamus matmenis, tačiau jie nelabai supranta trimatį pasaulį.
Dėl šios priežasties šiuolaikinės AI sistemos negali atlikti paprastų užduočių, kurias gali atlikti dauguma žmonių. LeCun pažymi, kaip žmonės iki 10 metų išmoksta nuvalyti pietų stalą, o iki 17 metų vairuoti automobilį – ir išmoksta per kelias valandas. Tačiau net ir šiandien pažangiausios pasaulyje AI sistemos, sukurtos remiantis tūkstančiais ar milijonais valandų duomenų, negali patikimai veikti fiziniame pasaulyje.
Siekdami atlikti sudėtingesnes užduotis, LeCun siūlo sukurti trijų dimensijų modelius, kurie galėtų suvokti jus supantį pasaulį, ir sutelkti dėmesį į naujo tipo AI architektūrą: pasaulio modelius.
„Pasaulio modelis yra jūsų psichinis modelis, kaip elgiasi pasaulis“, – paaiškino jis. „Galite įsivaizduoti veiksmų seką, kurią galite atlikti, o jūsų pasaulio modelis leis jums numatyti, kokį poveikį veiksmų seka turės pasauliui.”
Pagalvokite apie „pasaulio modelį“ savo galvoje. Pavyzdžiui, įsivaizduokite, kad žiūrite į netvarkingą miegamąjį ir norite jį išvalyti. Galite įsivaizduoti, kaip pasisektų visų drabužių paėmimas ir padėjimas. Jums nereikia bandyti kelių metodų arba išmokti pirmiausia išvalyti kambarį. Jūsų smegenys stebi trimatę erdvę ir sukuria veiksmų planą, kaip pasiekti tikslą iš pirmo karto. Šis veiksmų planas yra slaptas padažas, kurį žada AI pasaulio modeliai.
Dalis naudos čia yra ta, kad pasaulio modeliai gali priimti žymiai daugiau duomenų nei LLM. Dėl to jie taip pat reikalauja daug skaičiavimo, todėl debesų paslaugų teikėjai lenktyniauja bendradarbiauti su AI įmonėmis.
Pasaulio modeliai yra pagrindinė idėja, kurios dabar siekia kelios AI laboratorijos, ir šis terminas greitai tampa kitu madingu žodžiu, pritraukiančiu rizikos finansavimą. Grupė labai vertinamų dirbtinio intelekto tyrinėtojų, įskaitant Fei-Fei Li ir Justiną Johnsoną, ką tik surinko 230 mln. USD savo startuoliui „World Labs“. „AI krikštamotė“ ir jos komanda taip pat įsitikinusios, kad pasaulio modeliai atrakins žymiai išmanesnes AI sistemas. „OpenAI“ taip pat apibūdina savo neišleistą „Sora“ vaizdo įrašų generatorių kaip pasaulinį modelį, tačiau nesigilino į specifiką.
LeCunas apibūdino idėją, kaip panaudoti pasaulio modelius kuriant žmogaus lygmens AI 2022 m. dokumente apie „objektyviu AI“, nors jis pažymi, kad koncepcijai jau daugiau nei 60 metų. Trumpai tariant, pagrindinis pasaulio vaizdas (pvz., vaizdo įrašas apie nešvarų kambarį) ir atmintis yra įtraukiami į pasaulio modelį. Tada pasaulio modelis pagal šią informaciją numato, kaip pasaulis atrodys. Tada pateikiate pasaulio modeliui tikslus, įskaitant pakeistą pasaulio būseną, kurią norite pasiekti (pvz., švarią patalpą), taip pat apsauginius turėklus, kad modelis nepakenktų žmonėms, kad pasiektų tikslą (nežudykite). prašau, valydama savo kambarį). Tada pasaulio modelis suranda veiksmų seką šiems tikslams pasiekti.
„Meta“ ilgalaikė AI tyrimų laboratorija „FAIR“ arba „Fundamental AI Research“ aktyviai dirba siekdama sukurti objektyviais DI ir pasaulio modelius, teigia LeCun. FAIR anksčiau dirbo su AI būsimiems Meta produktams, tačiau LeCun teigia, kad pastaraisiais metais laboratorija sutelkė dėmesį tik į ilgalaikius AI tyrimus. LeCun sako, kad šiais laikais FAIR net nenaudoja LLM.
Pasaulio modeliai yra intriguojanti idėja, tačiau LeCun sako, kad mes nepadarėme didelės pažangos įgyvendindami šias sistemas. Yra daug labai sunkių problemų, kurias reikia išspręsti iš ten, kur esame šiandien, ir jis sako, kad tai tikrai sudėtingiau, nei mes manome.
„Prireiks metų, kol galėsime čia viską pradėti veikti, jei ne dešimtmetį“, – sakė Lecunas. „Markas Zuckerbergas manęs nuolat klausia, kiek tai užtruks.