Kratka povijest umjetne inteligencije

U ranim danima umjetne inteligencije računalni su znanstvenici pokušali ponovno stvoriti aspekte ljudskog uma u računalu. Ovo je vrsta inteligencije koja je stvar znanstvene fantastike - strojevi koji misle, manje-više, poput nas. Ova vrsta inteligencije naziva se, što nije iznenađujuće, razumljivošću. Računalo s razumljivošću može se koristiti za istraživanje načina razmišljanja, učenja, prosudbe, opažanja i izvršavanja mentalnih radnji.

Rano istraživanje razumljivosti bilo je usredotočeno na modeliranje dijelova stvarnog svijeta i uma (iz područja kognitivnih znanstvenika) u računalu. Izvanredno je ako uzmete u obzir da su se ovi eksperimenti odvijali prije gotovo 60 godina.

Rani modeli inteligencije bili su usredotočeni na deduktivno zaključivanje kako bi se došlo do zaključaka. Jedan od najranijih i najpoznatijih programa AI ove vrste bio je Teoretičar logike, napisan 1956. godine kako bi oponašao vještine rješavanja problema čovjeka. Teoretičar logike ubrzo je dokazao 38 od prva 52 teorema u drugom poglavlju Principia Mathematica , zapravo poboljšavajući jedan teorem u procesu. Po prvi puta je jasno pokazano da stroj može izvoditi zadatke za koje se do ovog trenutka smatralo da trebaju inteligenciju i kreativnost.

Ubrzo su se istraživanja okrenula drugoj vrsti razmišljanja, induktivnom zaključivanju. Induktivno zaključivanje ono je što znanstvenik koristi kada istražuje podatke i pokušava iznijeti hipotezu kako bi ih objasnio. Kako bi proučavali induktivno rasuđivanje, istraživači su stvorili kognitivni model zasnovan na znanstvenicima koji rade u NASA-inom laboratoriju, pomažući im da identificiraju organske molekule koristeći svoje znanje iz organske kemije. Program Dendral bio je prvi stvarni primjer drugog obilježja umjetne inteligencije, instrumentarnosti , skupa tehnika ili algoritama za izvršavanje zadatka induktivnog zaključivanja, u ovom slučaju identifikacije molekula.

Dendral je bio jedinstven jer je sadržavao i prvu bazu znanja, skup if / then pravila koja su obuhvatila znanje znanstvenika, koja se koristila zajedno s kognitivnim modelom. Taj oblik znanja kasnije će se nazvati  ekspertnim sustavom . Raspoloživost obje vrste "inteligencije" u jednom programu omogućila je računalnim znanstvenicima da postave pitanje: "Što pojedine znanstvenike čini toliko boljima od drugih? Imaju li vrhunske kognitivne vještine ili veće znanje? "

Potkraj 1960-ih odgovor je bio jasan. Izvedba Dendrala bila je gotovo u potpunosti funkcija količine i kvalitete znanja stečenog od stručnjaka. Kognitivni model bio je samo slabo povezan s poboljšanjima u izvedbi.

Ova spoznaja dovela je do velike promjene paradigme u zajednici umjetne inteligencije. Inženjerstvo znanja pojavilo se kao disciplina za modeliranje određenih domena ljudske stručnosti pomoću stručnih sustava. A ekspertski sustavi koje su stvorili često su nadmašili učinke bilo kojeg donositelja ljudskih odluka. Ovaj izvanredan uspjeh izazvao je veliko oduševljenje ekspertnim sustavima unutar zajednice umjetne inteligencije, vojske, industrije, investitora i popularnog tiska.

Kako su ekspertski sustavi postali komercijalno uspješni, istraživači su se usredotočili na tehnike za modeliranje tih sustava i učinili ih fleksibilnijima na različitim domenama. U tom je razdoblju AI zajednica razvila objektno orijentirani dizajn i hijerarhijske ontologije, a prihvatili su ih drugi dijelovi računalne zajednice. Danas su hijerarhijske ontologije u središtu grafikona znanja, koji su posljednjih godina ponovno oživjeli.

Dok su se istraživači zaustavili na obliku predstavljanja znanja poznatom kao „proizvodna pravila“, obliku logike predikata prvog reda, otkrili su da se sustavi mogu automatski učiti; tj. sustavi mogu sami napisati ili prepisati pravila kako bi poboljšali izvedbu na temelju dodatnih podataka. Dendral je modificiran i dobio je sposobnost da nauči pravila masene spektrometrije na temelju empirijskih podataka iz pokusa.

Koliko god su ti ekspertski sustavi bili dobri, oni su imali ograničenja. Općenito su bili ograničeni na određenu domenu problema i nisu se mogli razlikovati od više vjerojatnih alternativa ili koristiti znanje o strukturi ili statističkoj korelaciji. Kako bi se pozabavili nekim od ovih problema, istraživači su dodali čimbenike sigurnosti - numeričke vrijednosti koje su ukazivale na vjerojatnost da je određena činjenica istinita.

Početak druge promjene paradigme u AI dogodio se kad su istraživači shvatili da se faktori sigurnosti mogu umotati u statističke modele. Statistika i Bayesov zaključak mogu se koristiti za modeliranje stručnosti domene iz empirijskih podataka. Od ovog trenutka naprijed, umjetnom inteligencijom sve će više dominirati strojno učenje.

Ipak postoji problem. Iako tehnike strojnog učenja kao što su slučajne šume, neuronske mreže ili GBT (stabla potaknuta gradijentom) daju točne rezultate, one su gotovo neprobojne crne kutije. Bez razumljivih rezultata, modeli strojnog učenja u nekoliko su aspekata manje korisni od tradicionalnih modela. Na primjer, s tradicionalnim modelom AI, praktičar može pitati:

  • Zašto je model napravio ovu pogrešku?
  • Je li model pristran?
  • Možemo li dokazati poštivanje propisa?
  • Zašto se model ne slaže sa stručnjakom za domenu?

Nedostatak razumljivosti ima i implikacije na trening. Kada se model pokvari i ne može objasniti zašto, to ga čini težim za popravljanje. Dodati još primjera? Kakvi primjeri? Iako u međuvremenu možemo napraviti neke jednostavne kompromise, poput prihvaćanja manje točnih predviđanja u zamjenu za razumljivost, sposobnost objašnjavanja modela strojnog učenja pojavila se kao jedna od sljedećih velikih prekretnica koju treba postići u AI.

Kažu da se povijest ponavlja. Rana istraživanja AI, poput današnjih, bila su usmjerena na modeliranje ljudskog rasuđivanja i kognitivnih modela. Tri glavna pitanja s kojima se suočavaju rani istraživači umjetne inteligencije - znanje, objašnjenje i fleksibilnost - također ostaju središnja za suvremene rasprave o sustavima strojnog učenja.

Znanje sada ima oblik podataka, a potreba za fleksibilnošću može se vidjeti u krhkosti neuronskih mreža, gdje lagana poremećaja podataka daju dramatično različite rezultate. Objašnjivost se također pojavila kao glavni prioritet za istraživače umjetne inteligencije. Pomalo je ironično kako smo, 60 godina kasnije, od pokušaja preslikavanja ljudskog mišljenja prešli na postavljanje pitanja strojevima kako oni razmišljaju.