Pregled: Google Cloud AI osvjetljava strojno učenje

Google ima jedan od najvećih snopova strojnog učenja u industriji, trenutno se fokusira na svoju Google Cloud AI i platformu za strojno učenje. Google je prije mnogo godina izdao TensorFlow kao otvoreni izvor, ali TensorFlow je i dalje najzreliji i citirani okvir dubokog učenja. Slično tome, Google je prije nekoliko godina izdvojio Kubernetes kao otvoreni izvor, ali i dalje je dominantan sustav upravljanja spremnicima.

Google je jedan od glavnih izvora alata i infrastrukture za programere, znanstvenike podataka i stručnjake za strojno učenje, ali u prošlosti Google AI nije bio toliko privlačan za poslovne analitičare kojima nedostaje ozbiljna znanost o podacima ili programiranje. To se počinje mijenjati.

Google Cloud AI i platforma za strojno učenje uključuju AI gradivne blokove, AI platformu i ubrzivače te AI rješenja. AI rješenja prilično su nova i namijenjena su poslovnim menadžerima, a ne znanstvenicima. Oni mogu uključivati ​​savjetovanje od Googlea ili njegovih partnera.

Građevni blokovi AI-a, koji su unaprijed obučeni, ali prilagodljivi, mogu se koristiti bez intimnog znanja o programiranju ili znanosti o podacima. Unatoč tome, vješti ih znanstvenici podataka često koriste iz pragmatičnih razloga, u osnovi kako bi obavili stvari bez opsežne obuke o modelima.

AI platforma i akceleratori općenito su za ozbiljne znanstvenike podataka i zahtijevaju vještinu kodiranja, poznavanje tehnika pripreme podataka i puno vremena za obuku. Preporučujem odlazak tamo tek nakon isprobavanja odgovarajućih građevinskih blokova.

Još uvijek postoje neke poveznice koje nedostaju u ponudama AI-a za Google Cloud, posebno u pripremi podataka. Najbliža stvar koju Google Cloud ima usluzi uvoza i kondicioniranja podataka je Cloud Dataprep treće strane tvrtke Trifacta; Pokušao sam prije godinu dana i bio sam izvan sebe. Inženjering značajki ugrađen u Cloud AutoML tablice obećava, međutim, bilo bi korisno imati takvu uslugu dostupnu za druge scenarije.

Šarena donja strana umjetne inteligencije povezana je s etikom i odgovornošću (ili nedostatkom iste), zajedno s upornim pristranostima modela (često zbog pristranih podataka koji se koriste za trening). Google je svoje principe umjetne inteligencije objavio u 2018. To je posao koji je u tijeku, ali je osnova za smjernice o čemu je raspravljano u nedavnom postu na blogu o odgovornoj umjetnoj inteligenciji.

Na tržištu AI postoji velika konkurencija (preko desetak dobavljača), a na tržištu javnog oblaka puno konkurencije (preko pola tuceta vjerodostojnih dobavljača). Da bi usporedbe bile opravdane, morao bih napisati članak barem pet puta duži od ovog, pa koliko god da ih mrzim izostavljati, morat ću izostaviti većinu usporedbi proizvoda. Za najbolju očitu usporedbu mogu sažeti: AWS radi većinu onoga što Google radi, i također je vrlo dobar, ali uglavnom naplaćuje veće cijene.

Građevni blokovi Google Cloud AI

Građevni blokovi Google Cloud AI jednostavne su komponente za upotrebu koje možete ugraditi u vlastite programe za dodavanje vida, jezika, razgovora i strukturiranih podataka. Mnogi su građevni blokovi AI unaprijed obučene neuronske mreže, ali ih se može prilagoditi učenjem prijenosa i pretraživanjem neuronskih mreža ako ne zadovoljavaju vaše potrebe. Tablice AutoML malo su različite po tome što automatiziraju postupak koji bi znanstvenik podataka koristio za pronalaženje najboljeg modela strojnog učenja za tablični niz podataka.

AutoML

Usluge Google Cloud AutoML pružaju prilagođene duboke neuronske mreže za prijevod jezičnih parova, klasifikaciju teksta, otkrivanje objekata, klasifikaciju slika i klasifikaciju i praćenje video objekata. Oni trebaju tagirane podatke za obuku, ali ne zahtijevaju značajno znanje o dubokom učenju, učenju prijenosa ili programiranju.

Google Cloud AutoML prilagođava Google-ove duboke neuronske mreže provjerene u bitkama za vaše označene podatke. Umjesto da započinje ispočetka kada trenira modele iz vaših podataka, AutoML implementira automatsko učenje dubokog prijenosa (što znači da započinje s postojeće duboke neuronske mreže obučene na drugim podacima) i pretraživanje neuronske arhitekture (što znači da pronalazi pravu kombinaciju dodatnih mrežnih slojeva ) za prijevod jezičnog para i ostale gore navedene usluge.

U svakom području Google već ima jednu ili više unaprijed obučenih usluga temeljenih na dubokim neuronskim mrežama i ogromnim skupovima označenih podataka. Ovi podaci mogu dobro funkcionirati za vaše podatke nepromijenjeni i trebali biste ih testirati kako biste uštedjeli vrijeme i novac. Ako ne učine ono što vam treba, Google Cloud AutoML pomaže vam da stvorite model koji to čini, bez potrebe da znate kako izvoditi učenje prijenosa ili kako dizajnirati neuronske mreže.

Transfer učenje nudi dvije velike prednosti u odnosu na treniranje neuronske mreže od nule. Prvo, za obuku je potrebno puno manje podataka, jer je većina slojeva mreže već dobro obučena. Drugo, trenira puno brže, jer optimizira samo završne slojeve.

Iako su se usluge Google Cloud AutoML nekad predstavljale zajedno u paketu, sada su navedene s osnovnim unaprijed obučenim uslugama. Ono što većina drugih tvrtki naziva AutoML izvode Google Cloud AutoML tablice.

Pročitajte cjelovitu recenziju Google Cloud AutoML-a

Tablice AutoML

Uobičajeni postupak znanosti o podacima za mnoge probleme regresije i klasifikacije je stvaranje tablice podataka za obuku, čišćenje i kondicioniranje podataka, izvođenje inženjeringa značajki i pokušaj obuke svih odgovarajućih modela na transformiranoj tablici, uključujući korak za optimizaciju hiperparametri najboljih modela. Google Cloud AutoML tablice mogu cijeli taj postupak izvršiti automatski nakon što ručno identificirate ciljno polje.

Tablice AutoML automatski pretražuju strukturirane podatke u Googleovom zoološkom vrtu kako bi pronašli najbolji model za vaše potrebe, u rasponu od linearnih / logističkih regresijskih modela za jednostavnije skupove podataka do naprednih dubinskih, cjelovitih i arhitektonskih metoda pretraživanja za veće, složenije. Automatizira inženjering značajki na širokom rasponu primitiva tabličnih podataka - poput brojeva, klasa, nizova, vremenskih oznaka i popisa - i pomaže vam u otkrivanju i rješavanju nedostajućih vrijednosti, odstupanja i ostalih uobičajenih problema s podacima.

Njegovo bezkodno sučelje vodi vas kroz čitav životni ciklus strojnog učenja od kraja do kraja, olakšavajući svima u vašem timu izradu modela i pouzdanu ugradnju u šire programe. Tablice AutoML pružaju opsežne ulazne podatke i značajke objašnjenja ponašanja modela, zajedno sa zaštitnim ogradama kako bi se spriječile uobičajene pogreške. Tablice AutoML također su dostupne u okruženjima API-ja i prijenosnih računala.

Tablice AutoML natječu se s AI bez vozača i nekoliko drugih implementacija i okvira AutoML-a.

Vision API

API Google Cloud Vision unaprijed je obučena usluga strojnog učenja za kategorizaciju slika i izdvajanje raznih značajki. Može klasificirati slike u tisuće unaprijed obučenih kategorija, u rasponu od generičkih predmeta i životinja pronađenih na slici (kao što je mačka), do općih uvjeta (na primjer, sumrak), do određenih znamenitosti (Eiffelov toranj, Grand Canyon) i prepoznati općenita svojstva slike, poput dominantnih boja. Može izolirati područja koja su lica, zatim primijeniti geometrijske (orijentacija lica i orijentiri) i emocionalne analize na lica, iako lica ne prepoznaje kao da pripadaju određenim osobama, osim slavnih (za što je potrebna posebna licenca za upotrebu). Vision API koristi OCR za otkrivanje teksta unutar slika na više od 50 jezika i različitim vrstama datoteka. Također može prepoznati logotipe proizvoda i otkriti odrasle,nasilni i medicinski sadržaj.

Pročitajte cjelovitu recenziju API-ja za Google Cloud Machine Learning

API za video inteligenciju

API za Google Cloud Video Intelligence automatski prepoznaje više od 20 000 objekata, mjesta i radnji u pohranjenom i strujećem videu. Također razlikuje promjene scene i izdvaja bogate metapodatke na razini videozapisa, snimke ili kadra. Dodatno vrši otkrivanje i izdvajanje teksta pomoću OCR-a, otkriva eksplicitni sadržaj, automatizira natpise i titlove, prepoznaje logotipe i otkriva lica, osobe i poze.

Google preporučuje API za video inteligenciju za izdvajanje metapodataka za indeksiranje, organiziranje i pretraživanje vašeg video sadržaja. Može transkribirati videozapise i generirati natpise, kao i označavati i filtrirati neprikladan sadržaj, sve isplativije od ljudskih transkribera. Slučajevi upotrebe uključuju moderiranje sadržaja, preporuke za sadržaj, medijske arhive i kontekstualne oglase.

API za prirodni jezik

Obrada prirodnog jezika (NLP) velik je dio "tajnog umaka" zbog kojeg ulaz u Google pretraživanje i Google asistent dobro funkcioniraju. Google Cloud API za prirodni jezik izlaže tu istu tehnologiju vašim programima. Može izvršiti analizu sintakse (vidi sliku dolje), izdvajanje entiteta, analizu raspoloženja i klasifikaciju sadržaja na 10 jezika. Možete odrediti jezik ako ga znate; u suprotnom, API će pokušati automatski prepoznati jezik. Zasebni API, trenutno dostupan za rani pristup na zahtjev, specijaliziran je za zdravstvene sadržaje.

Pročitajte cjelovitu recenziju API-ja za Google Cloud Machine Learning

Prijevod

Google Cloud Translation API može prevesti preko stotinu jezičnih parova, može automatski prepoznati izvorni jezik ako ga ne navedete, a dolazi u tri okusa: osnovni, napredni i prijevod medija. API za napredni prijevod podržava pojmovnik, skupni prijevod i upotrebu prilagođenih modela. API osnovnog prevođenja u osnovi je ono što koristi potrošačko sučelje Google Translate. AutoML Translation omogućuje vam osposobljavanje prilagođenih modela pomoću učenja prijenosa.

API za prevođenje medija prevodi sadržaj izravno iz zvuka (govora), bilo audio datoteka ili streamova, na 12 jezika i automatski generira interpunkciju. Postoje zasebni modeli za video i audio za telefonske pozive.

Pročitajte cjelovitu recenziju API-ja za Google Cloud Machine Learning