3 Kaggle-ove alternative za suradničku znanost o podacima

Koji je najbolji način za dobar odgovor na teško pitanje? Pitajte hrpu ljudi i napravite od toga konkurenciju. To je dugo bio Kaggle-ov pristup znanosti o podacima: Teške misije, poput preciznijeg otkrivanja raka pluća, pretvorite u natjecanja koja plaćaju nagrade, gdje pobjeđuju najbolji timovi i najbolji algoritmi.

Sada se Kaggle uvodi u Google, a iako svi znakovi upućuju na to da se zasad održava onakvim kakav jest, bit će treperenja o dugoročnim izgledima za web mjesto s tako predanom zajednicom i idiosinkratičnim pristupom.

Evo još tri web stranice koje dijele sličnu misiju, ako se izričito ne slijede Kaggleovim stopama. (Imajte na umu da neke web stranice, poput CrowdAnalytix, mogu prihvatljiva rješenja na natječajima smatrati radovima za najam, a time i svojim vlasništvom.)

CrowdAI

Proizvod École Polytechnique Fédérale de Lausanne u Švicarskoj, CrowdAI je platforma otvorenog koda za domaćinstvo izazovima otvorenih podataka i stjecanje uvida u to kako su problemi riješeni. Platforma je sasvim nova, do sada je ponuđeno samo šest izazova, ali vodiči izvedeni iz tih izazova detaljni su i vrijedni, pružajući korak-po-korak metodologije za reprodukciju tog rada ili stvaranje nečeg sličnog. Postojeće vježbe pokrivaju uobičajene okvire kao što su Torch ili TensorFlow, pa je dobro mjesto za stjecanje praktičnih detalja za njihovo korištenje.

DrivenData

DrivenData, koju je stvorila konzultantska tvrtka koja se bavi problemima profesionalnih podataka, domaćin je mrežnih izazova koji traju nekoliko mjeseci. Svaka je usmjerena posebno na goruće probleme s kojima se suočava svijet u cjelini, poput predviđanja širenja bolesti ili iskopavanja Yelp podataka radi poboljšanja procesa inspekcije restorana. Kao i Kaggle, DrivenData također ima tablu s popisima poslova za znanost o podacima - značajka za koju se ljudi brinu da bi mogla nestati iz Kaggle-a nakon akvizicije.

CrowdAnalytix

Potpomognut investitorima iz Accel Partnersa i SAIF Partnersa, CrowdAnalytix se fokusira na domaćinstvo natjecanja u rješavanju problema na temelju podataka, umjesto na razmjenu informacija koje iz njih proizlaze. Natječaji se nude za pronalaženje rješenja za probleme u kategorijama poput modeliranja, vizualizacije i istraživanja, a svaka ima nagrade u tisućama dolara. Neki prethodni izazovi uključuju predviđanje stvarnih troškova zahtjeva za odštetu radnika ili kašnjenja zrakoplovnih prijevoznika. Ostala natjecanja, međutim, nisu domaćin za novac, već za pružanje natjecateljske mogućnosti za učenje srodnih disciplina, poput R jezika.