V zdravotníctve je analýza veľkých dát mimoriadne dôležitá, samozrejme preto, že samotné odvetvie je domovom obrovského množstva dát.
Analýza sa používa na skúmanie týchto súborov údajov a odhaľovanie skrytých informácií a trendov s cieľom získať poznatky a predvídať výsledky. Súčasným existujúcim prístupom chýba značná kategorizácia a presnosť predikcie, pretože získavanie štruktúrovaných klinických a zdravotníckych údajov je časovo náročné a presná predikcia chorôb pomocou správ v reálnom čase je zložitá a výpočtovo náročná úloha.
Pochopenie opodstatnenosti prístupov strojového učenia v zdravotníctve je preto nevyhnutné, pretože presnosť a správnosť sú v problémoch zdravotníctva často rozhodujúce. Cieľom je vytvoriť zovšeobecnený klinický model strojového učenia na predpovedanie s využitím kontrolovaných klasifikačných algoritmov s cieľom predpovedať niekoľko bežných, ale závažných zdravotných ochorení pomocou binárneho skóre.