Statistical Inference from High Dimensional Data
- Problémy reálneho sveta môžu byť vysokorozmerné, komplexné a zašumené - Viac údajov neznamená viac informácií - Rôzne prístupy sa zaoberajú tzv.
prekliatím dimenzionality s cieľom redukovať irelevantné informácie - Proces s viacrozmernými informáciami sa nemusí dať ľahko interpretovať ani spracovať - V niektorých reálnych aplikáciách je počet prvkov triedy jednoznačne nižší ako počet ostatných. Modely majú tendenciu predpokladať, že dôležitosť analýzy patrí väčšinovej triede, a to zvyčajne nie je pravda - Analýza komplexných ochorení, ako je rakovina, sa zameriava na viac ako jednorozmerné omické údaje - Narastajúce množstvo údajov vďaka znižovaniu nákladov na vysokoúčinné experimenty otvára novú éru pre integračné prístupy založené na údajoch - Na zníženie dimenzionality vysokorozmerných údajov sú zaujímavé prístupy založené na entropii.