Hodnotenie:
Kniha nespĺňa očakávania čitateľov, ktorí hľadajú technický zdroj informácií, najmä v oblasti strojového učenia, pretože jej chýbajú praktické aplikácie, príklady kódovania a podstatný obsah.
Výhody:Zdá sa, že autor má v porovnaní s touto knihou vysokú dôveru vo vlastnú prácu, čo naznačuje, že je presvedčený, že jeho vlastný zdroj je oveľa komplexnejší a hodnotnejší.
Nevýhody:Kniha nie je technická, neobsahuje žiadny kód ani vzorce, má riedke odkazy, je krátka, má 145 strán s veľkými, neinformatívnymi obrázkami a nie je vhodná pre praktikov v oblasti strojového učenia.
(na základe 1 čitateľských recenzií)
Practical Synthetic Data Generation: Balancing Privacy and the Broad Availability of Data
Vytváranie a testovanie modelov strojového učenia si vyžaduje prístup k rozsiahlym a rôznorodým údajom. Kde však môžete nájsť použiteľné súbory údajov bez toho, aby ste narazili na problémy so súkromím? Táto praktická kniha predstavuje techniky na generovanie syntetických údajov - falošných údajov vytvorených zo skutočných údajov -, aby ste mohli vykonávať sekundárnu analýzu na účely výskumu, pochopenia správania zákazníkov, vývoja nových produktov alebo generovania nových príjmov.
Dátoví vedci sa dozvedia, ako generovanie syntetických údajov poskytuje spôsob, ako takéto údaje široko sprístupniť na sekundárne účely a zároveň vyriešiť mnohé problémy týkajúce sa ochrany osobných údajov. Analytici sa naučia zásady a kroky generovania syntetických údajov z reálnych súborov údajov. A vedúci pracovníci v oblasti podnikania uvidia, ako môžu syntetické údaje pomôcť urýchliť čas potrebný na vytvorenie produktu alebo riešenia.
Táto kniha opisuje:
⬤ Kroky generovania syntetických údajov pomocou viacrozmerných normálnych rozdelení.
⬤ Metódy na fitovanie rozdelenia zahŕňajúce rôzne metriky dobrej zhody.
⬤ Ako replikovať jednoduchú štruktúru pôvodných údajov.
⬤ Prístup k modelovaniu štruktúry údajov s cieľom zohľadniť komplexné vzťahy.
⬤ Viacero prístupov a metrík, ktoré môžete použiť na posúdenie užitočnosti údajov.
⬤ Ako možno analýzu vykonanú na skutočných údajoch replikovať pomocou syntetických údajov.
⬤ Dôsledky syntetických údajov na súkromie a metódy na posúdenie odhalenia identity.