Praktické generovanie syntetických údajov: Vyváženie ochrany súkromia a širokej dostupnosti údajov

Hodnotenie:   (3,8 z 5)

Praktické generovanie syntetických údajov: Vyváženie ochrany súkromia a širokej dostupnosti údajov (El Emam Khaled)

Recenzie čitateľov

Zhrnutie:

Kniha nespĺňa očakávania čitateľov, ktorí hľadajú technický zdroj informácií, najmä v oblasti strojového učenia, pretože jej chýbajú praktické aplikácie, príklady kódovania a podstatný obsah.

Výhody:

Zdá sa, že autor má v porovnaní s touto knihou vysokú dôveru vo vlastnú prácu, čo naznačuje, že je presvedčený, že jeho vlastný zdroj je oveľa komplexnejší a hodnotnejší.

Nevýhody:

Kniha nie je technická, neobsahuje žiadny kód ani vzorce, má riedke odkazy, je krátka, má 145 strán s veľkými, neinformatívnymi obrázkami a nie je vhodná pre praktikov v oblasti strojového učenia.

(na základe 1 čitateľských recenzií)

Pôvodný názov:

Practical Synthetic Data Generation: Balancing Privacy and the Broad Availability of Data

Obsah knihy:

Vytváranie a testovanie modelov strojového učenia si vyžaduje prístup k rozsiahlym a rôznorodým údajom. Kde však môžete nájsť použiteľné súbory údajov bez toho, aby ste narazili na problémy so súkromím? Táto praktická kniha predstavuje techniky na generovanie syntetických údajov - falošných údajov vytvorených zo skutočných údajov -, aby ste mohli vykonávať sekundárnu analýzu na účely výskumu, pochopenia správania zákazníkov, vývoja nových produktov alebo generovania nových príjmov.

Dátoví vedci sa dozvedia, ako generovanie syntetických údajov poskytuje spôsob, ako takéto údaje široko sprístupniť na sekundárne účely a zároveň vyriešiť mnohé problémy týkajúce sa ochrany osobných údajov. Analytici sa naučia zásady a kroky generovania syntetických údajov z reálnych súborov údajov. A vedúci pracovníci v oblasti podnikania uvidia, ako môžu syntetické údaje pomôcť urýchliť čas potrebný na vytvorenie produktu alebo riešenia.

Táto kniha opisuje:

⬤ Kroky generovania syntetických údajov pomocou viacrozmerných normálnych rozdelení.

⬤ Metódy na fitovanie rozdelenia zahŕňajúce rôzne metriky dobrej zhody.

⬤ Ako replikovať jednoduchú štruktúru pôvodných údajov.

⬤ Prístup k modelovaniu štruktúry údajov s cieľom zohľadniť komplexné vzťahy.

⬤ Viacero prístupov a metrík, ktoré môžete použiť na posúdenie užitočnosti údajov.

⬤ Ako možno analýzu vykonanú na skutočných údajoch replikovať pomocou syntetických údajov.

⬤ Dôsledky syntetických údajov na súkromie a metódy na posúdenie odhalenia identity.

Ďalšie údaje o knihe:

ISBN:9781492072744
Autor:
Vydavateľ:
Väzba:Mäkká väzba
Rok vydania:2020
Počet strán:175

Nákup:

Momentálne k dispozícii, na sklade.

Ďalšie knihy autora:

Anonymizácia zdravotných údajov: Prípadové štúdie a metódy, ktoré vám pomôžu začať - Anonymizing...
Táto praktická kniha, aktualizovaná v auguste...
Anonymizácia zdravotných údajov: Prípadové štúdie a metódy, ktoré vám pomôžu začať - Anonymizing Health Data: Case Studies and Methods to Get You Started
Praktické generovanie syntetických údajov: Vyváženie ochrany súkromia a širokej dostupnosti údajov -...
Vytváranie a testovanie modelov strojového učenia...
Praktické generovanie syntetických údajov: Vyváženie ochrany súkromia a širokej dostupnosti údajov - Practical Synthetic Data Generation: Balancing Privacy and the Broad Availability of Data

Diela autora vydali tieto vydavateľstvá: