Hodnotenie:
Kniha ponúka solídny úvod do feature engineeringu s praktickými príkladmi v jazyku Python, vďaka čomu je prístupná a odporúčaná. Niektorí čitatelia však majú pocit, že jej chýba hĺbka, má problémy s kvalitou grafiky a vzhľadom na jej rozsah je predražená.
Výhody:⬤ Ľahko sa číta
⬤ prehľadné príklady v jazyku Python
⬤ dobrá referencia pre strojové učenie
⬤ dobre napísaná a odporúčaná
⬤ zahŕňa základné koncepty a techniky v oblasti feature engineeringu.
⬤ Pôsobí nedokončene a príliš krátko
⬤ rôzne úrovne vysvetlenia
⬤ nízka kvalita ručne kreslenej grafiky
⬤ niektoré kontroverzné rady
⬤ vnímané ako predražené vzhľadom na ich skutočnú dĺžku.
(na základe 15 čitateľských recenzií)
Feature Engineering for Machine Learning: Principles and Techniques for Data Scientists
Príznakové inžinierstvo je kľúčovým krokom v procese strojového učenia, ale táto téma sa len zriedka skúma samostatne. Vďaka tejto praktickej knihe sa naučíte techniky extrakcie a transformácie funkcií - číselných reprezentácií surových údajov - do formátov pre modely strojového učenia. Každá kapitola vás prevedie jedným dátovým problémom, napríklad ako reprezentovať textové alebo obrazové údaje. Tieto príklady spoločne ilustrujú hlavné princípy príznakového inžinierstva.
Autorky Alice Zheng a Amanda Casari sa namiesto jednoduchého vyučovania týchto princípov zameriavajú na praktické využitie pomocou cvičení v celej knihe. Záverečná kapitola všetko spája riešením reálneho, štruktúrovaného súboru údajov s niekoľkými technikami príznakového inžinierstva. V príkladoch kódu sú použité balíky jazyka Python vrátane numpy, Pandas, Scikit-learn a Matplotlib.
Preskúmate:
⬤ Inžinierstvo príznakov pre číselné údaje: filtrovanie, binning, škálovanie, logaritmické transformácie a mocninné transformácie.
⬤ Techniky prirodzeného textu: bag-of-words, n-grams a detekcia fráz.
⬤ Frekvenčné filtrovanie a škálovanie prvkov na odstránenie neinformatívnych prvkov.
⬤ Techniky kódovania kategorických premenných vrátane hashovania príznakov a počítania binov.
⬤ Modelové inžinierstvo prvkov s analýzou hlavných komponentov.
⬤ Koncepcia stohovania modelov pomocou k-means ako techniky featurizácie.
⬤ Výber obrazových prvkov pomocou manuálnych techník a techník hlbokého učenia.