Hodnotenie:
Kniha získala zmiešané recenzie, pričom niektorí čitatelia ju považujú za veľmi cennú pre pochopenie a implementáciu textovej analýzy v dátových skladoch, zatiaľ čo iní ju kritizujú za zastaralosť a nedostatočnú hĺbku.
Výhody:⬤ Poskytuje jasné vysvetlenia konceptov textovej analýzy, čo uľahčuje komunikáciu s manažmentom.
⬤ Ponúka nové poznatky o stratégiách ukladania a indexovania, ktoré sú prínosom pre tímy dátových skladov.
⬤ Obsahuje cenné myšlienky, ktoré môžu zlepšiť postupy spracovania a správy údajov.
⬤ Niektorí čitatelia ju považovali za predraženú a neobsahujúcu dostatok užitočných informácií.
⬤ Kritika opakujúceho sa obsahu a spoliehania sa na zastarané koncepty z tradičného dátového skladu.
⬤ Iní upozorňovali na autorovu neschopnosť efektívne sa zaoberať neštruktúrovanými údajmi a označovali knihu za plnú žargónu a blábolov.
(na základe 6 čitateľských recenzií)
Building the Unstructured Data Warehouse: Architecture, Analysis, and Design
Naučte sa základné techniky od legendy dátového skladu Billa Inmona o tom, ako vybudovať prostredie na vytváranie správ, ktoré vaša firma potrebuje teraz
V texte sa skrývajú odpovede na mnohé cenné obchodné otázky. Ako dobre dokáže vaše existujúce prostredie pre reporting extrahovať potrebný text z e-mailov, tabuliek a dokumentov a dať ho do užitočného formátu pre analýzu a reporting? Transformácia tradičného dátového skladu na efektívny neštruktúrovaný dátový sklad si vyžaduje ďalšie zručnosti analytika, architekta, dizajnéra a vývojára. Táto kniha vás pripraví na úspešnú implementáciu neštruktúrovaného dátového skladu a prostredníctvom zrozumiteľných vysvetlení, príkladov a prípadových štúdií sa naučíte nové techniky a tipy na úspešné získavanie a analýzu textu.
Zvládnite týchto desať cieľov:
⬤ Vybudovať neštruktúrovaný dátový sklad pomocou 11-krokového prístupu.
⬤ Integrovať text a opísať ho z hľadiska homogenity, relevantnosti, média, objemu a štruktúry.
⬤ Prekonať výzvy vrátane blábolov, Babylonskej veže a nedostatku prirodzených vzťahov.
⬤ Vyhnite sa dátovému smetisku a bojujte proti "pavučine".
⬤ Opätovné použitie techník zdokonalených v tradičnom dátovom sklade a dátovom sklade 2. 0 vrátane iteratívneho vývoja.
⬤ Používajte základné techniky na extrakciu, transformáciu a načítanie textov (ETL), ako je rozpoznávanie fráz, filtrovanie zastavených slov a nahrádzanie synoným.
⬤ Navrhnúť systém evidencie dokumentov a prepojiť neštruktúrovaný text so štruktúrovanými údajmi.
⬤ Využívajte indexy na efektívnu analýzu textu a taxonómie na užitočnú externú kategorizáciu.
⬤ Spravovať veľké objemy údajov pomocou pokročilých techník, ako sú spätné ukazovatele.
⬤ Vyhodnoťte výber technológií vhodných na spracovanie neštruktúrovaných údajov, napríklad zariadení dátového skladu.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)