Hodnotenie:
Momentálne nie sú žiadne recenzie čitateľov. Hodnotenie je založené na 20 hlasoch.
Text Data Management and Analysis: A Practical Introduction to Information Retrieval and Text Mining
V posledných rokoch došlo k dramatickému nárastu textových údajov v prirodzenom jazyku vrátane webových stránok, spravodajských článkov, vedeckej literatúry, e-mailov, podnikových dokumentov a sociálnych médií, ako sú články na blogoch, príspevky na fórach, recenzie produktov a tweety. To viedlo k rastúcemu dopytu po výkonných softvérových nástrojoch, ktoré pomáhajú ľuďom efektívne a účinne analyzovať a spravovať obrovské množstvá textových údajov.
Na rozdiel od údajov generovaných počítačovým systémom alebo senzormi sú textové údaje zvyčajne generované priamo ľuďmi a sú sprevádzané sémanticky bohatým obsahom. Textové údaje ako také sú obzvlášť cenné na zisťovanie znalostí o ľudských názoroch a preferenciách, okrem mnohých iných druhov znalostí, ktoré v texte kódujeme. Na rozdiel od štruktúrovaných údajov, ktoré zodpovedajú presne definovaným schémam (a teda sú pre počítače relatívne ľahko spracovateľné), text má menej explicitnú štruktúru, čo si vyžaduje počítačové spracovanie smerujúce k pochopeniu obsahu zakódovaného v texte.
Súčasná technológia spracovania prirodzeného jazyka ešte nedosiahla úroveň, ktorá by umožnila počítaču presne porozumieť textu v prirodzenom jazyku, ale za posledných niekoľko desaťročí sa vyvinula široká škála štatistických a heuristických prístupov k analýze a správe textových údajov.
Zvyčajne sú veľmi robustné a možno ich použiť na analýzu a správu textových údajov v akomkoľvek prirodzenom jazyku a o akejkoľvek téme. Táto kniha poskytuje systematický úvod do všetkých týchto prístupov s dôrazom na najužitočnejšie vedomosti a zručnosti potrebné na vytvorenie rôznych prakticky využiteľných textových informačných systémov.
Dôraz sa kladie na aplikácie text miningu, ktoré môžu pomôcť používateľom analyzovať vzory v textových údajoch s cieľom získať a odhaliť užitočné znalosti. Systémy na vyhľadávanie informácií vrátane vyhľadávacích strojov a odporúčacích systémov sú tiež zahrnuté ako podporné technológie pre aplikácie text miningu. Kniha zahŕňa hlavné pojmy, techniky a myšlienky v oblasti dolovania textových údajov a vyhľadávania informácií z praktického hľadiska a obsahuje mnoho praktických cvičení navrhnutých pomocou sprievodného softvérového balíka nástrojov (t.
j. MeTA), ktoré pomáhajú čitateľom naučiť sa, ako aplikovať techniky dolovania textových údajov a vyhľadávania informácií na reálne textové údaje a ako experimentovať s niektorými algoritmami a zlepšovať ich pre zaujímavé aplikačné úlohy. Knihu možno použiť ako učebnicu pre bakalársky kurz informatiky alebo ako príručku pre odborníkov z praxe, ktorí pracujú na relevantných problémoch analýzy a správy textových údajov.