Functional Applications of Text Analytics Systems
Analýza textu pozostáva zo štatistických údajov o textovom prvku, ktoré zahŕňajú počet slov, histogram slov a histogram frekvencie slov. Väčšina hodnotných textových dokumentov súvisí s inými - niekedy mnohými inými - dokumentmi, a preto je analytika opisujúca relatívnu frekvenciu výrazov v dokumente v porovnaní s podobnými dokumentmi dôležitá na definovanie kľúčových slov (označovanie, štítkovanie, indexovanie), výrazov reagujúcich na vyhľadávanie (dotazovacie výrazy) a komprimovaných verzií dokumentov (kľúčové slová, zhrnutie atď. ).
Tento zrozumiteľne napísaný text vysvetľuje funkčné aplikácie vyhľadávania, prekladu, optimalizácie a učenia s ohľadom na textovú analytiku. Generovaniu analytických postupov napomáha hybridný, ansámblový alebo iný kombinatorický prístup, pri ktorom sa súčasne používajú dva alebo viac účinných analytických postupov a ich výstupy sa kombinujú s cieľom vytvoriť lepší „konsenzus“. Prostredníctvom týchto metód sa poskytuje dodatočná hodnota na uchovanie informácií.
Takisto, keďže zahŕňajú schopnosti dvoch alebo viacerých systémov vytvárajúcich znalosti, môžu vytvoriť „supersúbor“ prístupových bodov k vytvoreným údajom. V knihe sa opisuje aj úloha funkčných prístupov pri testovaní a konfigurácii týchto systémov.