Hodnotenie:
Momentálne nie sú žiadne recenzie čitateľov. Hodnotenie je založené na 8 hlasoch.
Learning Apache Drill: Query and Analyze Distributed Data Sources with SQL
Začnite pracovať s Apache Drill, rozšíriteľným distribuovaným dotazovacím mechanizmom SQL, ktorý číta obrovské súbory údajov v mnohých populárnych formátoch súborov, ako sú Parquet, JSON a CSV. Drill číta údaje v HDFS alebo v cloudovom úložisku, ako je S3, a spolupracuje s metaúlohami Hive spolu s distribuovanými databázami, ako sú HBase, MongoDB a relačné databázy. Drill funguje všade: na vašom notebooku alebo v najväčšom klastri.
V tejto praktickej knihe autori projektu Drill Charles Givre a Paul Rogers ukazujú analytikom a dátovým vedcom, ako vyhľadávať a analyzovať nespracované údaje pomocou tohto výkonného nástroja. Dátoví vedci dnes trávia približne 80 % svojho času len zhromažďovaním a čistením údajov. Vďaka tejto knihe sa dozviete, ako vám Drill pomôže efektívnejšie analyzovať údaje a skrátiť tak čas potrebný na získanie poznatkov.
⬤ Používajte Drill na čistenie, prípravu a sumarizáciu ohraničených údajov na ďalšiu analýzu.
⬤ Vyhľadávať typy súborov vrátane súborov protokolov, súborov Parquet, JSON a ďalších zložitých formátov.
⬤ Vyhľadávanie v Hadoop, relačných databázach, MongoDB a Kafka pomocou štandardného jazyka SQL.
⬤ Pripojte sa k Drillu programovo pomocou rôznych jazykov.
⬤ Používajte Drill aj pri náročných alebo nejednoznačných formátoch súborov.
⬤ Vykonávajte sofistikované analýzy rozšírením funkcií programu Drill o funkcie definované používateľom.
⬤ Uľahčite analýzu údajov na účely zabezpečenia siete, metadát obrazu a strojového učenia.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)