Efficient Data Input/Output (I/O) for Finite Difference Time Domain (FDTD). Computation on Graphics Processing Unit (GPU)
Magisterská práca z roku 2014 z predmetu Informatika - aplikovaná, stupeň: University of Manchester (School of Computer Science), predmet: Aplikovaná informatika: (Advanced Computer Science): Počítačové systémové inžinierstvo, jazyk: Abstrakt: Vzhľadom na nedávny technologický pokrok je jedným z populárnych spôsobov dosiahnutia výkonu s ohľadom na čas vykonávania programov využitie masívneho paralelného výkonu výpočtových akcelerátorov na báze GPU spolu s výpočtovými CPU. Pri výpočtoch na báze akcelerátorov GPU sa dátovo alebo výpočtovo náročná časť počíta na GPU, zatiaľ čo jednoduché, ale zložité inštrukcie sa počítajú na CPU s cieľom dosiahnuť masívne zrýchlenie času vykonávania počítačového programu vykonávaného v počítačovom systéme.
Vo fyzike, najmä v elektromagnetizme, je metóda konečnej diferenčnej časovej oblasti (Finite-Difference Time-Domain - FDTD) populárnou metódou numerickej analýzy, ktorá sa používa na riešenie súboru Maxwellsových parciálnych diferenciálnych rovníc na zjednotenie a prepojenie elektrického poľa s magnetickým poľom. Keďže metóda FDTD je výpočtovo náročná a má vysokú úroveň paralelizmu vo výpočtovej implementácii, z tohto dôvodu sa výskumníci v posledných rokoch snažia vypočítať výpočtovo náročnú časť metód FDTD na GPU namiesto CPU. Výpočet paralelizovaných častí algoritmov FDTD na GPU síce dosahuje veľmi dobrý výkon, ale nedokáže dosiahnuť veľmi dobré zrýchlenie v čase vykonávania kvôli veľmi vysokej latencii medzi CPU a GPU.
Predpokladá sa, že výsledky výpočtov v každom časovom kroku FDTD sa vytvoria a uložia na pevný disk systému. To možno nazvať dátovým výstupom metód FDTD a prekrývanie dátového výstupu a výpočtu hodnôt poľa v ďalšom časovom kroku nemožno vykonávať súčasne.
Z tohto dôvodu a z dôvodu rozdielu latencie medzi CPU a GPU dochádza k úzkemu miestu vo výkone dátového výstupu GPU. Tento problém možno považovať za neefektívny výkon vstupu/výstupu údajov (I.