Performance analysis and autotuning setup of the cuFFT library

Logo poskytovatele
Název česky Analýza výkonu a autotuning nastavení knihovny cuFFT
Autoři

STŘELÁK David FILIPOVIČ Jiří

Rok publikování 2018
Druh Článek ve sborníku
Konference ACM International Conference Proceeding Series
Fakulta / Pracoviště MU

Ústav výpočetní techniky

Citace
www https://dl.acm.org/citation.cfm?id=3295817
Doi http://dx.doi.org/10.1145/3295816.3295817
Klíčová slova cuFFT; GPU; autotuning; performance analysis; cuFFTAdvisor
Popis Rychlá Fourierova transformace (FFT) má mnoho aplikací. Často je jedním z výpočetně nejnáročnějších kernelů, proto bylo investováno mnoho úsilí do tuningu jejího výkonu na mnoha hardwareových zařízeních. FFT knihovny mají nicméně mnoho možných nastavení a není vždy jasné, jaké z nich použít pro optimální výkon. V praxi můžeme nastavení FFT knihovny často měnit, například můžeme doplnit či oříznout vstupní data. Většina současných prací se překvapivě zaměřuje na otázku jak implementovat rychlou FFT s daným nastavením, ale nevěnuje pozornost otázce jaké nastavení umožní nejrychlejší výpočet. V tomto článku se zaměřujeme na populární knihovnu pro FFT na GPU akcelerátorech -- cuFFT. Analyzujeme chování a výkon cuFFT knihovny s ohledem na velikost vstupu a nastavení plánu. Představujeme také nový nástroj, cuFFTAdvisor, který navrhuje a pomocí autotuningu vyhledává nejlepší nastavení knihovny s danými omezeními na velikost vstupu a nastavení plánu. Experimentálně dokazujeme, že náš nástroj je schopen nabídnout odlišné nastavení transformace, které vede v průměru k 6x zrychlení při použití rychlé heuristiky a 6.9x zrychlení při použití autotuningu.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info