Performance analysis and autotuning setup of the cuFFT library
| Název česky | Analýza výkonu a autotuning nastavení knihovny cuFFT |
|---|---|
| Autoři | |
| Rok publikování | 2018 |
| Druh | Článek ve sborníku |
| Konference | ACM International Conference Proceeding Series |
| Fakulta / Pracoviště MU | |
| Citace | |
| www | https://dl.acm.org/citation.cfm?id=3295817 |
| Doi | https://doi.org/10.1145/3295816.3295817 |
| Klíčová slova | cuFFT; GPU; autotuning; performance analysis; cuFFTAdvisor |
| Popis | Rychlá Fourierova transformace (FFT) má mnoho aplikací. Často je jedním z výpočetně nejnáročnějších kernelů, proto bylo investováno mnoho úsilí do tuningu jejího výkonu na mnoha hardwareových zařízeních. FFT knihovny mají nicméně mnoho možných nastavení a není vždy jasné, jaké z nich použít pro optimální výkon. V praxi můžeme nastavení FFT knihovny často měnit, například můžeme doplnit či oříznout vstupní data. Většina současných prací se překvapivě zaměřuje na otázku jak implementovat rychlou FFT s daným nastavením, ale nevěnuje pozornost otázce jaké nastavení umožní nejrychlejší výpočet. V tomto článku se zaměřujeme na populární knihovnu pro FFT na GPU akcelerátorech -- cuFFT. Analyzujeme chování a výkon cuFFT knihovny s ohledem na velikost vstupu a nastavení plánu. Představujeme také nový nástroj, cuFFTAdvisor, který navrhuje a pomocí autotuningu vyhledává nejlepší nastavení knihovny s danými omezeními na velikost vstupu a nastavení plánu. Experimentálně dokazujeme, že náš nástroj je schopen nabídnout odlišné nastavení transformace, které vede v průměru k 6x zrychlení při použití rychlé heuristiky a 6.9x zrychlení při použití autotuningu. |
| Související projekty: |