Automatic Fusions of CUDA-GPU Kernels for Parallel Map
| Název česky | Automatické fúze CUDA-GPU kernelů pro paralelní map |
|---|---|
| Autoři | |
| Rok publikování | 2011 |
| Druh | Článek ve sborníku |
| Konference | Second International workshop on highly-efficient accelerators and reconfigurable technologies (HEART) |
| Fakulta / Pracoviště MU | |
| Citace | |
| www | http://www.fi.muni.cz/~xfilipov/s4-1.pdf |
| Obor | Informatika |
| Klíčová slova | GPU, CUDA, kernels fusion, map, mapped function |
| Popis | Když implementujeme mapování funkce na dnešních GPU, musíme ladit několik protichůdných faktorů ovlivňujících distribuci výpočtů do jednotlivých GPU kernelů. Schéma dekompozice-fúze radí dekomponovat výpočetní problém tak, aby byl řešen pomocí několika jednoduchých funkcí implementovaných jako samostatné kernely a některé z těchto funkcí následně spojit do komplexnějších kernelů a zlepšit tak paměťovou lokalitu. V tomto článku prezentujeme prototyp kompilátoru automatizujícího fázi fúze a experimentálně ověřujeme přínos fúzí generovaných kompilátorem a časovou efektivitu kompilátoru. |
| Související projekty: |