
Chapter 5
Implementing an efficient convolution
operation on GPU
Gilles Perrot
Femto-ST Institute, University of Franche-Comte, France
5.1 Overview . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5.3 Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5.3.1 First test implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.3.2 Using parameterizable masks . . . . .