Шаг 10.
Технология CUDA.
Директива вызова ядра

    На этом шаге мы рассмотрим директиву вызова ядра.

    Для запуска ядра на GPU используется следующая конструкция:

   kernelName<<<Dg,Db,Ns,S>>>(args);
где:

    Следующий пример запускает ядро с именем myKernel параллельно на n нитях, используя одномерный массив из двумерных (16х16) блоков нитей, и передает на вход ядру два параметра - а и n. При этом каждому блоку дополнительно выделяется 512 байт разделяемой памяти и запуск, производится на потоке myStream:

  myKernel<<<dim3(n/256),dim3(16,16),512,myStream>>>(a,n);

    На следующем шаге мы рассмотрим иерархию памяти в CUDA.




Предыдущий шаг Содержание Следующий шаг