На этом шаге мы рассмотрим подведем некоторые итоги.
Из приведенных на предыдущих шагах примеров видно явное преимущество использования видеокарт для вычислений. Так, например, в 1 примере (26 шаг) явное преимущество не наблюдается, но в 4 примере (29 шаг) при размере матрицы 4096 на 4096 наблюдается почти 9 кратное превосходство по времени выполнения по сравнению с технологией MPI. Также во втором примере (27 шаг) при размере матрицы 4096 на 4096 наблюдается более чем двухсоткратное преимущество по времени выполнения по сравнению с приложением, созданным с помощью MPI.
Также можно заметить, что данные приложения разрабатываются не сложнее по сравнению с обычными на языке программирования C++.
На этом мы заканчиваем первоначальное знакомство с технологией CUDA. Надеемся, что приведенный материал будет Вам полезен.