Inicio

Este práctico tutorial proporciona una forma sencilla de interactuar con los principales rasgos de las arquitecturas Kepler de la tercera generación de GPUs de Nvidia, a saber:

  • Distintos métodos para desplegar paralelismo masivo a través de bloques CUDA, kernels y streams para beneficiarse de Hyper-Q.
  • Rendimiento (GFLOPS) y ancho de banda (GB/s.).
  • Latencia para los operandos (int/float/double…) y los operadores (suma/producto/división...).

Se plantean diferentes retos al programador CUDA, que exigen tener clara la relación existente entre los elementos de un programa CUDA y la arquitectura que los ejecuta:

  • Analizar el rendimiento de las principales cualidades de las plataformas Kepler, así como de aquellas que fueron heredadas de sus hermanos menores Fermi y Tesla.
  • Investigar maneras y mecanismos de acercarse al máximo al rendimiento pico teórico de un procesador many-core como la GPU.
  • Ver cómo se comportan los GFLOPS y el ancho de banda, y relacionar ambos conceptos a través del modelo roofline.

Disfruta tu sesión de prácticas y ... ¡Mucha suerte con CUDA!