Inicio
Este práctico tutorial proporciona una forma sencilla de interactuar con los principales rasgos de las arquitecturas Kepler de la tercera generación de GPUs de Nvidia, a saber:
- Distintos métodos para desplegar paralelismo masivo a través de bloques CUDA, kernels y streams para beneficiarse de Hyper-Q.
- Rendimiento (GFLOPS) y ancho de banda (GB/s.).
- Latencia para los operandos (int/float/double…) y los operadores (suma/producto/división...).
Se plantean diferentes retos al programador CUDA, que exigen tener clara la relación existente entre los elementos de un programa CUDA y la arquitectura que los ejecuta:
- Analizar el rendimiento de las principales cualidades de las plataformas Kepler, así como de aquellas que fueron heredadas de sus hermanos menores Fermi y Tesla.
- Investigar maneras y mecanismos de acercarse al máximo al rendimiento pico teórico de un procesador many-core como la GPU.
- Ver cómo se comportan los GFLOPS y el ancho de banda, y relacionar ambos conceptos a través del modelo roofline.
Disfruta tu sesión de prácticas y ... ¡Mucha suerte con CUDA!