Inicio

Este práctico tutorial proporciona una forma sencilla de interactuar con los principales rasgos de las arquitecturas Kepler de la tercera generación de GPUs de Nvidia, a saber:

Distintos métodos para desplegar paralelismo masivo a través de bloques CUDA, kernels y streams para beneficiarse de Hyper-Q.
Rendimiento (GFLOPS) y ancho de banda (GB/s.).
Latencia para los operandos (int/float/double…) y los operadores (suma/producto/división...).

Se plantean diferentes retos al programador CUDA, que exigen tener clara la relación existente entre los elementos de un programa CUDA y la arquitectura que los ejecuta:

Analizar el rendimiento de las principales cualidades de las plataformas Kepler, así como de aquellas que fueron heredadas de sus hermanos menores Fermi y Tesla.
Investigar maneras y mecanismos de acercarse al máximo al rendimiento pico teórico de un procesador many-core como la GPU.
Ver cómo se comportan los GFLOPS y el ancho de banda, y relacionar ambos conceptos a través del modelo roofline.

Disfruta tu sesión de prácticas y ... ¡Mucha suerte con CUDA!

CUDA challenge Manuel Ujaldón @ NVIDIA

Buscar en la vista de navegación

Navegación

Buscar

Instrucciones

Utilizando las GPUs

La competición

Inicio