marcosl
\Benchmarks
En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son : AXPY - Suma vector - vector DOT - Multiplicación vector - vector MATVECD - Multiplicación matriz - vector MATMAT - Multiplicación matriz - matriz
\Equipo de pruebas
CPU: Dual Intel Xeon Quad-core E5520 (Nehalem) GPU: NVIDIA Tesla C1060 RAM: 12GB
\Consideraciones
Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la liibería matemática MKL. Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas).
La gráfca que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU).
\Graficas