Diff: Benchmarks
Differences between version 3 and previous revision of Benchmarks.
Other diffs: Previous Major Revision, Previous Author
Newer page: | version 3 | Last edited on 05 July 2010 14:44 | by Marcos Fernandez Lopez | Revert |
Older page: | version 2 | Last edited on 05 July 2010 14:42 | by Marcos Fernandez Lopez | Revert |
version 3
En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU.
Los tests analizados son :
AXPY - Suma vector - vector
DOT - Multiplicación vector - vector
MATVECD - Multiplicación matriz - vector
MATMAT - Multiplicación matriz - matriz
\Equipo de pruebas
CPU: Dual Intel Xeon Quad-core E5520 (Nehalem)
GPU: NVIDIA Tesla C1060
RAM: 12GB
\Consideraciones
Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la liibería matemática MKL.
Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas).
La gráfca que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU).
\Graficas