Advanced search
Log In | Get Help   
Home My Page Projects Code Snippets Project Openings OPTIMIZA
Summary Activity Forums Tracker Lists Docs SCM Files Wiki


Wiki Menu
 

Tesla C1060 DP


En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU.

Los tests analizados son :

AXPY - Suma vector - vector

DOT - Multiplicación vector - vector

MATVECD - Multiplicación matriz - vector

MATMAT - Multiplicación matriz - matriz


\Equipo de pruebas


CPU: Dual Intel Xeon Quad-core E5520 (Nehalem)

GPU: NVIDIA Tesla C1060

RAM: 12GB


\Consideraciones


Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la librería matemática MKL.

Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas).

La gráfica que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU).


\Graficas


Upload:Axpy_Graph_pitesla.jpg Upload:Dot_Graph_pitesla.jpg Upload:Matvecd_Graph_pitesla.jpg Upload:Matmat_Graph_pitesla.jpg


Powered By FusionForge