Advanced search
Log In | Get Help   
Home My Page Projects Code Snippets Project Openings OPTIMIZA
Summary Activity Forums Tracker Lists Docs SCM Files Wiki


Wiki Menu
 

Benchmarks


Note: You are viewing an old revision of this page. View the current version.

En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son : AXPY - Suma vector - vector DOT - Multiplicación vector - vector MATVECD - Multiplicación matriz - vector MATMAT - Multiplicación matriz - matriz


\Equipo de pruebas


CPU: Dual Intel Xeon Quad-core E5520 (Nehalem) GPU: NVIDIA Tesla C1060 RAM: 12GB


\Consideraciones


Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la liibería matemática MKL. Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas).

La gráfca que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU).


\Graficas


Upload:AxpyDP_pitesla.png Upload:DotDP_pitesla.png Upload:MatvecdDP_pitesla.png Upload:MatmatDP_pitesla.png


Powered By FusionForge