Advanced search
Log In | Get Help   
Home My Page Projects Code Snippets Project Openings OPTIMIZA
Summary Activity Forums Tracker Lists Docs SCM Files Wiki


Wiki Menu
 

marcosl



\Benchmarks


En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son : AXPY - Suma vector - vector DOT - Multiplicación vector - vector MATVECD - Multiplicación matriz - vector MATMAT - Multiplicación matriz - matriz


\Equipo de pruebas


CPU: Dual Intel Xeon Quad-core E5520 (Nehalem) GPU: NVIDIA Tesla C1060 RAM: 12GB


\Consideraciones


Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la liibería matemática MKL. Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas).

La gráfca que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU).


\Graficas


Upload:AxpyDP_pitesla.png Upload:DotDP_pitesla.png Upload:MatvecdDP_pitesla.png Upload:MatmatDP_pitesla.png


Powered By FusionForge