Advanced search
Log In | Get Help   
Home My Page Projects Code Snippets Project Openings OPTIMIZA
Summary Activity Forums Tracker Lists Docs SCM Files Wiki


Wiki Menu
 

Diff: marcosl


Differences between version 3 and previous revision of marcosl.

Other diffs: Previous Major Revision, Previous Author

Newer page: version 3 Last edited on 05 July 2010 14:38 by Marcos Fernandez Lopez Revert
Older page: version 2 Last edited on 05 July 2010 14:02 by Marcos Fernandez Lopez Revert
@@ -1,3 +1,33 @@
+----  
+\**Benchmarks**  
+----  
+En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU.  
+Los tests analizados son :  
+AXPY - Suma vector - vector  
+DOT - Multiplicación vector - vector  
+MATVECD - Multiplicación matriz - vector  
+MATMAT - Multiplicación matriz - matriz  
  
+----  
+\**Equipo de pruebas**  
+----  
+CPU: Dual Intel Xeon Quad-core E5520 (Nehalem)  
+GPU: NVIDIA Tesla C1060  
+RAM: 12GB  
+  
+----  
+\**Consideraciones**  
+----  
+Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la liibería matemática MKL.  
+Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas).  
+  
+La gráfca que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU).  
+  
+----  
+\**Graficas**  
+----  
  
 [Upload:AxpyDP_pitesla.png] 
+[Upload:DotDP_pitesla.png]  
+[Upload:MatvecdDP_pitesla.png]  
+[Upload:MatmatDP_pitesla.png]  

version 3


\Benchmarks


En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son : AXPY - Suma vector - vector DOT - Multiplicación vector - vector MATVECD - Multiplicación matriz - vector MATMAT - Multiplicación matriz - matriz


\Equipo de pruebas


CPU: Dual Intel Xeon Quad-core E5520 (Nehalem) GPU: NVIDIA Tesla C1060 RAM: 12GB


\Consideraciones


Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la liibería matemática MKL. Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas).

La gráfca que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU).


\Graficas


Upload:AxpyDP_pitesla.png Upload:DotDP_pitesla.png Upload:MatvecdDP_pitesla.png Upload:MatmatDP_pitesla.png


Powered By FusionForge