Advanced search
Log In | Get Help   
Home My Page Projects Code Snippets Project Openings OPTIMIZA
Summary Activity Forums Tracker Lists Docs SCM Files Wiki


Wiki Menu
 

Tesla C1060 SP



\Equipo de pruebas


CPU: Dual Intel Xeon Quad-core E5520 (Nehalem)

GPU: NVIDIA Tesla C1060

RAM: 12GB


\Consideraciones


Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la librería matemática MKL.

Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas).

La gráfica que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU).


\Graficas


Upload:AxpySP_Graph_pitesla.jpg Upload:DotSP_Graph_pitesla.jpg Upload:MatvecdSP_Graph_pitesla.jpg Upload:MatmatSP_Graph_pitesla.jpg


Powered By FusionForge