Search the entire project
This project's trackers
This project's forums
This project's releases
This project's documents
Project
People
Skill
This project's wiki
Advanced search
Log In
|
Get Help
Home
My Page
Projects
Code Snippets
Project Openings
OPTIMIZA
Summary
Activity
Forums
Tracker
Lists
Docs
SCM
Files
Wiki
Wiki Menu
Home Page
Recent Changes
Special Pages
Upload File
Page
Discussion
View Source
History
Page Info
Back Links
View Source:
Tesla C1060 SP
---- \**Equipo de pruebas** ---- CPU: Dual Intel Xeon Quad-core E5520 (Nehalem) GPU: NVIDIA Tesla C1060 RAM: 12GB ---- \**Consideraciones** ---- Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la librería matemática MKL. Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas). La gráfica que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU). ---- \**Graficas** ---- [Upload:AxpySP_Graph_pitesla.jpg] [Upload:DotSP_Graph_pitesla.jpg] [Upload:MatvecdSP_Graph_pitesla.jpg] [Upload:MatmatSP_Graph_pitesla.jpg]