PageDump: Benchmarks
View a wiki page in MIME format or download it as backup of a single page. A complete dump of all pages can be produced in PhpWikiAdministration.
Preview: Page dump of Benchmarks
(formatted for backing up: all revisions)Date: Thu, 22 Jul 2010 12:59:21 +0200 Mime-Version: 1.0 (Produced by PhpWiki 1.3.14-20090116) Message-Id: <1314-20090116-1279796361+0200-optimiza%3ABenchmarks@forge.cesga.es> Content-Type: multipart/mixed; boundary="=_multipart_boundary_2" --=_multipart_boundary_2 Content-Type: application/x-phpwiki; pagename=Benchmarks; flags=""; author=Marcos%20Fernandez%20Lopez; owner=Marcos%20Fernandez%20Lopez; version=10; lastmodified=1279796361; created=1278333675; author_id=Marcos%20Fernandez%20Lopez; markup=2; hits=1588; charset=UTF-8 Content-Transfer-Encoding: binary En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son: AXPY - Suma vector - vector DOT - Multiplicación vector - vector MATVECD - Multiplicación matriz - vector MATMAT - Multiplicación matriz - matriz A continuación se encuentran los enlaces que llevan a los tests y a la información sobre el equipo de pruebas. El nombre de cada enlace indica la GPU sobre la que se ha realizado el test y si los cálculos se han hecho en precisión simple (SP) o en doble precisión (DP): [[Tesla C1060 SP]] [[Tesla C1060 DP]] [[Quadro NVS 135M SP]] [[MAMGA vs CUBLAS]] --=_multipart_boundary_2 Content-Type: application/x-phpwiki; pagename=Benchmarks; flags=""; author=Marcos%20Fernandez%20Lopez; owner=Marcos%20Fernandez%20Lopez; version=9; lastmodified=1279191285; created=1278333675; author_id=Marcos%20Fernandez%20Lopez; markup=2; hits=1588; charset=UTF-8 Content-Transfer-Encoding: binary En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son: AXPY - Suma vector - vector DOT - Multiplicación vector - vector MATVECD - Multiplicación matriz - vector MATMAT - Multiplicación matriz - matriz A continuación se encuentran los enlaces que llevan a los tests y a la información sobre el equipo de pruebas. El nombre de cada enlace indica la GPU sobre la que se ha realizado el test y si los cálculos se han hecho en precisión simple (SP) o en doble precisión (DP): [[Tesla C1060 SP]] [[Tesla C1060 DP]] [[Quadro NVS 135M SP]] --=_multipart_boundary_2 Content-Type: application/x-phpwiki; pagename=Benchmarks; flags=""; author=Marcos%20Fernandez%20Lopez; owner=Marcos%20Fernandez%20Lopez; version=8; lastmodified=1279191258; created=1278333675; author_id=Marcos%20Fernandez%20Lopez; markup=2; hits=1588; charset=UTF-8 Content-Transfer-Encoding: binary En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son: **AXPY** - Suma vector - vector **DOT** - Multiplicación vector - vector **MATVECD** - Multiplicación matriz - vector **MATMAT** - Multiplicación matriz - matriz A continuación se encuentran los enlaces que llevan a los tests y a la información sobre el equipo de pruebas. El nombre de cada enlace indica la GPU sobre la que se ha realizado el test y si los cálculos se han hecho en precisión simple (SP) o en doble precisión (DP): [[Tesla C1060 SP]] [[Tesla C1060 DP]] [[Quadro NVS 135M SP]] --=_multipart_boundary_2 Content-Type: application/x-phpwiki; pagename=Benchmarks; flags=""; author=Marcos%20Fernandez%20Lopez; owner=Marcos%20Fernandez%20Lopez; version=7; lastmodified=1279191128; created=1278333675; author_id=Marcos%20Fernandez%20Lopez; markup=2; hits=1588; charset=UTF-8 Content-Transfer-Encoding: binary En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son : **AXPY** - Suma vector - vector **DOT** - Multiplicación vector - vector **MATVECD** - Multiplicación matriz - vector **MATMAT** - Multiplicación matriz - matriz A continuación se encuentran los enlaces que llevan a los tests y a la información sobre el equipo de pruebas. El nombre de cada enlace indica la GPU sobre la que se ha realizado el test y si los cálculos se han hecho en precisión simple (SP) o en doble precisión (DP): [[Tesla C1060 SP]] [[Tesla C1060 DP]] [[Quadro NVS 135M SP]] --=_multipart_boundary_2 Content-Type: application/x-phpwiki; pagename=Benchmarks; flags=""; author=Marcos%20Fernandez%20Lopez; owner=Marcos%20Fernandez%20Lopez; version=6; lastmodified=1279191094; created=1278333675; author_id=Marcos%20Fernandez%20Lopez; markup=2; hits=1588; charset=UTF-8 Content-Transfer-Encoding: binary En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son : AXPY - Suma vector - vector DOT - Multiplicación vector - vector MATVECD - Multiplicación matriz - vector MATMAT - Multiplicación matriz - matriz A continuación se encuentran los enlaces que llevan a los tests y a la información sobre el equipo de pruebas. El nombre de cada enlace indica la GPU sobre la que se ha realizado el test y si los cálculos se han hecho en precisión simple (SP) o en doble precisión (DP): [[Tesla C1060 SP]] [[Tesla C1060 DP]] [[Quadro NVS 135M SP]] --=_multipart_boundary_2 Content-Type: application/x-phpwiki; pagename=Benchmarks; flags=""; author=Marcos%20Fernandez%20Lopez; owner=Marcos%20Fernandez%20Lopez; version=5; lastmodified=1279190923; created=1278333675; author_id=Marcos%20Fernandez%20Lopez; markup=2; hits=1588; charset=UTF-8 Content-Transfer-Encoding: binary [[Tesla C1060 SP]] [[Tesla C1060 DP]] [[Quadro NVS 135M SP]] --=_multipart_boundary_2 Content-Type: application/x-phpwiki; pagename=Benchmarks; flags=""; author=Marcos%20Fernandez%20Lopez; owner=Marcos%20Fernandez%20Lopez; version=4; lastmodified=1278336003; created=1278333675; author_id=Marcos%20Fernandez%20Lopez; markup=2; hits=1588; charset=UTF-8 Content-Transfer-Encoding: binary En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son : AXPY - Suma vector - vector DOT - Multiplicación vector - vector MATVECD - Multiplicación matriz - vector MATMAT - Multiplicación matriz - matriz ---- \**Equipo de pruebas** ---- CPU: Dual Intel Xeon Quad-core E5520 (Nehalem) GPU: NVIDIA Tesla C1060 RAM: 12GB ---- \**Consideraciones** ---- Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la librería matemática MKL. Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas). La gráfica que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU). ---- \**Graficas** ---- [Upload:AxpyDP_pitesla.png] [Upload:DotDP_pitesla.png] [Upload:MatvecdDP_pitesla.png] [Upload:MatmatDP_pitesla.png] --=_multipart_boundary_2 Content-Type: application/x-phpwiki; pagename=Benchmarks; flags=""; author=Marcos%20Fernandez%20Lopez; owner=Marcos%20Fernandez%20Lopez; version=3; lastmodified=1278333848; created=1278333675; author_id=Marcos%20Fernandez%20Lopez; markup=2; hits=1588; charset=UTF-8 Content-Transfer-Encoding: binary En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son : AXPY - Suma vector - vector DOT - Multiplicación vector - vector MATVECD - Multiplicación matriz - vector MATMAT - Multiplicación matriz - matriz ---- \**Equipo de pruebas** ---- CPU: Dual Intel Xeon Quad-core E5520 (Nehalem) GPU: NVIDIA Tesla C1060 RAM: 12GB ---- \**Consideraciones** ---- Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la liibería matemática MKL. Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas). La gráfca que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU). ---- \**Graficas** ---- [Upload:AxpyDP_pitesla.png] [Upload:DotDP_pitesla.png] [Upload:MatvecdDP_pitesla.png] [Upload:MatmatDP_pitesla.png] --=_multipart_boundary_2 Content-Type: application/x-phpwiki; pagename=Benchmarks; flags=""; author=Marcos%20Fernandez%20Lopez; owner=Marcos%20Fernandez%20Lopez; version=2; lastmodified=1278333755; created=1278333675; author_id=Marcos%20Fernandez%20Lopez; markup=2; hits=1588; charset=UTF-8 Content-Transfer-Encoding: binary En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son : AXPY - Suma vector - vector DOT - Multiplicación vector - vector MATVECD - Multiplicación matriz - vector MATMAT - Multiplicación matriz - matriz ---- \**Equipo de pruebas** ---- CPU: Dual Intel Xeon Quad-core E5520 (Nehalem) GPU: NVIDIA Tesla C1060 RAM: 12GB ---- \**Consideraciones** ---- Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la liibería matemática MKL. Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas). La gráfca que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU). ---- \**Graficas** ---- [Upload:AxpyDP_pitesla.png] [Upload:DotDP_pitesla.png] [Upload:MatvecdDP_pitesla.png] [Upload:MatmatDP_pitesla.png] --=_multipart_boundary_2 Content-Type: application/x-phpwiki; pagename=Benchmarks; flags=""; author=Marcos%20Fernandez%20Lopez; owner=Marcos%20Fernandez%20Lopez; version=1; lastmodified=1278333675; created=1278333675; author_id=Marcos%20Fernandez%20Lopez; markup=2; hits=1588; charset=UTF-8 Content-Transfer-Encoding: binary ---- \**Benchmarks** ---- En este apartado se recogen una serie de tests destinados a medir el rendimiento y la fiabilidad de los cálculos realizados en GPU. Los tests analizados son : AXPY - Suma vector - vector DOT - Multiplicación vector - vector MATVECD - Multiplicación matriz - vector MATMAT - Multiplicación matriz - matriz ---- \**Equipo de pruebas** ---- CPU: Dual Intel Xeon Quad-core E5520 (Nehalem) GPU: NVIDIA Tesla C1060 RAM: 12GB ---- \**Consideraciones** ---- Para las pruebas de CPU se ha utilizado la última versión (11.072) de los compiladores de Intel para Fortran, y la liibería matemática MKL. Para las pruebas de GPU se ha utilizado la versión 3.0 del compilador de nVidia para CUDA, nvcc, y la librería CUDA BLAS (cuBlas). La gráfca que está identificada como (No Tras), indica que en el cálculo de FLOPS no se ha tenido en cuenta el tiempo de traspaso o trasiego de información entre CPU y GPU, mientras que en la gráfica con el comentario (Tras) sí se ha tenido en cuenta este tiempo (CPU -> GPU -> CPU). ---- \**Graficas** ---- [Upload:AxpyDP_pitesla.png] [Upload:DotDP_pitesla.png] [Upload:MatvecdDP_pitesla.png] [Upload:MatmatDP_pitesla.png] --=_multipart_boundary_2--Preview as developer format | Preview as normal format
Warning: Please use one of the downloadable versions rather than copying and pasting from the above preview. The wordwrap of the preview doesn't take nested markup or list indentation into consideration! PhpWiki developers should manually inspect the downloaded file for nested markup before rewrapping with emacs and checking into CVS.
Download for backup
| Download all revisions for backup
| Download for CVSEnter exact page name to dump:
See also: ViewSource, PluginManager.