Loading...
Please wait, while we are loading the content...
Similar Documents
Técnicas de programação e avaliação de desempenho de solvers de sistemas de equações lineares em sistemas computacionais de alto desempenho.
| Content Provider | Semantic Scholar |
|---|---|
| Author | Ferreira, Alexandre Beletti |
| Copyright Year | 2013 |
| Abstract | Engineering problems today have increased their order of magnitude, due to several factors. Modeling these problems with computers brings up certain limitations, as the amount of processing time needed for several simulations and the lack of available memory to properly allocate them. The resolution of large systems of linear equations, commonly discussed in current engineering problems, needs the exploration of the two situations mentioned above. The subarea that allows exploring the computational time reduction and the possibility of allocating memory in such problems is called high performance computing. The aim of this paper is to illustrate the use of software to solve systems of linear equations, called solvers, designed for high performance computing environments, to test and evaluate them for a set of matrices as well as to address the computational details involved in such procedures. Palavras: solver, high performance computing, systems of linear equations. LISTA DE ILUSTRAÇÕES Figura 2.1 – Arquitetura SISD. . 19 Figura 2.2 – Arquitetura MISD. . 19 Figura 2.3 – Arquitetura SIMD. . 20 Figura 2.4 – Arquitetura MIMD. . 20 Figura 2.5 – MIMD de Memória Compartilhada. . 21 Figura 2.6 – MIMD de Memória Distribuída. . 22 Figura 2.7 – UCP, variáveis e pilha acessadas por único processo. . 26 Figura 2.8 – Quatro transições entre processos. . 27 Figura 2.9 – Três processos com linha de controle e contador de programa. . 28 Figura 2.10 – Um processo com três linhas de controle e contador de programa. . 28 Figura 3.1 Bloco cíclico e estrutura que armazena o bloco local de coluna de L. . 57 Figura 3.2 – Liberando recursos no SuperLU. . 61 Figura 3.3 – Trecho de código com exemplo do uso de “job”. . 65 Figura 3.4 – Trecho de código com exemplo da fase de análise do MUMPS. . 68 Figura 3.5 – Trecho de código com exemplo da fase de fatoração do MUMPS. . 69 Figura 3.6 – Trecho de código com exemplo da fase de fatoração do MUMPS. . 70 Figura 3.7 – Trecho de código com exemplo da fase de fatoração do MUMPS. . 70 Figura 3.8 – Rotinas de manipulação de vetores do PETSc. . 72 Figura 3.9 – Rotinas de manipulação de matrizes do PETSc. . 73 Figura 3.10 – Rotinas de resolução de sistemas do solver PETSc. . 75 Figura 4.1 – Matrizes Diagonais. . 78 Figura 4.2 – Matriz Skyline. . 79 Figura 4.3 – Perfil Skyline. . 7 9 Figura 4.4 Matrizes Diagonais: (a) bcsstm02, (b) bcsstm22, (c) bcsstm08, (d) bcsstm25 e (e) bcsstm39. . 80 Figura 4.5 – Matrizes Diagonais: solvers PETSc e MUMPS. . 82 Figura 4.6 Matrizes Esparsas com Diagonais Densas: (a) LFAT5, (b) mhdb416, (c) nos2 e (d) LFAT5000. . 84 Figura 4.7 Matrizes Esparsas com Diagonais Densas: solvers PETSc e MUMPS. 86 Figura 4.8 – Matrizes Diagonais com Elementos Próximos a Diagonal: (a) nos4, (b) nos5, (c) nos6, (d) nos7 e (e) nos3. . 87 Figura 4.9 Matrizes Esparsas com Elementos Não Nulos Próximos a Diagonal Principal: comparação entre PETSc e MUMPS . 89 Figura 4.10 – Elementos não nulos da matriz “parabolic_fem”. . 90 Figura 4.11 – Tempos de execução da matriz “parabolic_fem”. . 92 Figura 4.12 – Elementos não nulos da matriz “G3_circuit”. . 93 Figura 4.13 – Tempos de execução da matriz “G3_circuit”. . 94 Figura 4.14 – Elementos não nulos da matriz “thermal2”. . 95 Figura 4.15 Tempos de execução da matriz “thermal2". . 96 Figura 4.16 – Elementos não nulos da matriz “ecology2”. . 97 Figura 4.17 – Tempos de execução da matriz “ecology2”. . 98 Figura 4.18 – Elementos não nulos da matriz “apache2”. . 99 Figura 4.19 – Tempos de execução da matriz “apache2”. . 101 Figura 4.20 – Elementos não nulos da matriz “af_shell8”. . 102 Figura 4.21 – Tempos de execução da matriz “af_shell8”. . 103 Figura 4.22 – Elementos não nulos da matriz “tmt_sym”. . 104 Figura 4.23 – Tempos de execução da matriz “tmt_sym”. . 105 Figura 4.24 – Elementos não nulos da matriz “af_1_k101”. . 106 Figura 4.25 – Tempos de execução da matriz “af_1_k101”. . 107 Figura 4.26 – Matriz “parabolic_fem” Speedup dos solvers. . 110 Figura 4.27 – Matriz “parabolic_fem” Eficiência dos solvers. . 111 Figura 4.28 – Matriz “G3_circuit” Speedup dos solvers. . 112 Figura 4.29 – Matriz “G3_circuit” Eficiência dos solvers. . 113 Figura 4.30 – Matriz “thermal2” Speedup dos solvers. . 11 4 Figura 4.31 – Matriz “thermal2” – Eficiência dos solvers. . 114 Figura 4.32 – Matriz “ecology2” Speedup dos solvers. . 11 5 Figura 4.33 – Matriz “ecology2” Speedup do solvers: MUMPS (a) e SuperLU (b). 116 Figura 4.34 – Matriz “ecology2” Eficiência dos solvers. . 117 Figura 4.35 – Matriz “apache2” Speedup dos solvers. . 11 7 Figura 4.36 – Matriz “apache2” Eficiência dos solvers. . 118 Figura 4.37 – Matriz “af_shell8” Speedup dos solvers. . 11 9 Figura 4.38 – Matriz “af_shell8” Speedup do solvers: MUMPS (a) e SuperLU (b). 119 Figura 4.39 – Matriz “af_shell8” Eficiência dos solvers. . 120 Figura 4.40 – Matriz “tmt_sym” Speedup dos solvers. . 1 21 Figura 4.41 – Matriz “af_shell8” Eficiência dos solvers. . 121 Figura 4.42 – Matriz “af_1_k101” Speedup dos solvers. . 122 Figura 4.43 – Matriz “af_1_k101” Eficiência dos solvers. . 123 Figura 4.44 – Matriz “parabolic_fem” – Volume MPI. . 124 Figura 4.45 – Matriz “G3_circuit” – Volume MPI. . 125 Figura 4.46 – Matriz “thermal2” – Volume MPI. . 126 Figura 4.47 – Matriz “ecology2” – Volume MPI. . 127 Figura 4.48 – Matriz “apache2” – Volume MPI. . 128 Figura 4.49 – Matriz “af_shell8” – Volume MPI. . 129 Figura 4.50 – Matriz “tmt_sym” – Volume MPI. . 130 Figura 4.51 – Matriz “af_1_k101” – Volume MPI. . 131 Figura 4.52 – Matriz “parabolic_fem” – Rotinas MPI do MUMPS. . 132 Figura 4.53 – Matriz “parabolic_fem” – Rotinas MPI do SuperLU. . 133 Figura 4.54 – Matriz “parabolic_fem” – Rotinas MPI do PETSc. . 134 Figura 4.55 – Matriz “G3_circuit” – Rotinas MPI do MUMPS. . 135 Figura 4.56 – Matriz “G3_circuit” – Rotinas MPI do SuperLU. . 136 Figura 4.57 – Matriz “G3_circuit” – Rotinas MPI do PETSc. . 137 Figura 4.58 – Matriz “thermal2” – Rotinas MPI do MUMPS. . 138 Figura 4.59 – Matriz “thermal2” – Rotinas MPI do SuperLU. . 138 Figura 4.60 – Matriz “thermal2” – Rotinas MPI do PETSc. . 139 Figura 4.61 – Matriz “ecology2” – Rotinas MPI do MUMPS. . 140 Figura 4.62 – Matriz “ecology2” – Rotinas MPI do SuperLU. . 140 Figura 4.63 – Matriz “ecology2” – Rotinas MPI do PETSc. . 141 Figura 4.64 – Matriz “apache2” – Rotinas MP |
| File Format | PDF HTM / HTML |
| DOI | 10.11606/T.3.2013.tde-15102014-162638 |
| Alternate Webpage(s) | https://teses.usp.br/teses/disponiveis/3/3144/tde-15102014-162638/publico/Tese_ALEXANDRE_BELETTI_FERREIRA.pdf |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Thesis |