Arquitectures Vectorials (AV)
Professors Responsables: |
JOSEP LLUIS LARRIBA I PEY (larri ac.upc.edu)
|
|
Crèdits: 6.0 (3.0 T 1.5 P 1.5 L)
|
Departament:
AC
|
Tipus d'assignatura
Optativa per la EI , ETIS
Requisits de l'assignatura
AC
- Pre-correquisit per la EI , ETIS
|
|
Objectius docents
El análisis de programas científico-técnicos muestra que gran parte de las operaciones se efectúan sobre vectores y matrices. El objetivo de esta asignatura es estudiar arquitecturas que, a fin de aumentar las prestaciones, incluyen en su lenguaje máquina instrucciones vectoriales, junto con la utilitzación intensiva de las técnicas de segmentación y replicación. Otro objetivo consiste en mostrar el rendimiento que se puede obtener de los procesadores vectoriales si se utilizan programas escritos en un lenguaje secuencial y se utiliza un compilador que vectoriza.
Programa
1. Introducció als Processadors Vectorials.
- Factors que limiten el rendiment dels processadors segmentats. - Característiques de les operacions vectorials. - Concepte de processador vectorial. - Llei d'Amdahl.
2. Estructura d'un computador vectorial.
- Llenguatge màquina. Conjunt senzill d'instruccions vectorials. - Estructura del processador. Exemples de camins de dades. - Estructura de la memòria. - Model de rendiment de l'execució d'una instrucció vectorial. - Execució solapada i encadenada d'operacions vectorials. - Model de rendiment per a diverses instruccions. - Operacions amb vectors llargs. Particionat de bucles. - Model de rendiment de bucles.
3. Ampliació del Llenguatge Màquina.
- Accessos amb pas i avaluació del rendiment. - Bucles amb sentències condicionals. Vector de màscara. - Bucles amb accessos a estructures amb índexos indexats. Vector d'índexos.
4. Arquitectures vectorials actuals
- Cray T90 (1 processador) - Fujitsu VPP300 (1 processador)
5. Vectorització.
- Anàlisi de dependències. - Tècniques per incrementar la vectoritzabilitat dels bucles.
6. Programació i Rendiment.
- Formes per a la mutiplicació de matriu per vector. Algoritmes a blocs. - Vectorització de recurrències. - Rendiment a nivell d'algoritmes.
Avaluació
La nota final (NF) s'obtindrà a partir de la nota de laboratori (NL) i la nota de l'examen final (NT) d'aquesta manera: si (NT >= 4) llavors NF = max (NT, 0,7*NT + 0,3*NL) si no NF=min (4, 0,7*NT + 0,3*NL)
Bibliografia
Bibliografia bàsica
- J.L. Hennessy and D.A. Patterson Computer Architecture. A Quantitative Approach Morgan Kaufmann Publishers, Inc, 1990 - R.W.Hockney and C.R.Jesshope Parallel Computers 2 OP Publishing, 1988 - Willi Schonauer Scientific Supercomputing: Architecture and Use of Shared and Distributed Memor http://www.uni-karlsruhe.de/Uni/RZ/Personen/rz03/book/, - D.A Padua and M.J.Wolfe Advanced Compiler Optimizations for Supercomputers Communications of the ACM, Vol 29, num
12, 1986 - J.J.Dongarra & A.Karp Implementing linear algebra algorithms
for dense matrices on a vector pipeline SIAM Review, Vol. 26, n.
1, 1984
|