CONICET | Buscador de Institutos y Recursos Humanos

INVESTIGADORES

STORTI Mario Alberto

datos académicos

artículos

libros

capítulos de libros

congresos y reuniones científicas

convenios, asesorías y/o servicios tecnológicos

congresos y reuniones científicas

Título:

Algebra Lineal en OpenCL

Autor/es:

COSTARELLI, SANTIAGO; PAZ RODRIGO; DALCÍN LISANDRO; STORTI M.

Lugar:

Buenos Aires

Reunión:

Congreso; MECOM 2010 - IX Congreso Argentino de Mecánica Computacional. II Congreso Sudamericano de Mecánica Computacional. CILAMCE 2010 - XXXI Congreso Ibero-Latino-Americano de Métodos Computacionales en la Ingeniería; 2010

Institución organizadora:

Asociación Argentina de Mecánica Computacional AMCA

Resumen:

tivados por el vasto crecimiento sobre las tecnologías en placas procesadoras de video y las versiones recientes de dispositivos para cálculo de propósito general GPGPUs (General Purpose Graphic Processing Unit), es que se presenta en este trabajo algunos desarrollos de cálculo paralelo en Algebra Lineal utilizando OpenCL, un estándar de reciente concepción para la programación en GPGPUs libre de regalías, que utiliza un subconjunto de operaciones deﬁnidas del estándar C99 de la ISO. En las primeras secciones se presenta la arquitectura CUDA (teniendo en cuenta que OpenCL se basa en ella) analizando los elementos que la componen, brindando lineamientos básicos en cuanto al uso. A continuación se presentan diferentes métodos para el cálculo de operaciones básicas de Algebra Lineal. Con respecto a las implementaciones de las operaciones propuestas, se analizan diferentes versiones de la misma operación valiendonos de las bondades que nos brinda la arquitectura CUDA, entre ellas: operaciones en memoria global, memoria local (o shared), combinaciones de las anteriores y cálculo multiGPU; teniendo en cuenta aquí las propiedades de memory coalescing, divergencia de workItems dentro del warp, por nombrar algunas. Además, se estudia la inﬂuencia de las cifras decimales exigidas sobre el costo computacional y la utilización de parámetros de optimización ya sea mediante directivas al compilador o funciones built-in provistas por OpenCL. Finalmente, se estudian las performances de los algoritmos anteriormente nombrados utilizando para los casos de estudio tecnologías NVIDIA Tesla C1060 y procurando establecer las deﬁciencias de la misma en relación a la arquitectura NVIDIA Fermi.

enviar mensaje