Comparativo de desempenho de execução de Algoritmos no CUDA e no OpenCL

Antonio Raian de Lima Mendes

Resumo


Com o avanço tecnológico surgiu a necessidade de processar dados de forma
mais rápida e eficaz. Dando origem à Computação Paralera (CP) (ROCHA,
2007/2008) e os processadores capazes de atender as necessidades da mesma que são os
multicore ou os manycore. Um exemplo de processadores que se assemelham aos
manycore, possuindo dezenas de unidades de processamento, são as Placas Gráficas
(GPU). As GPUs foram projetadas para auxiliar em cálculos de uso intensivos dos
processadores comuns, elas possuem muito mais núcleos de processamentos que
permite a execução simultânea de operações idênticas sobre dados diferentes (SIMD)
(DE PAULA, 2014).
Novas plataformas para gerenciar a implementação de algoritmos foram criadas
e com elas outras tecnologias como Application Programming Interface (API) e
bibliotecas foram aprimoradas. APIs e bibliotecas são interfaces usadas para acessar
algumas funções existentes sem necessariamente saber como o código fonte funciona, a
diferença básica é que as primeiras são mantidas por entidades e isso agrega uma
confiabilidade maior aos serviços. Atualmente, as plataformas que mais se destacam
para computação paralela usando GPU são: CUDA (Compute Unified Device
Architecture), OpenCL (Open Computing Language) e Direct Compute (Microsoft).
A CUDA foi criada pela NVIDIA em 2006, com o intuito de otimizar a
execução de algoritmos nas placas desenvolvidas por esta empresa. O OpenCL,
desenvolvido pela Khronos, é uma plataforma aberta que comporta a paralelização de
aplicações e, também, admite a elaboração de códigos heterogêneos podendo assim
aproveitar tanto a CPU quanto a GPU (TSUCHIYAMA, 2010). Visto que no
Laboratório de Computação de Alto Desempenho (LaCAD) da Universidade Estadual
de Feira de Santana (UEFS) existem GPU da NVIDIA, foi possível utilizar ambas as
plataformas. Dessa forma, esse trabalho teve o objetivo de testar e identificar, dentre
elas, a que potencializa a criação de sistemas de alto desempenho para atender as
necessidades do laboratório.


Texto completo:

PDF

Apontamentos

  • Não há apontamentos.