테크노아
> 기획&벤치 > 기획기사
GPGPU - CUDA에 대해 알아보다
테크노아  |  webmaster@technoa.co.kr
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2009.11.16  16:44:00
트위터 페이스북 미투데이 요즘 네이버 구글 msn

 

최근 들어 GPGPU(General-Purpose GPU)란 단어가 언론의 조명을 받으며 관심을 얻고 있다. 이름처럼 그래픽, 그 중에서도 3D 그래픽 연산에 특화된 GPU(Graphics Processing Units)를 3D 뿐 아니라 보다 다양한 용도로 사용하기 위한 것이 바로 이 GPGPU의 핵심인데, 이러한 기술의 등장 배경은 CPU에 못지않은 GPU의 성능 발전에 힘입은 바가 크다.

 

▲ RAMDAC의 성능에 의해 그래픽카드 성능이 좌우되었다.


초창기의 GPU의 성능은 지금 기준으로 보면 조악하기 그지없는 수준이었다. 불과 십 수년 전만 하더라도 현재의 GPU라는 개념은 존재하지 않았으며, 그래픽카드의 성능은 2D화면에 표시할 수 있는 컬러수와 최대 해상도, 그리고 RAMDAC의 성능에 의해 좌우되는 것이 보통이었기 때문이다.

그 뒤를 이어 출시된 3D 가속이 가능한 제품들 역시 초창기에는 독자적인 API를 사용하는 등 혼잡한 시기가 이어져왔지만 90년대의 폭발적인 하드웨어 성능 향상에 힘입어 GPU의 성능 향상 역시 빠르게 이루어졌다.

이러한 GPU의 성능 향상은 GPU의 트랜지스터 집적도만 봐도 한 눈에 드러나는데, 기본적인 회로 구조에서는 신호 증폭의 역할을 수행하는 트랜지스터는 집적 회로 내부에서 스위치의 역할을 수행하며, 다른 여러 부품들과 조합을 이루어 신호 처리 및 연산을 수행하는 유닛으로서 기능하기 때문이다.

 

▲ 엔비디아 G80 코어는 이미 i7과 비슷한 7억개의 트랜지스터를 집적했다.


따라서 이러한 집적 회로의 성능은 기본적으로 회로 내부의 트랜지스터가 빠른 속도로 동작하는지, 그리고 얼마나 많은 양이 집적되어 있는지에 의해 결정되는데, GPU의 집적도는 이미 2007년 등장한 NVIDIA의 G80 코어에서 7억개 트랜지스터를 집적하고 있어 7억 3000만개인 인텔의 i7 과 비슷한 수준을 달성했고, 최신의 GTX 280 시리즈에서는 무려 14억개의 트랜지스터를 내장하고 있어 오히려 CPU의 그것을 뛰어넘고 있는 셈이다.

또 GPU는 CPU와는 다른 설계 구조를 가지고 있는데, CPU의 경우보다 일반적인 용도로 사용되기에 다양한 명령어 셋을 포함한 긴 파이프라인을 가지는 반면, GPU의 경우 그 용도는 3D 연산에 한정되어 다수의 셰이더 유닛을 배치해 병렬로 데이터를 연산하는 구조를 가진다.

 

▲ DirectX 10 세대에 들어서는 통합 쉐이더 구조를 사용하게 됐다.


그리고 최근 DirectX 10 세대에 들어 일반화된 통합 셰이더 구조(Unified Shader Architecture)의 경우 픽셀 셰이더와 버텍스 셰이더로 각각 나뉘던 과거와는 달리 고성능의 스트림 프로세서 유닛을 다수 구성해 필요에 따라 프로그램으로 그 용도를 지정할 수 있다. GPGPU는 이러한 GPU의 특성을 반영해 GPU를 이른바 하나의 Co-Processor 처럼 활용하는 기술이다.

최근 GPU들의 경우 수십~수백개의 스트림 프로세서를 탑재하고 있기에 이러한 병렬 연산시의 성능 향상 폭은 더욱 커진다. 때문에 이러한 GPU의 성능을 3D 연산뿐 아니라 다양한 분야에 활용하기 위한 움직임이 커지고 있으며, GPU 제조사들 역시 이러한 GPGPU 기술에 대한 지원을 넓히고 있는데 현재로서는 보다 빠른 행보를 보이는 곳이 바로 NVIDIA이다.

 



▲ 엔비디아 CUDA를 활용한 가장 대표적인 Foldin@home과 PhysX 물리엔진 가속이 적용된
배트맨-아캄 어사일럼 게임


NVIDIA는 CUDA 발표 시기부터 어플리케이션 제조사들과 긴밀한 협조를 통해 동영상 인코딩은 물론 AEGIA를 인수한 후 물리엔진 가속을 위한 기술인 PhysX를 CUDA를 통해 지원하도록 한 것은 물론 최근에는 표준 GPGPU API인 OpenCL은 물론 윈도우 7에서 지원하는 DirectCompute까지 그 지원의 폭을 넓히고 있다. 테크노아에서는 이러한 NVIDIA의 GPGPU 기술인 CUDA의 실제 활용 능력에 대해 다루어 보려고 한다.

[관련기사]

테크노아의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
이 기사에 대한 댓글 이야기 (13)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
김정만
95지뢰 갹~
(2010-02-24 08:39:33)
김정만
꺅 배트맨인가? ㅋ
(2010-02-24 08:39:14)
주상호
CUDA의 기술이 이렇게 좋은지 몰랐네요.
앞으로 엔비디아에 더욱 관심을 가져야 겠군요.

(2009-11-20 23:13:30)
서원준
오우~~!! 쿠다의 기술력은 정말 상상을 초월할 정도로 대단하네요.. 일부 기술은 좀 더 가다듬어야 되겠지만요..
(2009-11-19 15:41:37)
지혜용
쿠다가 확실히 다양한 활용이 가능한 점은 있지만
업계 표준이 아니라는 약점을 극복할 수 있을지 모르겠네요.
이미 업계의 공동(?) 대응이 시작되었으니..

(2009-11-17 22:45:55)
서원준
쿠다의 기술은 정말 대단하네요. 역시 엔비디아답습니다!!
(2009-11-17 06:39:50)
오경열
앞으로의 발전이 기대되네요.
(2009-11-17 03:58:05)
조민철
적어도 새로운 기준이 하나 생기겠네요 ...
(2009-11-17 02:12:52)
정대성
확실히 쿠다 사용하면 시간이 엄청 줄어드네요
(2009-11-17 00:14:53)
장성환
경쟁사들에서도 관련기술을 지원하기 시작했지만, 좀 더 빨리 시작한 CUDA의 경우 기사에 사용된 프로그램들 외에도 적용가능한 프로그램들이 많아서, 엔비디아 그래픽카드 사용자들에게는 큰 이점이라 생각합니다.
(2009-11-16 21:11:50)
김강현
인코딩은 아직 여러모로 발전이 되어야겠더군요..
(2009-11-16 20:53:24)
이우진
엄청나네요
(2009-11-16 19:22:14)
서재득
CUDA의 기술 정말 인정하지 않을수 없는 기술이네요.
사용과 미사용의 차이가 확연히 나타나는군요.

(2009-11-16 17:12:15)
이 기사에 대한 댓글 이야기 (13)
e피플
[e피플] 나이가 대수? 공조냉동기계기능사 필기시험 100점 맞은 NCS교육생
[e피플] 나이가 대수? 공조냉동기계기능사 필기시험 100점 맞은 NCS교육생
나이가 들면 들수록 공부하기가 어렵다는 말이 있다. 더군다나 실업인 상태에서 공부하는 것이라면 부담이 더 클 수 밖에 없다.하지만 이를 비웃듯이 극복하고, 올해 2월 공조냉동기능사...
제호 : 테크노아  |  발행인 : 김필규  |  편집인 : 김필규  |  청소년보호책임자 : 박상규
서울지사 : 서울특별시 구로구 디지털로32가길 18, 7F | 제보 : it@technoa.co.kr
발행소 : 전라북도 전주시 완산구 전룡6길 6 3F | 등록번호 : 전라북도 아00057
등록일자 : 2008년 1월 14일  |  대표전화 : 070-8755-6291  |  FAX : 02-6280-9562
Copyright © 1999-2017 테크노아. All rights reserved. mail to technoa@technoa.co.kr