테크노아
> 기획&벤치 > Tip&Tech
개관.. 메모리에 대한 개략적 배경 설명
테크노아  |  webmaster@technoa.co.kr
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2000.08.21  19:31:00
트위터 페이스북 미투데이 요즘 네이버 구글 msn

Ace's Memory Guide

 

시작에 앞서...
본 기사는 미국의 하드웨어 관련 전문 사이트인 Ace's Hardware에 게재되었던, Johan De Gelas씨의  'Ace's Guide to Memory Technology, Part 2'를 우리말로 옮긴 것입니다. 수록된 모든 이미지와 캡션 역시 동일 출처에서 그대로 인용하였음을 밝힙니다.

■ 개관

램버스계와 (DDR) SDRAM 진영간의 시장쟁탈전은 오늘날 관련분야의 동호회나 통신 게시판 등을 달궈놓는 최대의 화두 가운데 하나이다. 일부 사용자들은 마치 이 논쟁이
인텔AMD의 또는, 좀더 흔해빠진 특정업체의 시장독점 문제로 변질된 것처럼 생각하는 경우도 있다. 램버스 메모리를 도입하고 이를 표준으로 밀어부치는 데 있어서 인텔이 몇가지 술수를 부렸다는 사실은 아무도 부인할 수 없겠지만, 재미없는 얘기는 시간이 있을 때 하도록 하고 이들 메모리 표준의 이면에 있는 기술적인 이슈들을 짚어보도록 하자.

■ 니드 포 스피드
이미 여러번 지적해 온 바와 같이, 작금의 느려터진 스펙의 메모리모듈은 보통 사용자들이 생각하는 수준 이상으로 점차 PC에서 중차대한 성능상의 병목요인으로 자리잡고 있다. 기억을 상기시키기 위해서, Ace's Hardware에의 Quest for Better Performance 섹션에서 이미 언급했던, 아래의 벤치마크 결과를 참조하기 바란다(테스트 시스템은 애슬론 1GHz, PC133 128MB SDRAM,
크리에이티브 지포스2 DDR였다.)

칩셋-메모리간 속도

퀘이크 III
(
일반모드)

퀘이크 III
(
하이퀄리티 모드, 800x600x32)

Indy3D
애니메이션
1024x768x16

익스펜더블
640x480x16

VIA KX-100

106.1

83

58.8

86

VIA KX-133

109.4

86,8

62

99.8

총증가율

3%

5%

5%

16%

위의 표에서 볼 수 있는 것처럼, CAD나 포토샵(PhotoShop)과 같이 대규모 데이터를 필요로 하는 어플리케이션만이 좀더 고대역의 메모리 속도를 요구하고 있는 것은 아니다. 게임 역시 좀더 많은 숫자의 폴리곤과 텍스쳐를 이용하고 있으며 따라서 더욱 고수준의 메모리대역을 필요로 하고 있다. 물론, 어플리케이션에서 필요로 하는 거의 대부분의 데이터와 명령어 따위를 CPU의 내부 캐시에 쑤셔넣는 방법도 시도될 수는 있다. 이를테면, 인텔 카퍼마인 펜티엄 III 지온 프로세서의 경우 최대 2MB 온다이 L2캐시가 지원된다. 2MB L2캐시를 탑재한 지온 프로세서라면 (x86으로서는) 대규모 프로세서급으로 볼 수 있어서, 탑재된 트랜지스터의 숫자도 무려 1억 4천만개에 달하지만, 그중에서 정작 로직에 할당된 것은 8백만에서 9백만개밖에 되지 않는다. 게다가, 가격도 엄청나게 고가인데다가(3천달러 이상), 현시점에서 700MHz 이상의 클럭을 갖는 제품은 존재하지도 않는다. 때문에, 통상의 데스크탑 PC용으로는 부적합하다.

우리가 현재 데스크탑 PC용으로 이용하는 어플리케이션은 크게 다음과 같은 2가지 부류로 나뉘어지는 것이 가능하다.

- 동영상 편집, 동영상 압축, 음성인식 등의 스트리밍 어플리케이션. 이러한 부류의 어플리케이션은 대규모의 데이터를 한꺼번에 압축하거나 압축 해제 또는        편집할 필요가 있다.
- '캐시 리필'하는 어플리케이션. 대부분의 데스크탑 프로그램은 캐시 미스가 발생할 경우 캐시라인을 채워넣기 위해서 메모리에 랜덤 억세스하는 데 256KB에서 512KB의 L2캐시 정도면 충분한 수준이다.

스트리밍 어플리케이션의 경우, 2MB L2캐시만으로는 부족하다. 캐시 리필하는 어플리케이션은, 2MB라면 그야말로 놀고 먹는 수준이며 따라서 온다이 L2캐시용의 다이면적을 까먹는 만큼 쓸데없는 비용을 지출하게 되는 셈이다. 그러므로 무작정 캐시 용량만을 대용량화하는 것은 비용만 쓸데없이 늘어날 뿐 근본적인 문제를 해결하는 것은 아니라고 볼 수 있다.

■ 대역폭이냐 레이턴시냐?
그러면, 우리가 필요로 하는 메모리 테크놀러지는 과연 어떤 것인가? 그 질문에 대한 대답은 다른 질문으로 대체할 수 있다. 프로세서를 가장 빈번하게 사용하는 어플리케이션은 무엇인가? 3D 애니메이션이나 CAD와 같은, 거의 모든 부류의 3D 어플리케이션과 게임이 해당된다. 3D 데이터의 형식을 갖는 지오메트리 연산이라든지 게임 화면을 연출하는 데 거쳐야만 하는 2D 데이터의 렌더링 과정 등은 스트리밍 어플리케이션의 전형 가운데 하나이지만, 렌더링과 지오메트리 연산의 일부분은 비디오 칩셋(GPU,
엔비디어 지포스나 ATi 래디언 같은)에서 비디오메모리와 같은 로컬메모리상에서 처리가 되고 있다.

CPU는 프로그램 로직(게임에서의 AI 루틴 등), 지오메트리 프로세싱(오브젝트가 실제 모니터 화면상으로 보이는 부분만을 판단하거나 곡면을 폴리곤단위로 분해하는 따위) 등의 작업을 처리한다. 이들 폴리곤을 비디오 칩셋으로 전송하는 과정에서의 성능은 거의 전적으로 대역폭에 의존하는 경우가 많다. 즉, 대량의 폴리곤(화면당 10만개 이상)을 처리하는 경우의 3D 어플리케이션만이 고대역을 필요로 하는 셈이다. 따라서, 상당수준의 대역폭이라면 지오메트리 스트림 정도는 감당할 수 있겠지만, 캐시 미싱 때문에 CPU는 계속 메인메모리를 억세스할 수 밖에 없다. 캐시 미싱이 일어난다는 것은, 쉽게 말하자면 CPU가 특정 데이터만을 기다리면서 마냥 허송세월하고 있는 상태를 의미한다. 따라서, 이러한 '중요 데이터(이하 크리티컬 워드
critical word)'가 도착하는 데 소요되는 클럭 사이클의 숫자를 지칭하는 용어인 레이턴시야말로 시스템의 효율과 전체 성능을 결정하는 데 있어서 중요한 지표가 된다. 레이턴시가 낮은 메모리를 이용하는 것은, 단순히 고대역의 메모리를 이용하는 것보다 통상의 데스크탑 어플리케이션에서 얻는 체감성능의 향상효과가 훨씬 높다.

대역폭은, 한꺼번에 얼마나 대량의 데이터를 CPU로 보내줄 수 있는지의 능력을 의미하는 것으로서, 게임과 같이 한꺼번에 대량의 폴리곤 떡칠이 필요한 경우, 또는 3DNow!나 iSSE와 같은 x86 확장 스트리밍 명렁어 세트의 코드가 증가하는 경우에 그 중요성이 더욱 높다. iSSE나 3DNow! 명령어 세트는 공히 프리페치
prefetch로 불리우는 명령어를 포함하고 있다. 프리페치는, 특정 프로그램이 수십 클럭 사이클 이내로 필요하게 될 것 같은 데이터를 문자 그대로 미리 불러놓는 역할을 한다. 이를테면, 특정 루프내에서 다음번의 루프 반복에 필요한 데이터를 요청하는 프리페치가 존재하는 경우를 생각해 보자. 이 경우 루프에 의해서 처리되는 데이터 어레이는, 각각의 구성 요소가 연속적으로 그 전번의 루프에서 처리된 데이터를 요구한다. 이러한 의미에서 볼 때, 프리페치는 일종의 '삑사리 안나게 해주도록' 데이터를 미리미리 로드해 놓는 편법이라고 보더라도 큰 무리는 없을 것 같다. 이상적으로는, 프로세서의 L1캐시는 프리페치에 의해서 CPU가 원하는 데이터나 명령어들로만 그득 차 있어야 한다. 이 경우 레이턴시는 그렇게 중요하지 않은데 이는 CPU가 필요한 데이터가 도착할 때까지 기다릴 필요가 없이 바로바로 L1캐시에 원하는 데이터 따위를 뽑아서 쓰면 되는 때문이며, 따라서 대역폭이 시스템 성능을 결정짓는다.

요약하자면, 크리티컬 워드 레이턴시야말로, 현시점에서는, 특히 게임에서 가장 중요한 성능지표가 된다는 것이다. 게임이나 CAD 어플리케이션과 같이, 대량의 폴리곤을 한꺼번에 돌려야 하거나, 대량의 SIMD 프리페치 명령어를 사용하는 특수한 어플리케이션의 경우에는 대역폭으로 인한 성능향상의 효과도 매우 크다.

좀더 얘기를 진행하기에 앞서서, 전체 기사에 대한 간단한 개관을 해보고, 특히 그중에서 우리가 관심이 있는 토픽에 대해서 짚고 넘어가 보도록 하자.

테크노아의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
이 기사에 대한 댓글 이야기 (3)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
hope21th
..
(2001-11-04 19:26:27)
blasty
메모리 용어는 확실히 이해도 어렵고 구분도 어렵네요
많이 본다고 봐도 헷갈리고....
종류도 너무 많고...
헤고 멀군요...배움의 길이.

(2002-01-03 19:38:55)
drevil
냉무.
(2002-10-28 17:13:51)
이 기사에 대한 댓글 이야기 (3)
e피플
[e피플] 나이가 대수? 공조냉동기계기능사 필기시험 100점 맞은 NCS교육생
[e피플] 나이가 대수? 공조냉동기계기능사 필기시험 100점 맞은 NCS교육생
나이가 들면 들수록 공부하기가 어렵다는 말이 있다. 더군다나 실업인 상태에서 공부하는 것이라면 부담이 더 클 수 밖에 없다.하지만 이를 비웃듯이 극복하고, 올해 2월 공조냉동기능사...

제호 : 테크노아  |  발행인 : 김필규  |  편집인 : 김필규  |  청소년보호책임자 : 박상규
서울지사 : 서울특별시 구로구 디지털로32가길 18, 7F | 제보 : it@technoa.co.kr
발행소 : 전라북도 전주시 완산구 전룡6길 6 3F | 등록번호 : 전라북도 아00057
등록일자 : 2008년 1월 14일  |  대표전화 : 070-8755-6291  |  FAX : 02-6280-9562
Copyright © 1999-2017 테크노아. All rights reserved. mail to technoa@technoa.co.kr