테크노아
> 기획&벤치 > 벤치마크
DDR vs. Dual RDRAM
테크노아  |  webmaster@technoa.co.kr
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2000.06.01  11:33:00
트위터 페이스북 미투데이 요즘 네이버 구글 msn

DDR vs. Dual RDRAM

시작에 앞서...

본 기사는 하드웨어 관련 전문 사이트인 Simmtester에 게재되었던, Bert McComas씨의 'An Exhaustive Performance Analysis of Intel 840+RDRAM vs. Micron DDR Reference Platform'를 우리말로 옮긴 것입니다. 수록된 모든 이미지 역시 동일 출처에서 그대로 인용하였슴을 밝힙니다.

서론

Direct Rambus 는 1999년 9월 처음 도입이  되었으나 이후 계속되는 높은 가격과 낮은 생산 수율 그리고 기술적인 문제로 인한  비난을 감수해야만 했으며 더불어 성능에 대한 의문까지 제기되었다. 또한 설상가상으로 인텔에서 발표한 RDRAM 지원 플랫폼인 820 칩셋에 대해서도 현재 대중 매체와 인터넷상에서 불평이 끊이지 않고 있다. 일반 시장에서 시스템과 메인보드 제작업체들은 820 칩셋 장착 제품이 판매가 되지 않고 재고가 쌓여간다고 하소연을 하고 있다. 이렇듯 820 칩셋이 궁지에 몰려 있는 동안 VIA를 주축으로한 반인텔 진영의 PC 133 플랫폼은 자연스럽게 시장에서 주류를 차지하고 있다.

820 칩셋은 인텔의 기대에 어긋나는 결과를 가져왔고 인텔의 840 듀얼 채널 Rambus가 RDRAM 성능을 대체하기 위한 레퍼런스 플랫폼 역할을 담당하게 될 것으로 보인다. 따라서 앞으로 PC의  주요한 메모리 표준과 성능에 대한 차세대 대결은 인텔의 840 칩셋에 기반을 둔 듀얼 Rambus와 DDR의 대결이 될 것으로 보인다. 그래픽 보드용 DDR 은 이미 300 MHz의 클럭으로 양산이 되고 있으며 DDR 메모리를 지원하는 메인보드의 양산은 3/4 분기에 시작될 것이라고 한다. 이와 같이, 현재로서는 여러 주변 환경으로 볼때 DDR 메모리가 승산이 있다고 할 수 있으며 업계 내부 관계자들에 따르면 이미 시장에 진입할 만반의 준비를 한 것으로 알려지고 있다.

현재로서는 Micron사가 Samurai DDR 메모리로 시장 생산량을 주도하고 있으며 VIA, AMD, ALI, nVidia, Transmeta, Serverworks, Intel 그리고 기타 나머지 업체들 또한 데스크탑 , 워크스테이션, 노트북, 정보기기, 게임 PC, 서버용으로 DDR 메모리와 칩셋을 지원하게 된다.  현재까지는 Rambus 메모리는 한 업체에 의해 두 개의 칩셋만이 지원되고 있으며 이 두 칩셋 모두 미미한 시장 점유율을 보여 주고 있다.

테스트 플랫폼 - DDR & RDRAM

1999년 11월과 12월에 많은 언론은 Micron사의 Samurai DDR이 벤치마크에서 보여준 놀라운 결과를 크게 보도하였다. 필자 또한 테스트실에서 이 플래폼을 일주일간 테스트할 수 있는 행운을 안게 되었다.

필자가 테스트에 사용한 시스템의 메인보드는 buffered 또는 unbuffered DDR SDRAM를 지원하며 64-bit 과 32-bit PCI 슬롯 , 듀얼 프로세서 슬롯, 4 DIMM 메모리 슬롯을 지원한다. 이 보드는  PC 2100 (266MHz)으로 인증이 되지 않은 메모리를 사용할 때 단지 2-3개의 DIMM 슬롯만을 사용하게 된다. 비록 모든 부적절한 상황을 피하기 위해 ATA-66 모드를 사용하지만 이 보드는 또한   ATA-100 지원이 가능한 새로운 사우스 브리지 칩을 포함하고 있다. 필자는 256MB unbuffered  DDR SDRAM, 하나의 IBM 10G 드라이브 , nVidia GeForce 가속기가 탑재된 시스템을 구성하였으며, 인텔의 840 칩셋 메인보드는 256MB PC 800 RDRAM을 이용하여 동일하게 구성되어져 있다.

이 두 테스트 시스템 모두 최신 IBM 10G 드라이브 ATA 66 하드디스크 드라이브를 장착했으며 운영체제로는 마이크로소프트Windows NT 와 Windows 98 SE를 사용하였다. 그래픽 카드의 드라이버는 nVidia 의 Detonator 3.65 그래픽 드라이버를 이용하였고  Micron사의 시스템에서는 AGP FastWrites를 가능하게 하는 최신 GART 드라이버와 AGP 가 Micron의 칩셋과 함께 NT4에서 동작할 수 있는 nVidia 칩셋에 최적화된 특별한 DLL 파일-일종의 패치 파일-을 사용하였다.

모든 테스트에서 프로세서는 Pantium III 733MHz 를 이용하여 행해졌다.  이 733MHz 클럭의 속도는 2000년 4/4 분기 기준으로 볼 때 중간 단계 성능을 갖는 프로세서이며 일반적으로 빠른 프로세서는 DRAM의 성능효과를 증가시키는 경향이 있다. 따라서 1GHz 이상 속도의 프로세서 속도에서도 승자와 패자는 마찬가지일테지만 두 DDR과 RDRAM 플래폼의 성능간 차이 폭은 증가할 것으로 여겨진다.

Linpack MFLOPS

현재 가장 역사가 깊고 믿을 수 있는 벤치마크인 Linpack MFLOPs 벤치마크는 한정된 메모리에서의 부동소수점 성능을 평가할 수 있다. 데이타 메트릭스의 다양한 크기에 따라, L1, L2, DRAM 의 성능효과를 측정할 수 있고 다음에서 보여줄 테스트 결과는  L1 과 L2 성능에 의해서만 전적으로 결정되는 결과는 배제하고 있으며 대신 테스트에 사용된 데이터 세트의 크기가 512 KB에서 1.5 MB에 이르는 DRAM의 제한된 성능에 초점을 맞추고 있다.

Linpack은 Win98 SE와 NT4 에서 각각 테스트 하였으며 하나의 테스트를 한 후 다시 클린 부팅을 하여 새롭게 테스트를 하였다.  테스트 결과를 보면 DDR의 성능은 840 칩셋에 대해 Win 98 SE 에서는 16.4%,  Win NT4 에서는 5.3% 라는 현저한 차이로 우수함을 보여주고 있다.

Stream

Stream을 이용한 테스트는 DOS, Win 98, Win NT4에서 이루어졌다. Linpack에서와 마찬가지로 한번의 테스트가 완료된 후 클린 부팅후 다시 다음 테스트를 실시하였다.  DOS에서 DDR은 RDRAM에 비해 평균 거의 20%에 달하는 성능의 우세함을 보여주고 있다.

역시 Win98 SE에서는  DDR 성능이 약 30%를 앞서고 있음을 보여주고 있다.

NT4 기반하에서는, 840 칩셋의 RDRAM의 성능이 DDR을 앞질렀으나 성능 차이는 4%로 밖에 되지 않았다.

NT4 기반하에서는, 840 칩셋의 RDRAM의 성능이 DDR을 앞질렀으나 성능 차이는 4%로 밖에 되지 않았다. NT4 에서의 이런 결과를 필자는 완전히 설명할 수는 없다.  몇 번 테스트를 다시 한 후 Micron사의 플래폼이 4개의 DIMM을 모두 사용하였을때 기본적으로 두 시스템간 성능 차이폭을 제거하면서 Wstream-NT 성능이 증가한다는 사실을 확신하게 되었다.  이는 NT환경에서  Wstream이 폭 넓은 인터리빙으로 인해 잇점을 얻게 되며 기타 어플리케이션과 벤치마크에서 대기시간에 민감하지 못할 수도 있다. 따라서 Win98 SE와 WinNT에서 테스트 결과를 유심히 비교해 보면 재미있을 것으로 생각된다.

Wintune Memory Bandwidth Test

WinTune의 메모리 테스트는  Win 98 과 NT환경에서 DRAM 성능을 다양한 견지에서 평가하는데 사용된다. WinTune의 메모리 테스트에서도 NT에서 결과는 Win 98에 비교해서 결과의 변화치가 적기는 하지만 두 운영체제간 실제적인 결과 차이는 없다.

이 결과는 DDR의 현저한 우세함을 보여주고 있으며, DDR은 특히 복사와 쓰기에서 우수한 성능을 보여주고 있다. 읽기에서는 실질적으로 별 차이는 없지만 2 Mbyte 읽기 항목에서는 RDRAM이 DDR을 0.5% 차이로 앞서고 있다.

아래 표는 벤치마크에 따른 실제 수치를 참고로 열거한 것이다. 표에서 보여지는 바와 같이 DDR은 쓰기에서 평균 45.5%가 우세함을 보여주고 있다. 복사처리에서 DDR이 RDRAM을 16.5%로 앞서고 있다. 그리고 전체적인 읽기, 쓰기, 복사에서는 RDRAM에 비해 DDR성능이 22.6% 앞서고 있다.

위 표에 보여지는 바와 같이 전반적인 메모리 스코어는 14.3%로 이는 위 표의 일반적인 평균을 밑도는 수치이다. WinTune은 MB/s에서 측정된 기타 모든 대역폭 산출값의 평균으로서 전반적인 대역폭을 산출하게 된다.

WinTune의 평균 측정 방법은 DRAM 성능보다는  캐시 성능에 치중하고 있다. 이 테스트에서 비율을 산출하기 위해서 공정한 방법을 사용하였으며 DRAM 성능 차이를 보다 뚜렷하게 관찰할 수 있다. 그러나 여하튼 DDR 이 성능에서 우세함을 보여주고 있다.

SYSMark 2000

업계에서 가장 포괄적이고 믿을 수 있는 비즈니스 어플리케이션 벤치마크 프로그램은 Sysmark 2000이라고 할 수 있다. Sysmark 2000은 기본적인 비즈니스 산출력과 진보된 컨텐츠 생성을 위해 최근에 발표된 12개의 어플리케이션을 포함하여 테스트하고 운영하게 된다.

분석 벤치마크에 비교해, Sysmark 2000은 이러한 어플리케이션 벤치마크 중에서 대차가 거의 없는 2-3%의 성능 차이점을 나타내기 때문에 DRAM의 성능 테스트에서 매우 흥미롭고 중요한 벤치마크 툴이라고 볼 수 있다.

Corel Draw, Excel 2000, Elastic Reality(이미지 모핑 어플리케이션) 의 3가지 어플리케이션에서 특이한 성능 차이점은 보이지 않았다.  그러나 7개 이상의 어플리케이션에서 DDR이 듀얼 채널 RDRAM 성능을 현저한 차로 능가하고 있다.

SYSMark 2000에서 단지 두 개의 어플리케이션-Premier 와 Microsoft Media Encoder-에서 840칩셋에 기반한 RDRAM이 DDR을 능가하고 있는데  흥미로운 것은 이 두 가지 어플리케이션이 매우 유사한 프로그램이라는 점이다.  이 둘 모두 지향적인 비디오 파일을 압축 및 실행한다. 이 두 어플리케이션 모두 Bryce 와 Elastic Reality와 같이 전문적이거나 또는 준 전문가적인 컨텐츠 형성 어플리케이션의 범주에 포함시킬 수 있다.  이들은 일반적인 사용자, 홈 유저, 사무용 PC로 제작된 것이 아니다. 이러한 소프트웨어 툴은 전문적인 컴퓨터 그래픽 제작자들이 사용하며 기타 기업체와 개인 사용자 등 방대한 사용자가 이용하는 SysMark 2000에서 테스트에 사용되는 다른 어플리케이션에 비교해 비교적 제한된 사용자 계층을 가진다.

아래 표는 SysMark 2000에서 각각의 어플리케이션 테스트에서 가장 좋은 수치를 나타낸 결과를 나열한 것이다.

ZD CPUMark 99

CPUmark은 인텔의 ICOMP 인덱스의 주요한 요소로서, 그래픽이나 하드 디스크 그리고 기타 다른 주변기기의 성능에 상관없이 프로세서의 정수 연산과 캐시 메모리 성능을 평가하기 위한 벤치마크 프로그램으로써 많이 사용되고 있다.

이 테스트에서 산출된 소량의 DRAM 작용을 고려한다면 1.2%의 성능 차이는 주목할 만한 것이다. 이전의 하이엔드 프로세서와는 달리, 코퍼마인에서는 캐시 크기가  256 KB로 줄어들었기 때문에 이 벤치마크에서 DRAM 성능 차이를 식별할 수 있다.

3D 게임 환경 - Expandable

유명한 게임 데모인 Expendable을 이용하여, 두 개의 서로 다른 모니터 해상도로 테스트하였다. 둘 중 하나의 해상도에서, 이 게임 자체의 성능이 주로 CPU 에 의해 제약을 받게 된다는 사실이 밝혀졌다.  해상도가 640x480x16 에서 1024x768x32로 증가함에 따라 전반적인 가속기 필 레이트 요구는 5 배 이상이 증가하였다. GeForce DDR 필 레이트 용량이 매우 높아 이 두 해상도간 단지 매우 작은 프레임 레이트 차이만이 존재하게 된다.

CPU와 DRAM에 제한된 성능 평가의 경우에 , RDRAM 과 DDR간 성능 차이가 각각 해상도에서 2 %와 2.3% 로 DDR이 선두를 차지하고 있다. 이는 기타 많은 어플리케이션에서 보여지는 성능 차이와 일치하는 것이다.

3D 게임 환경 - Quake III Arena

Quake 는 분명 오랫 동안 많은 인기를 누린 게임이며 업계 벤치마크에서 가장 신뢰할 수 있는 게임이라고 할 수 있을 것이다.  이번 테스트 플랫폼은 nVidia Quadro 가속기를 이용하여 동일한 드라이버와 함께 Win98 환경에 구성되어졌으며 AGP fastwrite를 포함한 모든 성능에 영향을 미칠만한 요소들은 활성화 시켜 테스트를 하였다.

이 테스트에서 Quake 3 Arena의 두 개의 데모를 가지고 실시하였는데 Demo 1은 하드웨어 관련 사이트에서 벤치마크시 가장 자주 사용되는 것이다. Demo 2는 프로세서와 DRAM에 대한 약간 복잡한 로드(load)를 보여주었지만   이 두 데모 경우에 있어 모두 DDR이 실질적으로 우세함을 보여주고 있다.

예상되었던 바와 같이, 저해상도에서 DDR은 최고 성능을 보여주고 있으며 또한 위에서 언급된 CPU 로드(load)에서의 차이점으로 인해 Demo1 보다는 Demo 2에서 뛰어난 성능을 보여주고 있다. 이 테스트에서는 전반적으로 Micron사의 DDR 지원 칩셋이 인텔의 840 칩셋에 대해 6.6% ~ 8.6% 정도 우수한 성능을 보여주고 있다.  해상도가 증가함에 따라, 두 메모리간의 성능 차이가 감소함을 볼 수 있는데 이는 높은 해상도로 올라갈 수록 성능이 그래픽 카드에 많이 의존하기 때문이다.

3D Winbench 2000

테스트 환경은 1024x768x16의 스크린 해상도를 제외하고 위의 Quake 3 프레임 테스트와 동일하게 구성되었으며, 3D WinBench 2000 에서의 결과 또한 DDR이 현저하게 성능이 우수함을 보여주고 있다.  부동 소수점 중심 프로세서 테스트에서는 성능 차이가 작았지만, 3D 가속 게임 스크립트 데모 테스트에서는 DDR 성능이 큰 차이인 4%로 앞서고 있다.

MCAD Workstation Performance - Viewperf

NT4 환경에서는 1024x768x32 해상도에서 Diamond FireGL1 가속기를 이용하여 Viewperf가 테스트되었다.  3가지 테스트에서 840이 가장 좋은 성능을 기록하고 있지만 성능차이는 미미함을 볼 수 있다. 이 테스트에서 840 성능이 평균 0.8% 우수함을 보여주고 있다.

아래 표에서 보여지는 바와 같이 DX-05 테스트에서는  840 칩셋 기반의 RDRAM성능이 2.7% 앞서고 있지만 나머지 테스트에서의 성능 차이는 역시 1% 미만이다.

ZD Serverbench

ZD Serverbench 는 동시에 작동하는 클라이언트 PC 변수(varying number)에 기반한 지속적인 서버 효율을 측정하게 된다. 두 DDR과 840 플랫폼은 비록 미미한 차이가 보이기는 하지만 거의 동일한 성능을 보여주고 있다.

12 개 이하의 클라이언트가 연결되었을때 서버 효율은 프로세서에 의해 제한이 된다. 싱글 프로세서를 이용하게 되면 초당 처리량이 거의 정확하게 반으로 감소된다. 이번 테스트는 전적으로 하드 디스크에 의해 결정되기 때문에 16개 이상의 클라이언트에서 TPS 효율은 현저하게 감소한다.  16개 이상의 클라이언트에서 성능은 거의 전적으로 하드 디스크 보조시스템의 특성에 의해 결정된다는 것이 입증되었다. 이 테스트에서 두 개의 라이드(RAID) 카드가 사용되어졌다.

DDR은 클라이언트 수가 적을 때  RDRAM에 대해 미미한 차이로 승리하게 되며 최대 12클라이언트까지 동일하거나 보다 나은 성능을 계속해서 유지하게 된다. 그러나,16 개에서 20 개의 클라이언트가 연결 되었을때는 RDRAM 성능이 더 앞서고 있다. 이러한 결과가 발생하는 이유는 DRAM 성능 특성보다는 840칩셋의 PCI 성능 때문으로 보여진다.

솔직히, 이 두 개의 플랫폼이 실제 서버는 아니지만 많은 회사들이 한번에 10-25명의 사용자를 지원하는 워크구룹 서버에서 이를 이용할 것이다. 이와 같이 한 개에서 여덟 개 클라이언트 서버 벤치 테스트는 이러한 플래폼을 위한 실제적인 성능 요구의 정확한 결과라고 할 수 있다. 목표로 정한 성능 스펙트럼내에서 비록 상당한 플래폼 비용 차이가 존재하지만 이 플래폼들간  상이한 성능 차이는 존재하기 않았다.

정리하며

대다수의 경우에서 압도적으로 DDR 이 듀얼 채널 RDRAM 성능을 능가하고 있으며, 몇몇 경우에서는 현저한 성능 차이를 보이고 있다.  대부분의 경우에서는 DDR 성능이 근소한 차이로 우수함을 보이고 있지만, RDRAM이 소수의 경우에서 근소한 차이로  앞서고 있다.

다소 방대한 어플리케이션과 벤치마크를 조합해 볼 때 Micron의 싱글 채널 (64-bit) DDR이 인텔의 840 칩셋에 기반한 듀얼 채널 RDRAM 플래폼에 대해 단연 승자라고 볼 수 있다.

위의 결과에서 보였듯이 DDR이 인상깊은 성능을 나타냈지만 , 이는 DDR의 잠재성능이 모두 발휘된 것은 아니다. 적어도 한 업체 ( X-Box용 nVidia사)가  데스크탑 컴퓨팅용으로 DDR 메인 메모리의 고속 128-bit 를 생산하기 위한 계획을 세우고 있다는 것은 이미 잘 알려져 있는 사실이다.  또한 다른 업체들도 듀얼 채널 DDR (또는 128-bit DDR) 솔루션으로 곧 이행하게 될 것이며 이러한 솔루션으로 인해 DDR 에 대한 보다 나은 성능개선이 이루어질 것으로 기대가 된다.

테크노아의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
이 기사에 대한 댓글 이야기 (3)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
dwj72
RDR 이 DDR을 월등히 앞서네...
예를 들어 펜4에서 850과 845의 차이....

(2001-10-10 10:35:14)
adcat
이건 DDR은 양팔로 싸우고
RDRAM은 한팔로 싸우라는거와 마찬가지군요.
840칩셋에서의 벤치마킹이라니....
850 칩셋에서는 RDRAM이 월등합니다.


(2002-09-12 13:50:04)
drevil

(2002-10-28 17:23:16)
이 기사에 대한 댓글 이야기 (3)
e피플
[e피플] 나이가 대수? 공조냉동기계기능사 필기시험 100점 맞은 NCS교육생
[e피플] 나이가 대수? 공조냉동기계기능사 필기시험 100점 맞은 NCS교육생
나이가 들면 들수록 공부하기가 어렵다는 말이 있다. 더군다나 실업인 상태에서 공부하는 것이라면 부담이 더 클 수 밖에 없다.하지만 이를 비웃듯이 극복하고, 올해 2월 공조냉동기능사...

제호 : 테크노아  |  발행인 : 김필규  |  편집인 : 김필규  |  청소년보호책임자 : 박상규
서울지사 : 서울특별시 구로구 디지털로32가길 18, 7F | 제보 : it@technoa.co.kr
발행소 : 전라북도 전주시 완산구 전룡6길 6 3F | 등록번호 : 전라북도 아00057
등록일자 : 2008년 1월 14일  |  대표전화 : 070-8755-6291  |  FAX : 02-6280-9562
Copyright © 1999-2017 테크노아. All rights reserved. mail to technoa@technoa.co.kr