테크노아
> 기획&벤치 > 벤치마크
성능 측정 방법과 벤치마크의 맹점
테크노아  |  webmaster@technoa.co.kr
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2000.06.26  10:50:00
트위터 페이스북 미투데이 요즘 네이버 구글 msn

성능 측정 방법과 벤치마크의 맹점


하드 디스크 드라이브의 성능 측정

컴퓨터의 부품 중에서 절대적인 성능을 측정하기 가장 힘든 제품을 손꼽는다면 단연 하드 드라이브이다. 하드 드라이브의 성능은 원하는 데이터를 찾는 Seek 성능과 데이터를 읽고/쓰는 데이터 전송 성능으로 구분한다. 데이터 전송 성능은 디스크에서 데이터를 물리적으로 읽고 쓰는 미디어 전송 속도와 하드 드라이브의 버퍼에서 시스템 메모리로 데이터를 전송하는 버퍼 전송 성능으로 구분한다. 이러한 성능은 하드 드라이브의 물리적인 성능이며 실제 사용자가 느끼는 체감 속도를 측정하는 것은 보다 컴퓨터 사용자의 사용 패턴에 근접한 실제 성능 측정 방법이 강구 되어져야 한다.
일반적으로 하드 드라이브의 실제 성능은 WinBench, WinStone 또는 Sysmark 등과 같은 벤치 마크 프로그램을 사용하거나 또는 하드 드라이브에 데이터를 복사하는 등의 작업을 사용한다.

일반적으로 하드 드라이브에서 데이터를 순차적으로 읽어 들이는 경우에는 성능이 빠르지만 이쪽 저쪽을 번갈아 가면서 읽게 되면 데이터를 읽어 들이는 속도가 현저하게 감소하게 된다. 따라서 파일이 연속적으로 존재하는 경우와 여러 개의 파일을 읽어 들이는 경우에는 이어지는 파일의 위치에 따라서도 하드 드라이브의 성능은 크게 영향을 받게 된다. 
따라서 WinBench, WinStone, Sysmark와 같이 파일 시스템을 그대로 사용하는 벤치 마크를 사용하게 되면 파일 시스템에 직접적으로 영향을 받고 벤치마크를 위해서 사용되는 하드 드라이브의 파일이 많기 때문에 이들 파일의 물리적인 위치에 따라서 성능이 천차만별로 달라지기 때문이다. 즉, 파일 시스템은 완전히 포맷된 디스크에 동일한 순서와 방법을 이용하여 파일을 복사하고 설치해도 실제 파일의 배치는 절대로 갖지 못하다. 따라서 하나의 하드와 하나의 시스템을 사용하는 경우라 하더라도 재현성이 있는 결과를 얻은 것은 거의 불가능에 가까운게 현실이다.

 

하드 드라이브에 데이터가 기록 경우에는 논리적으로 일정한 형식에 맞춰서 관리가 된다. 흔히 듣게 되는 FAT, NTFS, HPFS 등의 운용 시스템의 종류에 따라서 여러 가지의 형식으로 구분이 되며, 일반 도스나 윈도우즈9x 시스템에서는 FAT(File Allocation Table) 방식을 일반적으로 사용하게 된다. FAT 시스템에서의 하드 드라이브의 물리적인 배열은 먼저, Partition 정보가 디스크의 처음 부분에 위치하고  있으며, 이어서 부트섹터와 디렉토리 그리고 FAT가 존재한다. FAT 시스템에서는 FAT가 파일의 위치를 저장하고 있는 가장 중요한 영역이기 때문에 2개의 테이블을 중복해서 관리하게 된다. 

FAT 방식은 파일의 이름과 간단한 정보를 저장한 디렉토리(Directory) 영역, 파일의 위치와 크기를 지정한 FAT 영역 그리고 실제 데이터가 저장되어 있는 영역으로 구분이 되며, 특정 파일을 읽기 위해서는 먼저 디렉토리에서 파일의 첫번째 위치를 얻어내고 FAT에서 파일의 위치를 계속 추적하여 원하는 데이터 영역의 데이터를 읽어 들이게 된다. 따라서 하드 드라이브에서 데이터를 읽기 위해서는 3가지 부분을 번갈아 가면서 억세스하게 된다.

 

 

실제 환경 성능 시험의 맹점이 무엇일까?

가능한 재현성 있는 결과를 얻기 위해서 Sysmark2000을 6회 측정하고 최대/최소 데이터를 제외한 4회의 데이터를 평균하여 성능을 측정해 보았다.약간의 마음에 걸리는 문제점이 있다. 여러 번을 반복하여 성능을 측정하였음에도 불구하고 응용 프로그램에 따라서 그 성능의 편차가 일정한 형식을 가지고 있지 않다. 즉, 슈트에 따라서 성능 편차가 심하게 나타나는 것이다. 이러한 현상은 시스템 메모리를 128MB,256MB,512MB 정도로 확장 시켜 가면서 테스트해도 큰 편차를 보이지 않고 더욱더 프로그램의 편차가 심하게 발생한다. 또한, 응용 프로그램의 메모리/디스크 억세스 특성을 고려해 보아도 실제 일정한 규칙이나 동질성을 가지고 있지 않다. 따라서 이것을 프로그램에 따른 실제 성능의 차이로 해석할 수 있지만 이것이 절대적으로 옳은 해석은 될 수 없다. 
Seagate ST320420A 하드 드라이브가 IBM 제품에 비하여 약간 높은 성능을 보여 주었고 IBM DTLA 207020 제품이 가장 낮은 성능이 측정되었다. 하지만 그 차이는 2% 이내의 성능으로 그렇게 크게 나타나지는 않았다. 모든 제품은 완전 포맷 상태에서 윈도우즈2000과 벤치 마크 프로그램을 동일한 순서에 따라서 설치해서 테스트가 이루어진 것이다. 


 


성능에 대한 결론을 확정하기 전에 WinBench99 프로그램을 이용한 성능을 살펴 보도록 하자. 먼저, Sysmark2000과 같이 각종 응용 프로그램에서의 상대적인 성능을 측정하는 Disk Winmark의 결과를 보면 정반대의 결과가 얻어진다. IBM DTLA 307020 제품이 가장 높은 성능을 보여주며, Seagate ST320420A 제품이 가장 낮은 성능을 보이고 또한 그 차이도 현저하게 크게 나타난다. 이 측정 결과는 5회 연속 측정하여 최대/최소를 제외한 3개의 값을 평균한 것이다. 동일한 일반적으로 플래터의 개수가 많아지게 되면 디스크 성능은 높아지게 되지만 실제 성능에서는 반대의 결과가 나온 것을 알 수 있다.

 

파일 시스템에 의존적인 시스템 벤치를 벗어나 이제 기본 성능을 평가해 보도록 하자.  먼저, 윈벤치 테스트에서의 기본 성능 측정 항목의 측정 결과를 보도록 하겠다. 먼저, 디스크의 위치에 따른 성능의 변화를 살펴 보도록 하자. 먼저, IBM DTLA 307020과 IBM DTLA 307030의 초기 성능은 동일하다. 하지만, 동일한 트랙에 많은 데이터가 저장되는 IBM DTLA 307030 제품이 디스크의 가장 내주의 성능은 307020에 비하여 더욱 떨어진다는 것을 알 수 있다. 따라서 전체 성능을 평균하게 되면 IBM DTLA 307030 제품이 낮은 값을 갖는 것이다.
이것은 307020의 경우에 1.5개의 플래터로 20GB를 구성하여 플래터당  13GB의 데이터를 저장하는 반면에 30GB 제품은 2개의 플래터로 15GB의 데이터를 저장하게 된다. 이때, 트랙 밀도와 데이터 밀도가 두개의 드라이브가 동일하며 따라서 20GB 제품은 30GB 제품에 비하여 내주 트랙에서 10% 정도의 여유를 두고 트랙이 종결된다. 따라서 30GB 기준으로 90% 영역 수준을 유지하게 되는 것이다. 
Seagate ST320420A 드라이브는 트랙/데이터 밀도가 상대적으로 낮으며 따라서 전체적으로 IBM DTLA 시리즈에 비하여 낮은 성능을 가지게 된다. 

 

 

평균 전송 속도 면에서는 IBM 제품이 13~20% 정도 높은 성능을 보여준다. 반면에 CPU 이용율은 1.5% 정도 높게 소모하지만 이것이 시스템 전체 성능에 미치는 영향은 크지 않을 것으로 기대가 된다. CPU 이용율은 100% 디스크 동작을 위한 연산에서 차지하는 영역이기 때문이다.

 

결국 WinBench99와 Sysmark2000을 이용하여 반복하여 여러 번의 데이터를 측정 비교해 보았지만 모두들 일치하지 않고 다른 성능 양상을 보이게 되므로 어떤 제품이 실제 어느 정도 빠르다고 말하기 힘들다. 심지어 WinBench99에서 디스크의 성능 형태 데이터와 최종적으로 얻어진 평균 전송 속도 마저도 동일한 경향을 보이지 않는다. 이것이 바로 실제 환경 성능 시험의 맹점이다.
즉, 필자가 얻어진 성능이 객관적으로 누구에게나 적용될 수 없고 더불어 테스트 하는 방법과 하드 드라이브의 데이터 설치 방법 그리고 사용자의 사용 패턴에 따라서 하드 드라이브이 체감 성능은 너무나 천차 만별로 달라지기 때문이다. 
아마 이글을 읽는 독자들은 무척 혼란스러울 것이다. 전에 같이 무작정 테스트해서 결론을 만들지 않고 상반된 데이터를 이용하고 있기 때문이다. 조금은 전문가가 되기를 원한다면 글을 차분히 읽어 주기를 부탁한다. 이 글은 하드 드라이브의 성능과 더불어 보다 객관적이고 정확한 데이터를 얻기 위한 모든 과정을 소개하기 때문이다.

 

이전의 하드 드라이브는 트랙당 섹터의 개수가 고정되어 있다. 따라서 한개의 트랙에 저장되는 데이터의 용량은 동일하다. 이때, 외주에 비하여 내주의 트랙의 길이 짧게 되므로 상대적으로 단위 면적당 기록 밀도가 높게 된다. 하드 드라이브는 물리적으로 기록 밀도가 정해져 있기 때문에 디스크에 저장되는 데이터는 최고의 밀도를 갖는 내주의 기록 밀도를 준하게 된다. 반대로 해석하면 내주에서 외주로 갈 수록 실제 디스크에 저장할 수 있는 데이터의 용량을 100% 활용하지 못하는 것과 동일하다. 따라서 하드 드라이브 업체에서는 트랙을 일정한 그룹으로 구분하고 외주에는 상대적으로 많은 섹터를 할당하고 반대로 내주에는 섹터의 개수를 줄여서 전체적으로 일정한 기록 밀도를 갖도록 유지하게 한다. 이 경우 기록 밀도에 대한 실제 기록량의 비율이 높아지며 결국 디스크의 용량이 증대될 수 있다. 

 

 

이렇게 가변 섹터로 구성된 드라이브는 플레터당 기록량이 일반 기존 방식에 비하여 안정적으로 하드 드라이브의 전 영역에 걸쳐서 안정된 데이터 보존율을 갖게 된다. 또한, 외주에서의 실제 트랙당 기록 밀도가 고정 방식에 비하여 높기 때문에 외주 성능이 월등히 개선이 된다. 물론, 전체적인 평균 성능은 개선된다고 볼 수 없지만 상대적으로 용량이 향상되기 때문에 데이터 억세스 속도도 빨라지게 된다.
실제로 최신 하드 드라이브의 억세스 위치에 따른 전송 속도를 살펴보면 외주(시작부분) 부분이 가장 높고 계단 형식으로 점차 감소하는 것을 알 수 있다. 만약, 고정 섹터 방식이라면 수평선으로 나오게 된다.

테크노아의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
e피플
[e피플] 나이가 대수? 공조냉동기계기능사 필기시험 100점 맞은 NCS교육생
[e피플] 나이가 대수? 공조냉동기계기능사 필기시험 100점 맞은 NCS교육생
나이가 들면 들수록 공부하기가 어렵다는 말이 있다. 더군다나 실업인 상태에서 공부하는 것이라면 부담이 더 클 수 밖에 없다.하지만 이를 비웃듯이 극복하고, 올해 2월 공조냉동기능사...

제호 : 테크노아  |  발행인 : 김필규  |  편집인 : 김필규  |  청소년보호책임자 : 박상규
서울지사 : 서울특별시 구로구 디지털로32가길 18, 7F | 제보 : it@technoa.co.kr
발행소 : 전라북도 전주시 완산구 전룡6길 6 3F | 등록번호 : 전라북도 아00057
등록일자 : 2008년 1월 14일  |  대표전화 : 070-8755-6291  |  FAX : 02-6280-9562
Copyright © 1999-2017 테크노아. All rights reserved. mail to technoa@technoa.co.kr