테크노아
> 기획&벤치 > 기획기사
코어 아키텍쳐의 신기술 5가지 I
테크노아  |  webmaster@technoa.co.kr
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2006.07.18  14:33:00
트위터 페이스북 미투데이 요즘 네이버 구글 msn

이제 새로운 코어 아키텍쳐가 이전에 비해 어떤 특이점이 있으며, 어떤 신기술이 도입되었는지를 자세히 알아보자. 인텔이 코어 아키텍쳐를 내놓으며 선보인 5개의 신기술 중 Intel Wide Dynamic Execution은 클럭당 처리되는 명령의 처리량을 늘리는 방법에 관여된 것이며, Intel Advanced Digital Media Boost는 명령의 처리량을 감소시키는 방법에 관여된 것이다. 여기에 부가적으로 각 코어의 캐쉬를 공유하는 기술인 Intel Advanced Smart Cache, 메모리와의 데이터 이동의 방법을 개선해 성능의 향상을 꾀한 것이 Intel Smart Memory Access이며, CPU의 전력 소모를 줄인 기술이 Intel Intelligent Power Capability이다.

앞서 도입부에서 CPU의 성능을 결정짓는 두가지에 대해 잠시 언급했다. 첫번재는 우리가 흔히 2GHz, 3GHz로 말하는 CPU의 클럭 주파수이며, 두번째는 클럭당 처리되는 명령의 처리량(IPC;Instruction per Clock)이다. CPU의 클럭이 높아지거나 클럭당 처리되는 명령의 처리량이 늘어나면 CPU의 성능은 높아진다.

이전 넷버스트 아키텍쳐가 클럭 주파수를 높여왔다면, 새로운 코어 아키텍쳐는 클럭당 처리되는 명령의 처리량을 높였다. 클럭당 동시에 처리될 수 있는 명령어를 이전 3개에서 4개로 늘려 코어 아키텍쳐에서는 한클럭에 최대 4개의 명령어를 동시에 처리할 수 있다. 이것이 바로 인텔이 이야기한 코어 아키텍쳐의 신기술인 Intel Wide Dynamic Execution의 주요 내용이다.

아래 그림은 Intel Wide Dynamic Execution의 도식이다. 이전에 넷버스트 아키텍쳐에서 사용되었던 Advanced Dynamic Execution은 3개의 명령어를 동시에 처리할 수 있었으나 코어 아키텍쳐에서는 4개의 명령어를 동시에 처리할 수 있다. 인텔의 코어 아키텍쳐는 파이프라인의 단계가 줄인대신 아래와 같이 각 실행 유닛을 넓히므로써 처리되는 명령어의 처리량을 높였다.

▲ 이전 넷버스트 아키텍쳐의 Advanced Dynamic Execution과 새로운 코어 아키텍쳐의 Wide Dynamic Execution의 비교, 마치 도로의 3차선과 4차선을 비교하는 것과 같다.

실행 유닛을 넓히는 것 이외에도 실행 시간을 단축 시키기 위해 매크로퓨전(Macrofusion)이라는 기술을 도입했다. 매크로퓨전은 두개의 특정 조건을 갖춘 명령어를 하나의 명령어로 처리하는 기술이다. 즉, 기존의 아키텍쳐에서는 이런 특정 조건을 갖춘 명령어 두개가 일렬로 실행되어야 할 경우 각 명령어를 한번에 하나씩 처리했지만, 새로운 코어 아키텍쳐에서는 이런 조건이 일어날 경우 한번에 두개를 동시에 처리할 수 있어, 같은 시간에 더 많은 명령을 처리할 수 있다.

매크로퓨전은 특정 조건의 명령이 들어올 경우 같은 시간에 더 많은 명령을 처리할 수 있는데, 이는 곳 실행 시간을 단축시키기 때문에 결국 같은 명령을 처리하는 데 드는 전력도 줄일 수 잇는 장점이 있다. 아래 그림을 보면 하늘색으로 표시된 부분이 매크로퓨전이 적용되는 명령의 예인데, 이전 세대 아키텍쳐에서는 같은 하늘색의 명령이 따로 처리됬지만, 코어 아키텍쳐에서는 같은 하늘색(일정 조건을 만족한)의 명령은 하나로 처리된다.

▲  코어 아키텍쳐의 매크로퓨전 기술은 명령 처리 시간을 단축시킨다.

또 인텔은 코어 아키텍쳐의 Wide Dynamic Execution을 통해 펜티엄 M 프로세서에 최초로 도입되었던 마이크로 연산 퓨전(Micro-op fusion) 기능을 확장했다. 이는 코어 아키텍쳐에서 융합될 수 있는 마이크로 연산이 더 많아진다는 것을 의미하며, 매크로퓨전으로 인해 파생된 융합 가능한 많은 수의 마이크로 연산을 융합해 마이크로 연산의 개수를 감소시킨다.  이로 인해 인텔은 이 기능의 확장으로 마이크로 연산의 기능을 10% 이상 감소시킬 수 있다고 이야기하고 있다.

▲  Intel Wide Dynamic Execution의 적용으로 인한 코어 아키텍쳐의 명령 처리 도식

이외에 CPU의 성능을 올리는 또하나의 방법이 있다면, 처리해야할 명령의 처리량을 감소시켜 동일 시간에 더 많은 명령을 처리하는 것이다. 우리가 PC로 동영상을 볼때를 생각해보자. 동영상을 같은 그림이 좌표를 바꿔 움직이는 명령어의 집합이라 한다면, CPU는 언제나 같은 명령을 좌표만 바꿔 처리할 것이다. 이 경우, 각 명령을 따로 실행하지 않고 한꺼번에 처리하면 명령의 처리량이 감소한다. 이를 SIMD(단일 명령 복수 데이터 ; Single Instruction Multiple Data)라고 하며, 우리가 흔히 봐왔던 MMX, SSE, SSE2 등이 이 SIMD의 일종이다.

Intel Advanced Digital Media Boost는 SSE(Streaming SIMD Extention)의 처리 성능을 높이기 위해 128비트 SIMD 정수 연산과 부동소숫점 연산 명령을 한 클럭에 실행할 수 있게 한 기술이다. 이전 아키텍쳐의 경우 128비트의 명령을 64비트로 나누어 처리했지만, 코어 아키텍쳐에서는 128비트의 명령을 한번에 처리할 수 있다.

아래 도식을 보면 같은 128비트 SIMD 연산시 Intel Advanced Digital Media Boost가 적용되는 경우와 적용되지 않는 경우가 차이를 보인다. SIMD는 언제나 128비트만 처리되는 것이 아니라 64비트와 128비트가 혼재되어 처리된다.  이럴 경우 같은 클럭당 처리하는 용량은 같지만 Intel Advanced Digital Media Boost는 128비트의 연산을 하나의 클럭에 완벽히 처리해주기 때문에 처리되는 명령어 수를 증가시킨다.

▲ Intel Advanced Digital Media Boost는 128비트 SIMD 연산을 한클럭으로 보장해준다.

128비트 SIMD 연산은 그래픽이나 비디오, 오디오 같이 같은 연산이 반복되는 작업시 그 효과가 나타난다. 앞으로 그래픽과 동영상이나 멀티미디어 파일의 크기가 점점 늘어나기 때문에 이를 효과적으로 처리할 수 있는 기술은 더욱 그 중요성이 더해진다.

테크노아의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
e피플
[e피플] 나이가 대수? 공조냉동기계기능사 필기시험 100점 맞은 NCS교육생
[e피플] 나이가 대수? 공조냉동기계기능사 필기시험 100점 맞은 NCS교육생
나이가 들면 들수록 공부하기가 어렵다는 말이 있다. 더군다나 실업인 상태에서 공부하는 것이라면 부담이 더 클 수 밖에 없다.하지만 이를 비웃듯이 극복하고, 올해 2월 공조냉동기능사...

제호 : 테크노아  |  발행인 : 김필규  |  편집인 : 김필규  |  청소년보호책임자 : 박상규
서울지사 : 서울특별시 구로구 디지털로32가길 18, 7F | 제보 : it@technoa.co.kr
발행소 : 전라북도 전주시 완산구 전룡6길 6 3F | 등록번호 : 전라북도 아00057
등록일자 : 2008년 1월 14일  |  대표전화 : 070-8755-6291  |  FAX : 02-6280-9562
Copyright © 1999-2017 테크노아. All rights reserved. mail to technoa@technoa.co.kr