자유롭게 게시물을 올릴수있는 게시판입니다.
  • 유년추억
  • 학교생활
  • 입시준비
  • 대학생활
  • 군생활
  • 알바생활
  • 취업준비
  • 직장생활
  • 원룸생활
  • 연애중
  • 결혼준비
  • 집안살림
  • 자녀교육
  • 창업준비
  • 이민유학
  • 노후생활
  • 전체보기


다음은 내가 맡는다. 차세대 버스 전쟁. 1부

 


다음은 내가 맡는다. 차세대 버스 전쟁. 1부







     2003.08.25







Part. 1. 10년을 써온 PCI

18개월마다 CPU성능은 두 배로 좋아진다는 이른바 무어의 법칙은 여전히 쓸모 있는 공식이다. 그럼에도 불구하고 인텔과 AMD의 신형 CPU는 예전보다 폭발적인 성능을 보이지 못한다고 느끼는 이들이 적지 않다. 단적인 예로 하나의 CPU를 마치 두 개처럼 쓸 수 있다는 하이퍼스레딩 같은 고급기술이 담긴 펜티엄4 3.2GHz의 클럭은 처음 선보였던 펜티엄4 1.4GHz의 두 배가 넘지만 결코 체감성능은 그렇지 못하다.

여기에는 여러 이유가 있겠지만 CPU성능을 받춰주는 메모리나 그래픽카드, 특히 이를 유기적으로 연결해야 하는 메인보드의 성능이 뒷받침하지 못하는 것도 한 가지 이유가 될 수 있다. 혹시나 CPU제조사나 메인보드 칩셋 제조사들이 게을러서 이에 대한 연구가 부족하다고 생각한다면, 이는 잘못된 생각이다. 전체적인 구조를 제어하는 이른바 버스(BUS)의 구조가 지나치게 오래된 것이 가장 큰 이유이다. 무어의 법칙을 충실히 따르는 CPU에 비해 I/O대역폭의 경우 그보다 훨씬 늦은 약 3년 정도를 주기로 바뀌는데다가, 그마저 CPU가 필요로 하는 대역폭에는 훨씬 미치지 못하고 있는 실정이다.








» CPU발전속도에 비해 IO 대역폭의 변화는 훨씬 늦다.

지금의 PC를 구성하는 가장 대표적인 버스인 PCI버스의 경우 기가헤르즈급인 CPU를 끼우고도 여전히 33MHz라는 실로 엄청나게 느린 속도로 움직이고 있다. 어쩌면 이미 선보인 지 10년이 넘은 PCI버스에 너무 많은 것을 바라는 것인지도 모를 일이다. 어쨌거나 PCI버스로 대표되는 지금의 버스 구조는 대수술이 필요하며, 인텔 등 관련업체들은 PCI Express, 하이퍼 트렌스포트, 인피니밴드, 3GIO, Rapid IO 등 다양한 대안을 준비하고 있다. 이 가운데 이미 일부는 실제로 쓰이고 있기도 하다.

각 메인보드 칩셋 제조사들의 지금의 버스구조를 살펴보고, 앞으로 선보일 버스 아키텍처를 알아보는 것은 PC를 이해하는 지름길이라 할 수 있을 것이다.


당시에는 나도 빨랐다. PCI버스


지금의 PC구조가 자리잡은 것은 대략 10년 정도로 볼 수 있다. 처음 신기한 장난감 수준에 불과하던 PC는 발전을 거듭하며 고성능이라는 바람을 탔다. 흑백에서 컬러로, 2D에서 3D로, 저해상도에서 고해상도로 바뀐 그래픽이 단적인 예라고 할 수 있다. 문제는 이렇게 쓰는 이들의 입맛에 맞게 발전하는 것은 좋았지만, 그만큼 시스템에는 과부하가 걸렸다는 사실이다. 각각의 부품은 충분히 빨랐지만 이를 연결하는 과정에서 필수적으로 생기는 이른바 병목현상은 출근길의 답답한 도로사정만큼이나 PC성능을 떨어트리는 주범이었다. 당시의 주된 버스는 ISA이었다.

이런 문제점을 해결하고자, 관련 기업들과 학계들이 지혜를 모아 만든 단체가 바로 VESA(Video Electronics Standard Architecture). 그래픽카드의 이름이기도 했던 이 단체에서는 이를 해결할 수 있는 방안으로 VESA Local버스를 선보였다.








» VESA Local 구조의 메인보드. 지금의 기준으로 보면 매우 크다.

주로 그래픽카드 전용으로 쓰였던 VESA Local버스는 16비트에 불과한 ISA방식에 비해 두 배나 늘어난 32비트 구조라는 점이 무엇보다 장점이었다. 여기에 클럭의 경우 50MHz로 8MHz에 불과한 ISA방식과는 비교하기 힘들 정도의 고성능 버스라고 할 수 있다.

이렇게 당시로서는 최신 기술로 만들어진 VESA Local 방식이지만, 결정적인 문제점이 하나 있었으니 바로 CPU에 지나치게 많은 부하를 준다는 것이었다. 그때까지만 해도 칩셋을 직접 만들지 않았던 인텔이 CPU는 물론 이를 최대한 써먹을 수 있는 칩셋 개발에 팔을 거두어 붙이고 나선 것도 이때쯤으로 CPU로는 486시절의 이야기이다.

ISA방식의 경우 자체 구조가 워낙 느렸지만, VESA Local방식은 병목현상이 더욱 큰 문제가 된 셈인데, 이를 해결하기 위해 새롭게 선보인 구조가 바로 PCI버스이다. PCI버스는 클럭이나 대역폭 자체로는 기존의 VESA Local구조에 비해 획기적인 성능 개선이 있었다고 보기는 어렵다. 33MHz의 동작 클럭이나 여전히 32비트구조인 것이 단적인 예이다. 물론 대역폭은 133MB/s로 늘어났다. 그 대신 CPU에 걸리는 부하를 효율적으로 분산하는 새로운 개념을 도입하는데 이것이 바로 지금껏 써먹고 있는 브리지(Bridge)구조이다. 메인보드의 위쪽에 있다고 해서 노스브리지로 불리는 칩이 주로 CPU, 메모리 등의 부품을 담당하고, 아래쪽에 자리잡고 입출력을 맡는 사우스브리지를 묶어 칩셋(Chipset)이라는 이름으로 불리는 것도 이 때문이다. 칩 하나로는 생명력이 없는 까닭이다.








» PCI 버스부터 브리지라는 개념이 쓰였다.

이런 PCI버스는 지금도 PC의 주된 슬롯일 정도로 10년여의 인기를 누려왔다. 무난한 성능에 쓰기 편하고, 호환성도 좋으며, 시스템 자원 자동할당 기능 등 트러블이 거의 없다는 것도 이유가 될 것이다.

당시로서는 최신 아키텍처이던 PCI역시 그 한계에 부딪친 것은 역시 그래픽의 문제부터라고 할 수 있다. 3D그래픽이 일반화되면서 PCI로서는 해결하기 어려운 지경에 이르게 된 것. 이 문제를 해결하기 위해 선보인 것이 바로 AGP이다.

Accelerated Graphic Port라는 이름처럼, AGP는 그래픽에 특화된 그래픽전용이라는 점이 특징이다. 동작클럭 66MHz, 32비트의 AGP는 꾸준한 발전을 거듭해서 AGP 4배속에서는 약 1GB/s의 전송률을 보일 정도까지 발전했다, 최근 선보이는 AGP 8배속 제품의 경우 대역폭이 2.128GB/s에 이른다. 이런 AGP 역시 PCI를 개량해서 그래픽기능을 특화한 것에 지나지 않는다고 할 수 있다.








» AGP는 그래픽카드에 특화된 것이다.

대신 PCI는 그래픽이라는 부담을 덜어내고, 네트워크나 기타 저장장치에만 쓰이게 되면서 좀 더 효율적으로 쓰임새를 바꾸었다고 할 수 있다. 최근에는 더욱 발전해서 AGP슬롯은 대부분 노스브리지가, PCI슬롯은 사우스브리지에 연결되는 것이 단적인 예이다. 하지만 근본적으로 새로운 구조가 아닌 그래픽에 특화된 것이기에 한계가 분명하다고 할 수 있다.

예를 들어 얼마전부터 쓰이기 시작한 이른바 기가비트랜카드들은 여전히 PCI슬롯에 꼽히지만 심각한 데이터 병목현상을 겪고 있다. 말 그대로 기가비트수준의 데이터를 주고받을 수 있는 능력은 가지고 있지만, PCI슬롯에 꼽히는 순간 값비싼 랜카드 그 이상의 의미를 갖지 못하는 것도 사실이다. 메인보드에 내장되어 있다고 하더라도 결국에는 PCI슬롯에 꼽히는 것과 크게 차이나지 않는 현실에서 근본적으로 PCI슬롯을 뛰어넘는 새로운 버스를 기다리는 것은 단지 네트워크 업체만은 아니다.


Part. 2. 지금 쓰이고 있는 버스 구조 비교


이렇게 발전을 거듭한 버스구조가 지금은 어떻게 쓰이는 지를 알아보는 것은 앞으로 선보일 버스를 알아보는데도 쓸모 있다고 할 수 있을 것이다. CPU는 물론 칩셋까지 직접 만드는 인텔과 비아, SiS, 엔비디아 등의 버스구조를 비교해본다.
































구분 허브링크 V링크 MuTIOL 하이퍼트랜스포트
쓰는 곳 인텔 비아 SiS AMD, 엔비디아
클럭(MHz) 66 66 133 800/1600
비트수 8 16 16 2-32
대역폭(GB/s) 0.266 0.533(8X) 1.2 3.2/12.8



나는 야 허브링크. 인텔










» 전형적인 허브구조의 최신 인텔 875P 칩셋 아키텍처.


인텔이 최근 선보이는 칩셋들은 한결같이 i8XX 같은 이름을 갖는다. 기존의 브리지구조로는 CPU성능을 제대로 보여주지 못한다고 판단한 인텔이 선보인 것이 바로 허브링크(Hub Link)라는 것이다.

허브링크 역시 근본적으로는 기존의 브리지구조를 개선한 것이라고 할 수 있다. 대신 노스브리지 역할을 하는 MCH(Memory Controller Hub)와 사우스브리지 역할을 하는 ICH(IO Controller Hub)를 인텔만의 기술인 자체 시스템 버스로 연결하는 것이 특징이다. 참고로 MCH와 ICH사이의 대역폭은 266MB/s로 비교적 적은 편이지만, 상당히 효율적으로 움직이기에 그리 부족하지는 않다. 허브라는 이름에서 알 수 있듯, 순환구조로 되어 있어 대역폭을 최대한 효율적으로 쓰는 덕분이다.

전체적으로 기존 브리지 구조 이상의 성능을 듬뿍 담고 있으며 안정성에도 상당한 수준이다. 다만 기존 브리지 구조와는 약간 달리 움직이기에, 일부 구형 제품들은 호환성에 문제가 있기도 하다.


최신 기술을 듬뿍 담은 V링크. 비아










» V-MAP이라고 표시된 부분이 V링크를 말한다.


인텔 펜티엄4와 AMD 애슬론XP용 칩셋을 모두 만드는 비아는 전형적인 브리지구조를 쓰고 있다. 다만 늘어나는 대역폭을 보다 효과적으로 전달하기 위해 노스브리지와 사우스브리지 사이를 V링크라는 기술로 연결해서 전달한다. V링크는 처음 선보였을 때와는 달리 꾸준하게 발전하는 모습이다. 처음 선보였던 V링크, 슈퍼V링크를 거쳐 최근에는 V링크 8배속까지 발전하고 있어 전송대역폭은 533MB/s로 늘어났다. CPU가 필요로 하는 전송 대역폭이 늘어나는 만큼 꾸준히 발전한 셈이다. 기존의 브리지구조를 그대로 쓰면서 최대한의 성능을 끌어내고 있다고 보면 크게 틀리지 않다.


1.2GB/s를 나르는 MuTIOL. SiS










» SiS가 선보이는 MuTIOL. 대역폭이 넉넉한 것이 가장 큰 장점이다.


결코 무시할 수 없는 제조사가 바로 SiS. 이런 SiS가 쓰는 버스구조가 바로 MuTIOL이다. MuTIOL(Multi-Threaded I/O Link)은 기존 브리지구조의 단점인 단방향 통신이 아닌, 양방향으로 동작하는 16비트 데이터 버스를 갖는다는 점이 가장 큰 특징이다. 266MHz의 속도로 양방향으로 데이터를 전송할 때는 533MB/s라는 넉넉한 대역폭을 끌어낼 수 있다.

MuTIOL 역시 기존의 브리지 구조를 확장한 것이다. 처음 선보였던 MuTIOL의 대역폭은 533MB/s였지만, 최근에는 발전을 거듭하면서 1GB/s가 넘는 대역폭을 갖추고 있어 대역폭만 따지만 가장 넉넉하다고 할 수 있을 것이다. 이를 SiS에서는 MuTIOL 1G라고 부른다.

AGP를 제외한 나머지 모든 주변장치들이 모두 사우스브리지에 연결되므로 여러 장치들이 동시에 메모리 접근을 위해서는 보다 넓은 대역폭이 필요한 요즈음 상황에 맞춘 것이다. 물론 냉정하게 생각하면 아직은 브리지 사이의 대역폭이 넉넉하지 않은 것보다는 주변기기의 슬롯과 브리지사이의 대역폭이 부족하다고 볼 수 있기에 1G의 위력을 그다지 빛을 발하지 못한다고 할 수 있다.


차원을 달리한다. 하이퍼 트랜스포트. AMD / 엔비디아










» 차세대 버스 가운데 하나인 하이퍼 트렌스포트. AMD를 중심으로 많은 회사들이 참여하고 있다.



엔비디아 엔포스 / 엔포스2와 최근 선보인 ALi M1681에서 쓰고 있는 하이퍼트렌스포트는 본디 차세대 포트로 소개함이 옳을 것이다. 하지만 이미 쓰이고 있기에 먼저 소개하는 새로운 버스이다. 참고로 지금까지의 버스가 주로 직접 또는 간접적으로 인텔이 주도한 규격이었다면, 하이퍼트렌스포트는 AMD가 주도한다는 점이 가장 큰 차이점이다.

하이퍼 트랜스포트의 가장 큰 특징은 P2P(Point-to-Point)방식이라는 것이다. 지금의 시스템 버스 구조는 실제 이론치 대역폭에 비해 실제 대역폭은 상당히 떨어지는 비효율을 보인다. 여러 가지 이유가 있지만 근본적으로 일정부분을 공유하기 때문이다. 간단한 예로 듀얼보드가 결코 두 배의 속도를 내지 못하는 이유 역시 메모리를 비롯해 프로그램의 상당부분을 공유하기 때문인 것이다.

AMD가 LDT(Lighting Data Transport)라는 코드명으로 개발하던 이 기술은 물론 엔비디아에만 제공되는 것은 아니며, 시스코, 선 등 대형 IT회사는 물론 ATI, 비아, ALi, SiS 등의 칩셋 제조사에도 제공되었거나 제공될 예정이다.








» 간단한 P2P 구조라는 것이 하이퍼트랜스포트의 강점이다.

하이퍼 트랜스포트의 또 다른 장점은 안정성이다. 기본적으로 공유되는 기존의 ISA나 PCI와는 달리 P2P방식으로 독립적으로 디바이스들이 연결된 덕분이다. P2P의 약점이라고 할 수 잇는 공유 기능 역시, 데이지 체인 방식의 공유 버스 기능을 갖춰 여러 개의 하이퍼트랜스포트 입출력 디바이스를 하나의 채널에 연결할 수도 있다. 흡사 IEEE1394와 비슷한 얼개인 셈이다. 하이퍼 트랜스포트가 쓰는 데이터 전송방식은 Differential Signal로서 노이즈에 영향을 덜 받고, 비교적 고속전송을 할 수 있어 IEEE1394에도 쓰이는 방식이다. 이 정도면 버스(Bus)가 갖춰야할 기본적인 사양에 매우 충실한 셈으로 차세대 버스라 불릴 만하다.

여기에 하이퍼 트랜스포트는 비교적 간단한 구성으로 높은 대역폭을 갖추고 있다. 연결되는 핀 수는 링크의 비트수에 따라 조금 다르지만, 2비트로 가정하면 전체 핀 수는 24핀에 불과하다. 실제로 데이터 전송에 쓰이는 것은 16개이다. 흔히 쓰이는 32비트 PCI버스가 신호전달에만 49~62개의 핀이 쓰인다는 것을 생각하면 매우 효율적이다.








» 차세대 버스 구조의 하나인 하이퍼트랜스포트는 이미 쓰이고 있다.

이렇게 하이퍼 트랜스포트로 연결되는 기본이 무려 800MB/s이다. 심지어 클럭과 비트수를 높이면 3.2GB/s까지 올릴 수 있으며 실제 상용화된 규격에서는 1.6GB/s가 이미 쓰이고 있을 정도이다. 이 경우 대역폭은 무려 12.8GB/s로 타의 주종을 불허한다. 나중에 설명할 각종 최신 버스보다 오히려 상용화가 먼저 되었다는 점이 가장 큰 장점이라고 할 수 있을 것이다.



2부에서는 곧 선보일 PCI Express를 중심으로 하이퍼 트렌스포트, 인피니밴드, 3GIO, Rapid IO 등 다양한 차세대포트에 대해서 알아볼 예정입니다. 많은 관심을 바랍니다.



2004-01-07 13:57:39
1253 번 읽음
☞ 로그인 후 의견을 남기실 수 있습니다
 캐시선물





365ch.com 128bit Valid HTML 4.01 Transitional and Valid CSS!
태그