인텔 CPU와 AMD GPU의 조합의 정식 등장에 드는 소감 by 파란오이

요즘은 또 CES 기간입니다. 전 어째 CES하고는 참 인연이 없고, 덕분에 인연 없으면 신경도 잘 안쓰기로 해서 참 한가합니다. 게다가 요즘은 여러 가지 이유로 취업 이후 근 10년 가까이만에 안식달을 맞이하는 기분이란...뭐 편하고 좋은데 좀 소외되는 느낌도 있긴 합니다. 뭐 아무렴 이제 변방의 골방 늙은이같은 존재가 된지라 아무도 신경쓰지 않겠죠.

이번 CES를 전후로 가장 불타오른 관련 기업 중 하나라면 단연코 인텔이 아닐까 싶습니다. 여러 가지 의미로요....멜트다운과 스펙터는 여전히 조치 중이고, OS 업데이트 이후 주요 시스템 제조사들의 펌웨어 업데이트가 대기중입니다. 저도 지금 그 케어 영역에 포함되는 시스템들을 다수 보유하고 있고, 이 중 제일 빨리 반응한 건 레노버의 노트북인 거 같습니다. 그제 새 바이오스 업데이트가 올라왔는데, 이게 일단 대응의 최소단계인 거 같고 진행중이라고 되어 있습니다.

뭐 그건 그렇고, 이번에는 이 두 기업의 역사상 참으로 생각하기 힘든 조합의 물건이 나왔습니다. 원패키징 투다이를 EMIB로 묶고 HBM 4GB를 엮어서 올인원 SoC...SoP라고 해야 될까요. 아직 AMD의 APU에도 안올라간 베가 M을 올린 이 시리즈들은 아마 당분간 역대 최강의 내장 그래픽을 갖춘 물건이 등장했다고 해도 과언이 아닐 겁니다. 그리고 약간의 (개인적인) 불안 요소도 당연히 가지고 있습니다 (.....)



이어지는 내용

창밖으로 지나간 평창동계올림픽 성화봉송 by 파란오이

요즘 묵고 있는 병원(...) 창밖으로 무슨 가게 오픈 선전하는 것 같은 소리가 들려서 창밖을 봤더니 수원권 성화봉송이 지나가고 있었습니다. 제가 본 건 11시 30분 언저리 경수대로 곁이었습니다. 촬영은 그냥 손에 있던 샤오미 A1...


행렬은 대형 스폰서인 KT, 코카콜라를 앞세우고 나서 본 성화가 지나가는데, 앞뒤로 교통통제하고 옆으로는 의경들이 같이 걷습니다. KT가 꽤 소란스럽게 그러는데 세계최초 5G 별로 응원하고 싶지 않습니다. 이놈들이 LTE때 빠름 빠름 빠름 하느라 기존 3G 서비스 사용자에게 했던, 하고 있는짓들 생각하면 어휴...

길은 급한 대로 이렇게 막...는데 뒷쪽에 버스는 순찰차를 비집고 결국 고집스럽게 들어왔다가 나갈 때는 통제 덕분에 쉽게 가지 못했습니다. 골목에서 불쑥 나온 차도 꽤 당황스러웠을 것 같기도 하고...뭐 덕분에 통제 방향으로는 꽤 줄이 길었죠.



그리고 얘들은 오산 방향으로 성화 봉송을 이어 갔습니다. 저 방향이 맞는지는 뭐 알아서 가겠죠....

옆에 따라다니는 관내 의경들 고생이 많다는 생각이 듭니다. 날도 추운데...

최근 터진 인텔의 보안 결함 이슈 관련 감상 소감 by 파란오이


사실 아까 써놨던거 핸드폰으로 수정하다가 긴글작성 부분이 한방에 다 날아가서 지우고 다시 쓰기로. 백업 안남겨놓은 것이 이렇게 뼈아플 줄이야....앞으로도 모바일로는 여기 쳐다보지도 말아야겠다는 생각을 합니다.

최근 몇달간 인텔 플랫폼의 보안 결함은 몇 건이 있었는데, 특히 새해를 전후해 터진 이번 결함은 너무도 크고 아름답고 빛납니다. 길게는 펜티엄 프로 이후 20년 넘는 P6 아키텍처 이후의 아웃오브오더 체계 전체에 해당되는 등 아주 난리부루스죠. 뭐 그렇다고 이 생태계의 마지막의 마지막에 있는 PC 사용자에게 바로 목에 칼이 들어올 일은 거의 도시전설로 남은 컴퓨터 옆에 마이크 놓고 고주파음으로 데이터 빼낸다는 수준이 될 거 같습니다만 클라우드 인프라 레벨에서는 하늘이 무너지는 소리가 들렸을 듯 합니다.



1. 일단 멜트다운은 아웃오브오더 체계의 예외처리를 악용해, 명령 수행을 취소시켜도 관련된 리소스가 남아있는 점을 버그를 활용한 사이드어택으로 다른 메모리 영역으로 빼낼 수 있다는 것 같고, 스펙터는 분기예측에서 미리읽기나 예측실패 부분에서 남아있는 리소스를 악용한다는 설명 같습니다. 

뭐 둘 다 거의 인외마경의 경지인 것 같긴 한데, 특히 스펙터는 인텔의 스카이레이크, AMD 라이젠, 그리고 ARM Cortex-A 계열 모두에서 재현이 가능했다고 합니다. 물론 굉장히 재현이 어렵다고는 합니다만 알아채기도 어렵고 대응도 어렵다고 하니 이걸 막는 건 컴퓨트 빌드 아키텍처의 근본이 바뀔 필요가 있어 보입니다.

멜트다운은 어 음...인텔의 P6 이후 아웃오브오더 체계 전체가 해당이 된다고 하는데, 명령어 넣는척 하다가 캔슬하면 페이크당한 연산유닛이 일단 파이프라인을 돌리는데, 타이밍맞춰서 사이드어택으로 캐시 플러시 공격하면 커널 영역의 메모리를 4KB씩 빼낼 수 있다고 했던가 그렇습니다. 일단 이건 꽤 빨리(?) 패치가 나왔는데, 커널 모드와 유저 모드의 변환 측면에서 좀 더 깐깐하게 관리를 하면 막아낼 수 있다고 하고 실제로 그렇게 커널 패치가 됩니다만 성능 임팩트가 다소 있...다고 알려졌었습니다. 뭐 크게는 30%라는데 이건 워낙 다들 플레이어마다 말이 다릅니다.

그래서 멜트다운은 완전히 격리된 커널 영역의 메모리 전채를 빼낼 수 있고, 영향을 받는 환경은 대략 윈도우, 리눅스, 맥OS, 그리고 가상화에서는 Xen과 리눅스 커널을 사용하는 컨테이너 환경까지 해당된다고 합니다. 가상화 환경에서 Xen이 들어간 이유는 예전에 보기로 RHEL 5.4까지 Xen이 들어가 있던 시절에는 Xen 사용을 위해 별도의 Xen 대응 커널을 설치해야 했을 정도로 이게 커널과 붙는데 그래서 그런가 싶기도 합니다. 그래서 VMware는 이야기가 없는데, 커널 그 자체인 KVM은 빠져있는 거 보니 이것도 의외긴 합니다. 뭐 호스트 커널을 공유하는 컨테이너 환경은 빠져나갈 껀덕지가 없을 겁니다. 

스펙터는 서로 분리된 애플리케이션의 메모리 영역을 분리 무시하고 시스템과 앱 영역 모두에 접근할 수 있는 가능성이 있다고 하는데 구현도 어렵고 탐지도 어렵고 하다고 합니다. 이건 가상화 인프라의 근간인 완전 분리 환경, 멀티태넌트 기반을 완전히 붕괴시킬 수 있기 때문에 정신적 타격이 있을 법 합니다. 게다가 이건 아키텍처 불문하고 최근 CPU에 다 등장하니 뭐 피해가기도 참 어렵습니다.


2. 멜트다운의 대응 패치에서 논란이 되던 것이 성능입니다. 유저모드와 커널모드의 컨텍스트 스위칭 과정에서 관련 데이터를 플러싱하고 하면서 처리 성능이 크게는 30%까지 떨어진...다는 결과가 있었는데, 이게 OS와 애플리케이션의 부하 형태에 따라서 꽤 다른 모습을 보여주고 있는 것 같습니다. 일단 현재 가장 큰 영향을 받는 것은 시스템 콜을 빡세게 부르는 고속 스토리지 IO나 시스템 루프백 등의 부분이고, 이를 격하게 쓰는 스토리지와 DB 등에서도 꽤 임팩트가 있다는 보고가 일단은 있었습니다.

덕분에 윈도우 10의 긴급 패치 적용에서도 성능 저하에 대한 부분이 꽤 말이 많았는데, 윈도우 클라이언트의 SSD IO 관련 성능에서는 의외로 임팩트가 크지 않은 신묘한 모습을 보이고 있기도 합니다. 사실 아예 꽤 느려서 프로세서 IO가 거의 놀고먹는 레벨에 이르는 SATA SSD에서는 그리 영향이 없고, 프로세서와 바로 붙는 NVMe SSD에서는 임팩트가 있는 경우도 있다는 결과가 있는데, 이것도 SSD 모델 등에 따라 임팩트가 달라져서 성능에 영향이 있는지는 섣불리 단언하기 힘들기도 합니다. 사실 대형 윈도우 패치 올리고 나면 뒤에는 슈퍼페치와 프리페치 최적화, 시스템 백업과 검증 등 백그라운드 작업이 자잘하게 많기도 하겠죠. 게다가 커널이 어떻게 바뀌었는지 다 파볼수도 없는 노릇 아니겠습니까.

그리고 윈도우 클라이언트 환경에서는 일단 성능이 크게 떨어지지 않을 것이, IO에 그정도로 집중적인 부하를 주지 않으니 프로세서에 여유가 남아 있는 동안은 크게 눈에 띄지 않을 것 같기도 합니다. 실제로 다른 애플리케이션 실행 등에서는 거의 프로세서 성능의 저하가 나오지 않았고, 비교적 최신 하드웨어들의 PCID 기능이 메모리 컨텍스트 스위칭을 매번 하지 않도록 하드웨어 서포트를 제공해 성능 저하를 줄일 수 있다고 합니다. 뭐 리눅스의 경우에도 이걸 이용한 패치를 했는데, 윈도우는 이것보다 좀 더 잘 트윅한 거 같기도 합니다.

그리고 그 와중에도 떨어질 수 있는 성능은 RST나 NVMe 필터 드라이버로 조금의 트윅을 더해 어떻게든 메꿔볼 수도 있을 것 같습니다. 예전 인텔 750 잠깐 써볼때도 인텔의 필터 드라이버 유무에 따라 아예 성능의 급이 달라지는 경우도 있었으니까요. RST도 마찬가지로 스토리지 운영의 캐시 운영 방식 자체를 바꿀 수 있는 만큼, 여기서의 트윅도 조금은 해볼만 하지 않겠나 싶기도 합니다.

성능이 최대 30%까지 떨어진다길래 축제를 벌일 뻔 했던 A쪽은 뭐...딱 2사 만루찬스에 스트라이크아웃낫아웃으로 아직 아웃당하기 전까지 1루로 죽어라 뛰는 타자같은 느낌이랄까 뭐 그렇습니다. 사실 이걸로 퍼포먼스 임팩트를 다소 먹어도 아직 AMD 플랫폼의 NVMe 퍼포먼스가 더 믿음을 못 주는 판이니 말 다했죠. 게다가 실제로 퍼포먼스 임팩트가 너무 애매해지기도 했습니다.


3. 이런 사단이 났는데도 클라우드 단에서 인텔 프로세서를 버릴 수 없는 이유로는 개인적으로는 신뢰성 이상으로 기능 구현의 종속성을 꼽습니다. 뭐 예를 들면 요즘 소프트웨어 정의 인프라에서 네트워크 인프라는 제온 서버에 QAT 가속기로 패킷처리하고, 제온 스케일러블 플랫폼에는 이걸 칩셋에 넣고 성능이 암호화 패킷 상태로 100Gbps를 넘깁니다. 소프트웨어 대비 수십배죠. 스토리지도 뭐 VROC 같은걸로 핫스왑 가능한 NVMe RAID를 구현하는데, 기능상으로 이런 걸 대체할 대안이 안나옵니다. 오히려 이거 피한다고 바꿨다가는 인프라 근간에 답이 안나올 사태가 나오겠죠. 

게다가 PCIe 쪽이나 메모리 대역폭, 인터커넥트 쪽은 페널티 먹은 인텔에 우세할 수 있다고 장담할 수 없는 것이 에픽이고, VM에서 인터커넥트 넘어가면서 대역폭이 고자되는 약점도 있으니까요. 제온 스케일러블의 메시 아키텍처가 별거 아닌거 같은데도 코어-PCIe 컨트롤러간 내부 대역폭 포트가 링버스 1개에서 메시 3포인트로 늘면서 거의 3배로 늘었기도 합니다. 워낙 크게 늘어서 패널티 먹는다 해 봐야 뭐...

게다가 구글의 한마디, AMD는 대안이 아니다...의미심장합니다. 이번에도 AMD는 자기네들건 관계 없다 했는데 스펙터는 관계가 있었죠.


4. 뭐 이런 건과 별개로 이번의 인텔의 대응은 좀 많이 급했습니다. 왠만하면 정책적으로 경쟁사 언급을 안하는 원칙이 있는데도 관계사들 다 잡고 물귀신으로 들어갔죠. 뭐 억울한 건 이해가 갑니다. 스펙터는 실제로 그랬으니까요. 그래도 안하던 모습 보이던 거 보면 좀 급했다 생각도 듭니다. 그리고 CEO의 주식 매도건은 시기가 참으로 좋지 않았는데 이건 좀 더 두고봐야겠습니다. 뭐 실적은 잘 내어왔지만 실적만 잘 낸다는 평이 공존하는지라 말이죠.


5. 이거보다 전에는 ME의 보안 문제도 있었고, 스카이레이크 이후 플랫폼들의 ME 펌웨어 업데이트가 있었습니다. 저도 물론 스카이레이크 시스템이 석대인지라 모두 해당되는데, 레노버 씽크패드 E460은 업데이트 성공, ASUS B150M-A는 업데이트 툴의 문제로 실패, ASUS TUF X299 Mark2는 업데이트 자체가 안보입니다. 

레노버 이녀석들은 참으로 비범한 것이, 펌웨어 11.8.50.3399가 아마 문제 해결되는 최소 버전인데 딱 이것까지만 컨펌해서 업데이트를 올려놨습니다. 참으로 독한 녀석들입니다. 그리고 펌웨어만 올리면 기존의 ME 드라이버쪽과 트러블이 있어사 PTT 리서티피케이션 프로세스가 무한루프 도는 현상이 나오는데, 이건 11.7 대 소프트웨어로 업데이트해 해결했습니다. 2주 정도는 찜찜하게스리 PTT 리서티피케이션 프로세스를 죽여놨었죠...뭐 그래도 레노버는 업데이트라도 됐지 에이수스는 업데이트를 거부합니다 (...)


6. 패치하면서 퍼포먼스 떨어진다길래 좀 찜찜했는데 막상 해보니 제가 가진 SSD들은 원래 느려서(?!) 더 느려질만한 게 없다는 결론을 얻었는데 뭔가 많이 패배한 느낌이지만 신경쓰지 않기로 했습니다. 그리고 향후 이런 함정을 극복하기 위해 무식하게 IO때마다 시스템 콜 하는 방식을 바꿔서 콜 줄이면서 전송하려는 시도가 많은 것으로 들은 바 있는데, 이런 부분의 적용이 더 커질 것으로 기대하고 있기도 합니다.

사실 리눅스의 시스템 드라이버 구현이 좀 고지식한 것도 있고 한데, 윈도우에서의 성능이 생각보다 선방하는 것에도 꽤 놀랍습니다. 아무래도 MS가 커널 뜯어고치면서 나름대로 트윅을 열심히 하지 않았나 싶기도 합니다. 이러면 인텔의 해명문대로 성능 저하는 크게 느껴질 정도가 아니라는 말도 어느 정도는 수긍이 되긴 합니다. 그리고 뭐 윈도우 10 RS4 나올때쯤 되면 성능 문제는 완전히 묻을 수 있지 않겠나 하는 기대도 약간은 있습니다.

뭐 나중에 이게 하드웨어로 수정되려면 얼마나 걸릴지는 모르겠는데, 앞으로 몇 세대 정도 뒤에는 완전 새로운 아키텍처의 등장이 예정되어 있다는 이야기도 들은 것 같고, 이미 코어와 제온 스케일러블의 아키텍처도 꽤 갈라져 있으니 앞으로의 길을 섣불리 장담할 수도 없는 것 같습니다.

아, 마지막으로 이거 대응 방법은...멜트다운은 패치가 나왔고, 스펙터 경우는 진짜 까다로운데 관련된 코드를 잡는 시그니처 기반의 솔루션으로 사전 탐지 정도가 있다는 설이 있습니다. 그리고 여행은 집에 도착해야 끝이고, 해킹은 해커 손에 데이터가 들어가거나 해야 끝이니 행동분석 솔루션같은 걸로 스테이지별 감시 빡세게 해서 뚫려도 손에 쥐어주는 거 없으면 결국 어떻게든 이기게 되는 게임이 되기도 합니다. 샌드박스와 네트워크 기반 보안 업체들의 기운이 더 강건해지겠군요.....뭐 PC에서는 여느 때처럼 바이러스 조심하고 방화벽 잘 쓰고 이상한거 관리자권한으로 막 실행하지 않고 해야 되겠습니다. 뭐 그럼에도 얼마전 CCleaner처럼 허무하게 뚫리는 경우도 있지만 뭐 일단은요...

1 2 3 4 5 6 7 8 9 10 다음

최근 포토로그