FLOW-3D 수치해석용 컴퓨터 선택 가이드 (update)

Hardware Selection for FLOW-3D Products – FLOW-3D

2022-12-07 부분 업데이트 / ㈜에스티아이씨앤디 솔루션사업부

In this blog, Flow Science’s IT Manager Matthew Taylor breaks down the different hardware components and suggests some ideal configurations for getting the most out of your FLOW-3D products.

개요

본 자료는 Flow Science의 IT 매니저 Matthew Taylor가 작성한 자료를 기반으로 STI C&D에서 일부 자료를 보완한 자료입니다. 본 자료를 통해 FLOW-3D 사용자는 최상의 해석용 컴퓨터를 선택할 때 도움을 받을 수 있을 것으로 기대합니다.

수치해석을 하는 엔지니어들은 사용하는 컴퓨터의 성능에 무척 민감합니다. 그 이유는 수치해석을 하기 위해 여러 준비단계와 분석 시간들이 필요하지만 당연히 압도적으로 시간을 소모하는 것이 계산 시간이기 때문일 것입니다.

따라서 수치해석용 컴퓨터의 선정을 위해서 단위 시간당 시스템이 처리하는 작업의 수나 처리량, 응답시간, 평균 대기 시간 등의 요소를 복합적으로 검토하여 결정하게 됩니다.

또한 수치해석에 적합한 성능을 가진 컴퓨터를 선별하는 방법으로 CPU 계산 처리속도인 Flops/sec 성능도 중요하지만 수치해석을 수행할 때 방대한 계산 결과를 디스크에 저장하고, 해석결과를 분석할 때는 그래픽 성능도 크게 좌우하기 때문에 SSD 디스크와 그래픽카드에도 관심을 가져야 합니다.

FLOW SCIENCE, INC. 에서는 일반적인 FLOW-3D를 지원하는 최소 컴퓨터 사양과 O/S 플랫폼 가이드를 제시하지만, 도입 담당자의 경우, 최상의 조건에서 해석 업무를 수행해야 하기 때문에 가능하면 최고의 성능을 제공하는 해석용 장비 도입이 필요합니다. 이 자료는 2022년 현재 FLOW-3D 제품을 효과적으로 사용하기 위한 하드웨어 선택에 대해 사전에 검토되어야 할 내용들에 대해 자세히 설명합니다. 그리고 실행 중인 시뮬레이션 유형에 따라 다양한 구성에 대한 몇 가지 아이디어를 제공합니다.

CPU 최신 뉴스

2022년 11월 23일 기준 (https://www.itworld.co.kr/news/265948 기사 원문 발췌)

ⓒ Rob Schultz/IDG
ⓒ Rob Schultz/IDG
  • 현재 AMD의 라이젠 7000 시리즈와 인텔 13세대 코어 CPU는 환상적인 성능을 제공하나 앞으로는 더욱 좋은 칩이 출시될 예정이다. 물론 강력한 성능을 원한다면 고민할 필요도 없이 최대한 빠른 클럭 속도, 최대한 많은 코어 수를 찾으면 된다. 여기서 어려운 부분은 새로운 칩 라인업의 복잡하다는 것이다. 특히 최신 프로세서와 지난 세대 최상급 프로세서 중에서 고민한다면 여러 부분을 세밀하게 이해해야 한다.
  • 모든 CFD 엔지니어의 고민은 예산이 넉넉하여 무조건 최고 사양의 제품을 구매하면 간단하지만, 현실의 예산은 그렇지 못하기 때문에 선택의 기로에서 힘들어 한다.
  • 현재 워크스테이션에서 최고 사양은 AMD 라이젠 스레드리퍼 PRO 5995WX 샤갈 프로 거의 슈퍼컴퓨터 수준이다. 가격 조회 사이트인 다나와에서 현재 일자(2022년 12월 07일) 기준으로 검색해 보면 CPU 가격만 1000만원대인 매우 고가의 CPU인 것을 알 수 있다.
  • AMD와 인텔의 최신 아키텍처는 모두 성능만큼 에너지 소비량도 늘어난다. AMD의 라이젠 7950X와 인텔의 코어 i9-13900K는 DDR5 RAM을 지원한다.
  • 다양한 가격대의 CPU가 있으므로 아래 CPU 성능 차트의 성능대비 가격을 보고 CPU를 선택하도록 한다.
인텔® 코어™ i9-13900K 프로세서(36M 캐시, 최대 5.80GHz)
인텔® 코어™ i9-13900K 프로세서(36M 캐시, 최대 5.80GHz)

완제품의 경우 그래픽 카드에 따라 가격이 심하게 차이가 나기 때문에 단순 비교가 어려우므로, 구입사양을 정하고 검색을 통해 적당한 제품을 선정하면 된다.

CPU의 선택

CPU는 전반적인 성능에 큰 영향을 미치며, 대부분의 경우 컴퓨터의 가장 중요한 구성 요소입니다. 그러나 데스크탑 프로세서를 구입할 때가 되면 Intel 과 AMD의 모델 번호와 사양을 이해하는 것이 어려워 보일 것입니다.
그리고, CPU 성능을 평가하는 방법에 의해 가장 좋은 CPU를 고른다고 해도 보드와, 메모리, 주변 Chip 등 여러가지 조건에 의해 성능이 달라질 수 있기 때문에 성능평가 결과를 기준으로 시스템을 구입할 경우, 단일 CPU나 부품으로 순위가 정해진 자료보다는 시스템 전체를 대상으로 평가한 순위표를 보고 선정하는 지혜가 필요합니다.

PassMark – CPU Mark High End CPUs

2022년 12월 07일 기준

PassMark - CPU Mark
High End CPUs
Updated 6th of December 2022
PassMark – CPU Mark High End CPUs Updated 6th of December 2022

<출처> https://www.cpubenchmark.net/high_end_cpus.html

수치해석을 수행하는 CPU의 경우 예산에 따라 Core가 많지 않은 CPU를 구매해야 하는 경우도 있을 수 있습니다. 보통 Core가 많다고 해석 속도가 선형으로 증가하지는 않으며, 해석 케이스에 따라 적정 Core수가 있습니다. 이 경우 예산에 맞는 성능 대비 최상의 코어 수가 있을 수 있기 때문에 Single thread Performance 도 매우 중요합니다. 아래 성능 도표를 참조하여 예산에 맞는 최적 CPU를 찾는데 도움을 받을 수 있습니다.

PassMark - CPU Mark
Single Thread Performance
Updated 6th of December 2022
PassMark – CPU Mark Single Thread Performance Updated 6th of December 2022

출처 : https://www.cpubenchmark.net/singleThread.html

CPU 성능 분석 방법

부동소수점 계산을 하는 수치해석과 밀접한 Computer의 연산 성능 벤치마크 방법은 대표적으로 널리 사용되는 아래와 같은 방법이 있습니다.

FLOW-3D의 CFD 솔버 성능은 CPU의 부동 소수점 성능에 전적으로 좌우되기 때문에 계산 집약적인 프로그램입니다. FlowSight 또한 CPU에 크게 의존합니다. 현재 출시된 사용 가능한 모든 CPU를 벤치마킹할 수는 없지만 상대적인 성능을 합리적으로 비교할 수는 있습니다.

특히, 수치해석 분야에서 주어진 CPU에 대해 FLOW-3D 성능을 추정하거나 여러 CPU 옵션 간의 성능을 비교하기 위한 최상의 옵션은 Standard Performance Evaluation Corporation의 SPEC CPU2017 벤치마크(현재까지 개발된 가장 최신 평가기준임)이며, 특히 SPECspeed 2017 Floating Point 결과가 CFD Solver 성능을 매우 잘 예측합니다.

이는 유료 벤치마크이므로 제공된 결과는 모든 CPU 테스트 결과를 제공하지 않습니다. 보통 제조사가 ASUS, Dell, Lenovo, HP, Huawei 정도의 제품에 대해 RAM이 많은 멀티 소켓 Intel Xeon 기계와 같은 값비싼 구성으로 된 장비 결과들을 제공합니다.

CPU 비교를 위한 또 다른 옵션은 Passmark Software의 CPU 벤치마크입니다. PerformanceTest 제품군은 유료 소프트웨어이지만 무료 평가판을 사용할 수 있습니다. 대부분의 CPU는 저렴한 옵션을 포함하여 나열됩니다. 부동 소수점 성능은 전체 벤치마크의 한 측면에 불과하지만 다양한 워크로드에서 전반적인 성능을 제대로 테스트합니다.

예산을 결정하고 해당 예산에 해당하는 CPU를 선택한 후에는 벤치마크를 사용하여 가격에 가장 적합한 성능을 결정할 수 있습니다.

<참고>

SPEC의 벤치 마크https://www.spec.org/benchmarks.html#cpu )

SPEC CPU 2017 (현재까지 가장 최근에 개발된 CPU 성능측정 기준)

다른 컴퓨터 시스템에서 컴퓨팅 계산에 대한 집약적인 워크로드를 비교하는데 사용할 수 있는 성능 측정을 제공하도록 설계된 SPEC CPU 2017에는 SPECspeed 2017 정수, SPECspeed 2017 부동 소수점, SPECrate 2017 정수 및 SPECrate 2017 부동 소수점의 4 가지 제품군으로 구성된 43 개의 벤치 마크가 포함되어 있습니다. SPEC CPU 2017에는 에너지 소비 측정을 위한 선택적 메트릭도 포함되어 있습니다.

<SPEC CPU 벤치마크 보고서>

벤치마크 결과보고서는 제조사별, 모델별로 테스트한 결과를 아래 사이트에 가면 볼 수 있습니다.

https://www.spec.org/cgi-bin/osgresults

<보고서 샘플>

  • SPEC CPU 2017

Designed to provide performance measurements that can be used to compare compute-intensive workloads on different computer systems, SPEC CPU 2017 contains 43 benchmarks organized into four suites: SPECspeed 2017 Integer, SPECspeed 2017 Floating Point, SPECrate 2017 Integer, and SPECrate 2017 Floating Point. SPEC CPU 2017 also includes an optional metric for measuring energy consumption.

클럭 대 코어

일반적으로 클럭 속도가 높은 칩은 CPU 코어를 더 적게 포함합니다. FLOW-3D는 병렬화가 잘되어 있지만, 디스크 쓰기와 같이 일부 작업은 기본적으로 단일 스레드 방식으로 수행됩니다. 따라서 데이터 출력이 빈번하거나 큰 시뮬레이션은 종종 더 많은 코어가 아닌, 더 높은 클럭 속도를 활용합니다. 마찬가지로 코어 및 소켓의 다중 스레딩은 오버헤드를 발생시키므로 작은 문제의 해석일 경우 사용되는 코어 수를 제한하면 성능이 향상될 수 있습니다.

CPU 아키텍처

CPU 아키텍처는 중요합니다. 최신 CPU는 일반적으로 사이클당 더 많은 기능을 제공합니다. 즉, 현재 세대의 CPU는 일반적으로 동일한 클럭 속도에서 이전 CPU보다 성능이 우수합니다. 또한 전력 효율이 높아져 와트당 성능이 향상될 수 있습니다. Flow Science에는 구형 멀티 소켓 12, 16, 24 코어 Xeon보다 성능이 뛰어난 최근 세대 10~12 Core i9 CPU 시스템을 보유하고 있습니다.

오버클럭

해석용 장비에서는 CPU를 오버클럭 하지 않는 것이 좋습니다. 하드웨어를 다년간의 투자라고 생각한다면, 오버클럭화는 발열을 증가시켜 수명을 단축시킵니다. CPU에 따라 안정성도 저하될 수 있습니다. CPU를 오버클럭 할 때는 세심한 열 관리가 권장됩니다.

하이퍼스레딩

<이미지출처:https://gameabout.com/krum3/4586040>

하이퍼스레딩은 물리적으로 1개의 CPU를 가상으로 2개의 CPU처럼 작동하게 하는 기술로 파이프라인의 단계수가 많고 각 단계의 길이가 짧을때 유리합니다. 다만 수치해석 처럼 모든 코어의 CPU를 100% 사용중인 장시간 수행 시뮬레이션은 일반적으로 Hyper Threading이 비활성화 된 상태에서 더 잘 수행됩니다. FLOW-3D는 100% CPU 사용률이 일반적이므로 새 하드웨어를 구성할 때 Hyper Threading을 비활성화하는 것이 좋습니다. 설정은 시스템의 BIOS 설정에서 수행합니다.

몇 가지 워크로드의 경우에는 Hyper Threading을 사용하여 약간 더 나은 성능을 보이는 경우가 있습니다. 따라서, 최상의 런타임을 위해서는 두 가지 구성중에서 어느 구성이 더 적합한지 시뮬레이션 유형을 테스트하는 것이 좋습니다.

스케일링

여러 코어를 사용할 때 성능은 선형적이지 않습니다. 예를 들어 12 코어 CPU에서 24 코어 CPU로 업그레이드해도 시뮬레이션 런타임이 절반으로 줄어들지 않습니다. 시뮬레이션 유형에 따라 16~32개 이상의 CPU 코어를 선택할 때는 FLOW-3D 및 FLOW-3D CAST의 HPC 버전을 사용하거나 FLOW-3D CLOUD로 이동하는 것을 고려하여야 합니다.

AMD Ryzen 또는 Epyc CPU

AMD는 일부 CPU로 벤치마크 차트를 석권하고 있으며 그 가격은 매우 경쟁력이 있습니다. FLOW SCIENCE, INC. 에서는 소수의 AMD CPU로 FLOW-3D를 테스트했습니다. 현재 Epyc CPU는 이상적이지 않고 Ryzen은 성능이 상당히 우수합니다. 발열은 여전히 신중하게 다뤄져야 할 문제입니다. 현재 32 코어 옵션에 영향을 주는 Windows 버그가 초기 버전에서 성능을 크게 저하시키는 것으로 알려져 있습니다. Bug Fix가 되었는지 업데이트 하여 확인하고, 해결되지 않은 경우 이러한 CPU에는 Linux를 권장됩니다.

<관련 기사>

https://www.techspot.com/news/78122-report-software-fix-can-double-threadripper-2990wx-performance.html

Graphics 고려 사항

FLOW-3D는 OpenGL 드라이버가 만족스럽게 수행되는 최신 그래픽 카드가 필요합니다. 최소한 OpenGL 3.0을 지원하는 것이 좋습니다. FlowSight는 DirectX 11 이상을 지원하는 그래픽 카드에서 가장 잘 작동합니다. 권장 옵션은 엔비디아의 쿼드로 K 시리즈와 AMD의 파이어 프로 W 시리즈입니다.

특히 엔비디아 쿼드로(NVIDIA Quadro)는 엔비디아가 개발한 전문가 용도(워크스테이션)의 그래픽 카드입니다. 일반적으로 지포스 그래픽 카드가 게이밍에 초점이 맞춰져 있지만, 쿼드로는 다양한 산업 분야의 전문가가 필요로 하는 영역에 광범위한 용도로 사용되고 있습니다. 주로 산업계의 그래픽 디자인 분야, 영상 콘텐츠 제작 분야, 엔지니어링 설계 분야, 과학 분야, 의료 분석 분야 등의 전문가 작업용으로 사용되고 있습니다. 따라서 일반적인 소비자를 대상으로 하는 지포스 그래픽 카드와는 다르계 산업계에 포커스 되어 있으며 가격이 매우 비싸서 도입시 예산을 고려해야 합니다.

유의할 점은 엔비디아의 GTX 게이밍 하드웨어는 볼륨 렌더링의 속도가 느리거나 오동작 등 몇 가지 제한 사항이 있습니다. 일반적으로 노트북에 내장된 통합 그래픽 카드보다는 개별 그래픽 카드를 강력하게 추천합니다. 최소한 그래픽 메모리는 512MB 이상을 권장합니다.

PassMark - G3D Mark High End Videocards 2022
PassMark – G3D Mark High End Videocards 2022

출처 : https://www.videocardbenchmark.net/high_end_gpus.html

원격데스크탑 사용시 고려 사항

Flow Science는 nVidia 드라이버 버전이 341.05 이상인 nVidia Quadro K, M 또는 P 시리즈 그래픽 하드웨어를 권장합니다. 이 카드와 드라이버 조합을 사용하면 원격 데스크톱 연결이 완전한 3D 가속 기능을 갖춘 기본 하드웨어에서 자동으로 실행됩니다.

원격 데스크톱 세션에 연결할 때 nVidia Quadro 그래픽 카드가 설치되어 있지 않으면 Windows는 소프트웨어 렌더링을 사용합니다. 이는 FLOW-3D 및 FlowSight 모두 성능에 부정적인 영향을 미칩니다. FLOW-3D 가 소프트웨어 렌더링을 사용하고 있는지 확인하려면 FLOW-3D 도움말 메뉴에서 정보를 선택하십시오. GDI Generic을 소프트웨어 렌더링으로 사용하는 경우 GL_RENDERER 항목에 표시됩니다.

하드웨어 렌더링을 활성화하는 몇 가지 옵션이 있습니다. 쉬운 방법 중 하나는 실제 콘솔에서 FLOW-3D를 시작한 다음 원격 데스크톱 세션을 연결하는 것입니다. Nice Software DCV 와 같은 일부 VNC 소프트웨어는 기본적으로 하드웨어 렌더링을 사용합니다.

RAM 고려 사항

프로세서 코어당 최소 4GB의 RAM은 FLOW-3D의 좋은 출발입니다. FlowSight POST Processor를 사용하여 후처리 작업을 할 경우 상당한 양의 RAM을 사용하는 것이 좋습니다.

현재 주력제품인 DDR4보다 2배 빠른 DDR5가 곧 출시된다는 소식도 있습니다.

일반적으로 FLOW-3D를 이용하여 해석을 할 경우 격자(Mesh)수에 따라 소요되는 적정 메모리 크기는 아래와 같습니다.페이지 보기

  • 초대형 (2억개 이상의 셀) : 최소 128GB
  • 대형 (60 ~ 1억 5천만 셀) : 64 ~ 128GB
  • 중간 (30-60백만 셀) : 32-64GB
  • 작음 (3 천만 셀 이하) : 최소 32GB

HDD 고려 사항

수치해석은 해석결과 파일의 데이터 양이 매우 크기 때문에 읽고 쓰는데, 속도면에서 매우 빠른 SSD를 적용하면 성능면에서 큰 도움이 됩니다. 다만 SSD 가격이 비싸서 가성비 측면을 고려하여 적정수준에서 결정이 필요합니다.

CPU와 저장장치 간 데이터가 오고 가는 통로가 그림과 같이 3가지 방식이 있습니다. 이를 인터페이스라 부르며 SSD는 흔히 PCI-Express 와 SATA 통로를 이용합니다.

흔히 말하는 NVMe는 PCI-Express3.0 지원 SSD의 경우 SSD에 최적화된 NVMe (NonVolatile Memory Express) 전송 프로토콜을 사용합니다. 주의할 점은 MVMe중에서 SATA3 방식도 있기 때문에 잘 구별하여 구입하시기 바랍니다.

그리고 SSD를 선택할 경우에도 SSD 종류 중에서 PCI Express 타입은 매우 빠르고 가격이 고가였지만 최근에는 많이 저렴해졌습니다. 따라서 예산 범위내에서 NVMe SSD등 가장 효과적인 선택을 하는 것이 좋습니다.
( 참고 : 해석용 컴퓨터 SSD 고르기 참조 )

기존의 물리적인 하드 디스크의 경우, 디스크에 기록된 데이터를 읽기 위해서는 데이터를 읽어내는 헤드(바늘)가 물리적으로 데이터가 기록된 위치까지 이동해야 하므로 이동에 일정한 시간이 소요됩니다. (이러한 시간을 지연시간, 혹은 레이턴시 등으로 부름) 따라서 하드 디스크의 경우 데이터를 읽기 위한 요청이 주어진 뒤에 데이터를 실제로 읽기까지 일정한 시간이 소요되는데, 이 시간을 일정한 한계(약 10ms)이하로 줄이는 것이 불가능에 가까우며, 데이터가 플래터에 실제 기록된 위치에 따라서 이러한 데이터에의 접근시간 역시 차이가 나게 됩니다.

하지만 HDD의 최대 강점은 가격대비 용량입니다. 현재 상용화되어 판매하는 대용량 HDD는 12TB ~ 15TB가 공급되고 있으며, 이는 데이터 저장이나 백업용으로 가장 좋은 선택이 됩니다.
결론적으로 데이터를 직접 읽고 쓰는 드라이브는 SSD를 사용하고 보관하는 용도의 드라이브는 기존의 HDD를 사용하는 방법이 효과적인 선택이 될 수 있습니다.

PassMark – Disk Rating High End Drives

PassMark - Disk Rating High End Drives 2022
PassMark – Disk Rating High End Drives 2022

출처 : https://www.harddrivebenchmark.net/high_end_drives.html

상기 벤치마크 테스트는 테스트 조건에 따라 그 성능 곡선이 달라질 수 있기 때문에 조건을 확인할 필요가 있습니다. 예를 들어 Windows7, windows8, windows10 모두에서 테스트한 결과를 평균한 점수와 자신이 사용할 컴퓨터 O/S에서 테스트한 결과는 다를 수 있습니다. 상기 결과에 대한 테스트 환경에 대한 내용은 아래 사이트를 참고하시기 바랍니다.

참고 : 테스트 환경

페이지 보기

Intel CPU i9

해석용 컴퓨터 CPU에 대한 이해 및 선택 방법

last update : 2021-12-15

자료출처 : 본 기사는 PCWorld Australia의 내용과 www.itworld.co.kr의 기사를 기반으로 일부 가필하여 게재한 내용입니다.

해석용 컴퓨터를 선정하기 위해서는 가장 먼저 선택해야 하는 것이 있다. AMD인가, 인텔인가? 두 업체는 CPU 시장의 양대산맥과도 같다. 인텔이 새롭게 출시한 12세대 앨더 레이크 CPU 시리즈가 벤치마크 기록을 깼지만, 지난해 출시된 AMD의 라이젠 5000 아키텍처를 고수하거나, 다른 신제품을 기다릴만한 이유도 있다. 인텔과 AMD CPU를 자세히 살펴보자.

ⓒ Gordon Mah Ung


비교 대상 제품 

2021.11.09

PC 조립 부품을 예산 기준으로 결정하고, 반도체 수급난에서 CPU를 정가에 구매할 수 있다고 가정했을 때, 인텔과 AMD 제품 선택지를 몇 가지로 압축할 수 있다.

인텔성능/효율 코어쓰레드가격
Core i9 12900K/KF8/824590달러/570달러
Core i7 12700K/KF8/420410달러/390달러
Core i5 12600K/KF6/416290달러/270달러
AMD  성능 코어 쓰레드    가격   
Ryzen 9 5950X1632800달러
Ryzen 9 5900X1224550달러
Ryzen 7 5800X816450달러
Ryzen 5 5600X612300달러

비교적 저렴한 인텔 CPU인 F 시리즈는 통합 그래픽카드가 없어 별도의 GPU가 필요하다. 라이젠 프로세서는 외장 그래픽카드와 짝을 이루어야 한다. 인텔이 ‘한 방’을 노리고 있기 때문에 이 비교에서는 최상급인 16코어 라이젠 9 5950X도 함께 살펴볼 예정이다. 12900KF가 최대 8코어이기 때문에 라이젠 9 5950X와 직접적인 비교 대상은 아니지만, 인텔은 AMD와 꽤 대등하게 싸우고 있다. CPU에만 80만원을 지출할 계획이라면 더 큰 파워 서플라이가 필요하다.

인텔 코어 CPU 에 대한 이해

인텔 코어 CPU에 대한 자료를 찾아보면 쿼드(Quad) 코어, 하이퍼-스레딩(Hyper-Threading), 터보-부스팅(Turbo-Boosting), 캐시(Cache) 크기 같은 용어를 많이 볼 수 있다.
인텔 코어 i3, i5, i7, i9는 각각 어떻게 다를까?
칩셋에는 세대가 있는데, 세대의 의미와 차이는 무엇일까?
하이퍼-스레딩은 무엇이고 클럭 속도는 어느 정도가 적합할까?

새 프로세서를 구입하기 전에 먼저 현재 사용하고 있는 인텔 CPU를 이해해보자.
지금 내 PC 성능이 어느 정도인지 알기 위해서이다.
가장 빠른 방법은 제어판 > 시스템 및 보안 항목에서 시스템을 선택하는 것이다.

여기에서 현재 PC에 설치된 CPU, RAM, 운영체제 정보를 확인할 수 있다.
프로세서 아래에 현재 설치된 인텔 CPU가 무엇인지, 인텔 코어 i7-4790, 인텔 코어 i7-8500U 같은 모델명을 확인할 수 있을 것이다. 또 Ghz가 단위인 CPU 클럭 속도를 알 수 있다. 나중에 이와 관련해 더 자세히 설명을 하겠다.

일단 CPU부터 알아보자.
CPU 모델명에는 숫자가 많아 어려워 보이지만, 이 숫자가 무슨 의미인지 이해하는 것은 어려운 일이 아니다.

모델명의 앞 부분인 “인텔 코어”는 인텔이 만든 코어 시리즈 프로세스 중 하나라는 의미다. 코어는 인텔에서 가장 크고, 인기있는 제품군이다. 따라서 많은 인텔 제품 데스크톱과 노트북 컴퓨터에서 인텔 코어라는 표기를 발견할 수 있다.

참고 : 인텔은 셀룰론(Celeron), 펜티엄(Pentium), 제온(Xeon) 등 다양한 프로세스 제품군을 판매하고 있지만, 이 기사는 인텔 코어 프로세스에 초점을 맞춘다.

그 다음 “i7”은 CPU 내부 마이크로 아키텍처 디자인의 종류이다.
자동차가 클래스와 엔진 종류로 나눠지는 것과 비슷하다. 이들 ‘엔진’이 하는 일은 동일하다. 그러나 차량 브랜드에 따라 일을 하는 방법이 다르다.
인텔의 경우 코어 브랜드 CPU의 클래스인 i3, i5, i7이 각각 사양이 다르다. 여기서 사양이란 코어의 수, 클럭 속도, 캐시 크기, 터보 부스트 2.0과 하이퍼스레딩 같은 고급 기능 지원 여부를 말한다.
코어 i5와 i7 데스크톱 프로세서는 통상 쿼드 코어(코어가 4개)이고, 로우엔드(저가) 코어 i3 데스크톱 프로세스는 듀얼 코어(코어가 2개)다.

이제 SKU와 세대에 대해 알아보자. 앞서 예로 들은 “4790”으로 설명하겠다.
첫 번째 숫자인 “4”는 CPU의 세대이고, “790”는 일종의 일련번호, 또는 ID 번호이다. 즉 인텔 코어 i7이 4세대 CPU라는 이야기이다.

그런데 ‘접미사’가 붙는 경우가 있다. 위에서 예로 든 모델에는 접미사가 없지만 “Intel Core i7-8650U” 같이 끝에 접미사가 붙은 모델이 있다. 여기에서 “U”는 “Ultra Low Power(초저전력)”를 의미한다.
인텔은 모델명에 다양한 접미사를 사용하는데 세대에 따라 의미가 바뀌는 경우가 있다. 따라서 현재 사용하고 있는 CPU 모델을 정확히 해석하려면 링크된 인텔의 ‘접미사 목록’ 페이지를 참고하자.

CPU의 세대는 중요할까?

꽤 중요하다. 간단히 말해, 그리고 일반적으로 세대가 높을 수록, 즉 새로울 수록 더 좋다. 하지만 세대별로 개선된 정도는 각기 다르다.

인텔에 따르면, 최신 8세대 인텔 코어 프로세스는 7세대보다 최대 40%까지 성능이 향상됐다. 물론 비교 대상에 따라 성능 향상치가 크게 다르다. SKU가 세대별로 다를 수 있기 때문이다. 예를 들어, 인텔 코어 i7-8850U는 있지만 인텔 코어 i7-7850U는 없다.

세대가 높을 수록 최신 프로세서라는 것이 기본 원칙이다. 더 발전한 기술과 설계의 이점을 누릴 수 있다는 의미이며, PC 성능도 따라서 향상될 것이다.

코어가 많을 수록 좋을까?
간단히 대답하면, 일반적으로 코어 수가 적은 것보다 많은 것이 좋다. 코어가 1개인 프로세서는 한 번에 스레드 1개만 처리할 수 있다. 그리고 코어가 2개인 프로세서는 2개를, 코어가 4개인 쿼드 코어 프로세서는 4개를 처리할 수 있다.

그렇다면 스레드(Thread)는 무엇일까? 아주 간단히 설명하면, 스레드는 특정 프로그램에서 나와 프로세서를 통과하는 연속된 데이터 데이터 흐름을 말한다. PC의 모든 것은 프로세서를 통과하는 스레드로 귀결된다.

즉, 논리적으로 코어가 많을 수록 한 번에 처리할 수 있는 스레드가 많다. PC가 더 빠르고 효율적으로 데이터를 처리하고 명령을 실행할 수 있다는 이야기이다. 그러나 새 CPU를 조사하면서 코어 수에만 초점을 맞추면 자칫 코어 수만큼 중요한 수치인 클럭 속도를 무시할 위험이 있다.

CPU의 각 코어에는 Ghz가 단위인 클럭 속도가 있다. 클럭 속도는 CPU 실행 속도다. 클럭 속도가 빠를 수록, CPU가 한 번에 처리 및 실행할 수 있는 명령이 많다.

클럭 속도는 통상 높을 수록 더 좋다. 그러나 발열과 관련된 제약 때문에 프로세서의 코어 수가 많을 수록 클럭 속도가 낮은 경향이 있다. 이런 이유로 코어 수가 많은 PC가 최고의 성능을 발휘하지 못하는 경우도 있다.
그렇다면 가장 알맞은 클럭 속도는 어느 정도일까?


클럭 속도는 PC로 하려는 일에 따라 달라진다. 일부 애플리케이션은 싱글스레드로 실행된다. 반면, 여러 스레드를 활용하도록 만들어진 애플리케이션도 있다. 비디오 렌더링이나 일부 게임 환경이 여기에 해당된다. 이 경우, 코어 수가 많은 프로세서가 클럭 속도가 높지만 코어가 하나인 프로세스보다 성능이 훨씬 더 높다.
수치해석의 경우는 계산량이 많은 큰 해석의 경우 멀티코어가 훨씬 유리하다.

웹 브라우징 같은 일상적인 작업에서는 클럭 속도가 높은 i5 프로세서가 i7보다 가격 대비 성능이 훨씬 더 높다는 의미이다. 즉, 코어 수가 많은 프로세서보다 클럭 속도는 높고 코어 수가 적은 프로세서를 구입하는 것이 훨씬 경제적인 대안이 될 수도 있다.

하이퍼-스레딩이란?

앞서 언급했듯, 일반적으로 프로세서 코어 하나가 한 번에 하나의 스레드만 처리할 수 있다. 즉, CPU가 듀얼 코어라면 동시에 처리할 수 있는 스레드가 2개다. 그러나 인텔은 하이퍼-스레딩이라는 기술을 개발해 도입했다. 가상으로 운영체제가 인식하는 코어를 2배 증가시키는 방법으로 하나의 코어가 동시에 여러 스레드를 처리할 수 있는 기술이다.

즉 i5의 물리적 코어 수는 4개이지만, 여러 스레드를 지원하는 애플리케이션을 실행시키면 하이퍼-스레딩이 코어 수를 가상으로 2배 늘려서 성능을 크게 향상하는 방법이다.

터보 부스트(Turbo Boost)란?

인텔의 터보 부스트는 프로세서가 필요한 경우 동적으로 클럭 속도를 높이는 기능이다. 터부 부스트로 높을 수 있는 최대 클럭 속도는 활성 코어의 수, 추정되는 전류 및 전력 소모량, 프로세서 온도에 따라 달라진다.

알기 쉽게 설명하면, 인텔 터보 부스트 기술은 사용자의 프로세서 사용 현황을 모니터링, 프로세서가 ‘열 설계 전력’의 최대치에 얼마나 가까이 도달했는지 판단한 후 적절한 수준으로 클럭 속도를 높인다. 기본적으로 가장 적절하고 우수한 클럭 속도와 코어 수를 제공한다.

현재 터보 부스트 테크놀로지 2.0 버전이 사용되고 있으며, 여러 다양한 7세대 및 8세대 인텔 코어 i7과 i5 CPU에서 이를 지원한다.

i3, i5, i7, i9 프로세서 중 하나를 선택하기 전에 클럭 속도, 코어 수와 함께 기억해야 할 한 가지가 또 있다.

캐시 크기

CPU가 동일한 데이터를 계속 사용하는 경우, CPU는 이 데이터를 프로세서의 일부분인 캐시라는 곳에 저장된다. 캐시는 RAM과 비슷하다. 그러나 메인보드가 아닌 CPU에 구축되어 있어 훨씬 더 빠르다.
캐시 크기가 크면 더 빨리 더 많은 데이터에 액세스 할 수 있다. 클럭 속도 및 코어 수와 다르게, 캐시 크기는 무조건 클 수록 더 좋다. 메모리가 많을 수록 CPU 성능이 향상된다.

7세대 코어 i3 및 코어 i5 프로세서 U 및 Y 시리즈 캐시 크기는 3MB, 4MB이다. 코어 i7의 캐시 크기는 4MB이다. 현재 8세대 프로세서의 캐시 메모리는 6MB, 8MB, 9MB, 12MB이다.

코어 i3, i5, i7, i9의 차이점은 무엇일까?
일반적으로 코어 i7은 코어 i5, 코어 i5는 코어 i3보다 나은 프로세서이다. 코어 i7의 코어 수는 7개가 아니다. 코어 i3 역시 코어 수가 3개가 아니다. 코어 수나 클럭 속도가 아닌 상대적인 연산력의 차이를 알려주는 수치다.

2017년 출시된 코어 i9 시리즈는 고가의 고성능 프로세서이다. 최상급인 코어 i9-7980X의 코어 수와 클럭 속도는 18개와 2.6GHz, 한 번에 처리할 수 있는 스레드는 32개이다. 가장 저렴한 코어 i9-7900X의 경우 각각 10코어, 3.3GHz(기본 클럭 속도), 20 스레드이다.

수치해석 측면에서 구입해야 할 컴퓨터를 고려한다면 CPU 성능은 현재 최신코어인 i7과 i9을 구입하는 것이 원하는 성능을 정확히 제공하는 CPU를 선택하는 방법이지만 예산과 성능이라는 선택의 문제가 존재한다.

editor@itworld.co.kr


AMD CPU 에 대한 이해

썸네일
썸네일

AMD CPU 이름 규칙 및 코드명, 종류, 세대, 소켓 알아보기

AMD 1600, AMD 2400G, Athlon 240GE, AMD 3990X 등 AMD에 다양한 종류의, 다양한 모델명을 가진 cpu들이 있습니다. AMD cpu, apu의 종류와 세대, 소켓에 대해서 알아보도록 하며 이 글에서는 2017년 3월 3일 이후 나온 ‘라이젠’ 시리즈의 cpu, apu에 대해서만 다루도록 하겠습니다.

AMD 라이젠 시리즈는 현재 3세대까지 출시되었으며, 크게 일반 cpu, 하이엔드 cpu(스레드리퍼), 일반 APU, 모바일 APU으로 나뉩니다. 또한 소켓은 현재까지 나온 cpu 중 하이엔드 cpu를 제외한 cpu는 모두 am4소켓입니다.

AMD CPU 이름 규칙

이름 규칙

 

이름 규칙

AMD 라이젠 시리즈는 ‘AMD 라이젠 7 1700X’를 예로 들면, 앞의 ‘AMD’는 회사 이름을 나타내며

뒤에 ‘라이젠 7’은 성능을 나타냅니다.
‘라이젠 3’은 메인스트림,
‘라이젠 5’는 고성능,
‘라이젠 7’은 최고 성능입니다.

그리고 뒤에 ‘1’은 세대를 나타냅니다.
‘1700’은 Zen 1세대이며,
‘AMD 라이젠 5 2400G’와 같이 APU는 기존 세대에 비해 조금 개선되긴 했지만, 다음 세대 정도까지에 개선은 아니라서 세대는 같지만, ‘400G’앞에 붙는 숫자는 1이 더해져서 나옵니다.

그리고 두번째 자리 ‘7’은 성능을 나타냅니다.
‘2,3’은 메인스트림,
‘4,5,6’은 고성능,
‘7,8’은 최고 성능입니다.

그리고 세네번째 자리는 세세한 기능의, 세세한 성능의 변화 정도로 생각하시면 됩니다.

출처: https://minikupa.com/52 [미니쿠파]

 

인텔 코어 i9-12900K 리뷰 | 왕좌 탈환 노리는 ‘인텔의 귀환’

2021.11.09

Gordon Mah Ung | PCWorld구원 서사를 좋아하지 않는 사람은 없다. 인텔 12세대 코어 i9-12900K는 오랫동안 회자될 귀환 이야기의 주인공이다. 한때 강력하고 득의양양했던 챔피언은 수 년 전 부활한 AMD 라이젠 프로세서의 손에 굴욕적인 패배를 겪었고 어떻게 해서든 다시 한번 싸울 방법을 찾아 마침내 승리를 외치려고 한다. 이제 카메라가 페이드아웃 되면서 엔딩 크레딧으로 넘어간 셈이다.

인생이나 기술은 그런 헐리우드식 결말을 맺기 어렵지만, 인텔 코어 i9-12900K는 그런 드라마의 주인공 역할을 상당히 잘 해낸 것 같다. 지난 몇 년 동안 AMD 프로세서에 두들겨 맞은 후 태어난 12900K는 경쟁 제품인 라이젠 9 5950X보다 훨씬 더 나은 CPU로 더 많은 사용자에게 활용 가능성을 안겼다. 화끈한 KO 승리를 거둔 것은 전혀 아니지만, 인텔 12세대 앨더 레이크 프로세서의 뛰어난 장점과 기능을 고려할 때 바로 오늘 구입할 수 있는 하이엔드 데스크톱 프로세서다. 

ⓒ Gordon Mah Ung


12세대 앨더 레이크는 어떤 CPU?

인텔 12세대 앨더 레이크는 근본적으로 인텔 7 공정을 기반으로 만들어진 하이브리드 CPU 설계다. 사실 이것만으로도 엄청난 일이다. 14나노 트랜지스터 기술에 5년 이상을 허비한 끝에, 앨더 레이크는 마침내 하나의 노드를 뛰어넘었다. (기존 10나노 공정이 리브랜드된 후 인텔 7이라는 이름으로 불린다.)

새롭게 설계된 고성능 CPU 코어와 더 작아진 효율 코어를 혼합하여 성능 대 전력 비율의 균형을 최적화했다. 완전히 재설계된 큰 코어를 가진 인텔의 첫 번째 인텔 7 프로세스 데스크톱 CPU라고 이해하는 것이 가장 쉽다. 그리고 여기에 더해 여러 개의 나머지 효율성 코어 성능이 이전 10세대 코어만큼 우수하다. 또한, 12세대 앨더 레이크는 PCIe 5.0, DDR5 메모리, LGA1700 소켓을 비롯해 새로운 표준을 다수 지원한다.

ⓒ Intel

CPU 렌더링 성능

인텔의 전통점 강점이 아니었던 3D 렌더링과 모델링부터 시작하자. 지금까지는 PC에서 3D 모델링 애플리케이션 실사용자가 많지 않아서, 이들 전문 애플리케이션의 실행 성능에 큰 의미를 두지 않았다는 것이 인텔의 주장이었다. 라이젠 CPU의 눈부신 성능에 뒤지는 경우에만 렌더링 성능에서 피벗을 뺐다는 점에 주목하는 사람도 많다.

맥슨 시네벤치 R23부터 시작한다. 맥슨 시네마4D 애플리케이션에 사용되는 렌더링 엔진 테스트이며, 같은 렌더링 엔진이 일부 어도비 애플리케이션에도 내장되어 있다.

최신 버전은 10분 쓰로틀링 테스트를 기본값으로 제안한다. 인텔 10세대, 11세대 칩과 윈도우 11 환경을 테스트한 결과는 없지만, 윈도우 10과 10코어 코어 i9-10900K가 1만 4,336점을 받았고 8코어 코어 i9-11900K는 1만 6,264점을 받았다. 사실 둘 다 2만 2,168점을 받은 AMD 12코어 라이젠 9 5900X과는 상대가 되지 않는다. 그래서 굳이 16코어 라이젠 9 5950X와 비교할 필요가 없었다.

눈길을 끄는 것은 코어 i9-12900K의 긴 파란 막대다. 인텔이 앨더 레이크에서 추구한 하이브리드 설계를 추구하는 것에 여러 가지 말이 많았지만, 12900K는 오랫동안 라이젠의 홈그라운드였던 렌더링 벤치마크에서 AMD의 1, 2위 CPU를 아주 약간이나마 능가해 호사가의 입을 단속한다.

ⓒ IDG

하지만 인텔이 옳다. 모든 CPU 코어와 쓰레드를 다 쓰는 애플리케이션을 사용하는 사람은 그다지 많지 않다. 따라서 시네벤치로 단일 쓰레드 성능을 살펴보는 것도 중요하다. 시네벤치 멀티코어 성능은 라이트룸 클래식 올코어 영상 인코딩이나 사진 내보내기 성능을 알려주고, 시네벤치 R23 단일 쓰레드 성능은 그보다는 오피스나 포토샵 실행에 조금 더 가깝다. 다시 한번 강조하지만, 코어 i9-10900K와 윈도우 11 결과는 없지만, 10세대 제품의 기존 점수는 1,325점, 11세대 제품은 1,640점을 기록한 AMD 라이젠과 비슷한 수준이다.

그러나 인텔 최신 성능 코어는 라이젠 9 5950X보다 성능이 19% 높고, 구형 10세대 칩보다 31%나 나아져 당혹스러울 정도였다. 맥북 프로 M1 맥스와 앨더 레이크를 비교하면 어떨지를 궁금해 하는 이에게 알려주자면, 앨더 레이크가 우세하다. 모바일 칩과 데스크톱 칩을 비교하는 단일 쓰레드 성능 테스트에서 12세대 앨더 레이크 CPU는 애플 최신 M1 칩보다 약 20%나 더 빨랐다. 물론 인텔 제품은 노트북용 칩이 아니었지만, 인텔 12세대 CPU를 탑재한 노트북이 출시되면 충분히 맥북 프로의 경쟁자가 될 것이다.

ⓒ IDG
ⓒ IDG
ⓒ IDG
ⓒ IDG
ⓒ IDG
ⓒ IDG

압축 성능

CPU의 압축 성능은 인기있고 무료인 7-Zip 내부 벤치마크로 측정했다. 벤치마크는 CPU 쓰레드 수를 살펴보고 테스트하면서 자체적으로 여러 번 스풀링을 반복한다. 압축 테스트에서는 코어를 전부 사용하는 경우 압축 성능에서 24%, 압축 해제 성능에서 35% 더 높은 수치를 보여준 라이젠이 가장 큰 승자다.

7-cpu.com에 따르면, 압축 측면에서는 메모리 지연 시간, 데이터 캐시의 크기 및 TLB(translation look ahead buffer)가 중요한 반면, 압축을 풀 때는 정수 및 분기 예측 실패 패널티(branch misprediction penalties)가 중요하다. 결국, 실제 애플리케이션으로 파일 압축하거나 압축을 푸는 것은 보통 단일 쓰레드에 의존하기 때문에 멀티 쓰레드 성능과의 상관 관계는 이론에 그친다고 할 수 있다.

12세대 코어 i9의 문제는 심지어 압축 성능도 화려하지 않다는 것이다. 실제로 11세대 코어 i9은 윈도우 10 단일 쓰레드 성능에서 7,916으로 약간 더 빠르다. 간단히 요약하면 라이젠 9이 7-zip 테스트에서 압축 성능 우위를 유지했다. 이견은 있을 수 없다. 일부는 초기 DDR5 메모리의 지연 시간과 7-Zip이 특별한 명령을 사용하지 않는 이유도 있겠지만, 어쨌든 압축 테스트에서는 라이젠이 승리했다.

ⓒ IDG

인코딩 성능

CPU 인코딩 테스트는 무료이자 오픈소스인 핸드브레이크 트랜스코더/인코더를 사용하여 무료이자 오픈소스인 4K 티어스 오브 스틸(Tears of Steel) 영상을 H.265 코덱과 1080p 해상도로 변환하는 작업을 수행한다. 라이젠 9은 인코딩을 약 6% 더 빨리 끝내면서 다시 1위를 차지했다. 압도적인 승리는 아니지만 어쨌거나 1등이다. 

ⓒ IDG

합성 테스트

이제 긱벤치 5로 옮겨간다. 이 테스트는 21개의 작은 개별 루프로 구성된 합성 벤치마크인데, 개발자인 프라이메이트 랩스(Primate Labs)는 텍스트 렌더링에서 HDR, 기계 언어 및 암호화 성능에 이르기까지 모든 분야에서 인기있는 애플리케이션을 모델링했다고 한다. 긱벤치는 과거 논란의 중심에 있었지만, 여전히 인기가 높은 벤치마크다. 3D 렌더링과 압축, 인코딩 등에서 순위가 오르내렸던 코어 i9-12900K는 라이젠 9 5950X보다 8%가량 

긱벤치 벤치마크는 과거에 논란의 대상이 되었지만, 오늘날에는 비난받지 않고서 어떤 테스트를 유지하는 것이 어렵다. 하지만 이 제품은 어리석게도 인기가 있고, 당신이 긱벤치 5에 대해 어떻게 생각하든 간에, 사람들은 CPU가 거기에서 어떻게 작동하는지 보고 싶어한다. 3D 렌더링, 압축 및 인코딩을 어느 정도 반복한 결과, 인텔 코어 i9-12900K가 라이젠 9 5950X보다 약 8% 앞서는 것으로 나타났다.

ⓒ IDG
ⓒ IDG

콘텐츠 제작 성능 

전체 점수는 코어 i9-12900K가 라이젠 9 59050X에 비해 4% 더 앞선다. 프로시언 2.0은 이미지 보정(retouch)와 일괄 내보내기라는 2가지 방식으로 결과를 나눈다. 프로시언에 따르면, 이미지 보정에서는 기본적으로 12세대 코어 i9과 라이젠 9이 동점이었다. 주로 라이트룸 클래식 사진 내보내기 성능을 시험한 일괄 처리에서는 코어 i9가 최대 5%까지 앞섰다. 라이트룸 사진 내보내기가 멀티코어 성능에 의존하는 경향이 크기 때문에 마지막 결과에 놀랐다. 라이젠 9의 승리를 예상했기 때문이다. 결과는 그렇지 않았다. 

ⓒ IDG
ⓒ IDG
ⓒ IDG
ⓒ IDG
ⓒ IDG

AI 성능

ⓒ IDG
ⓒ IDG

실생활 성능

비싼 컴퓨터로 인디 영화를 위한 특수 효과를 만들거나 이국적인 여행에서 찍은 사진을 편집하는 것을 상상하기 쉽지만, 세상 일의 대다수는 청구서를 지불하는 지루한 작업과 더 연관이 깊다. 따라서 마이크로소프트 오피스 성능을 UL의 프로시언 2.0 오피스 생산성 테스트를로 측정했다. 어도비와 마찬가지로, 다루는 마이크로소프트 워드, 엑셀, 파워포인트 및 아웃룩에서 고품질 미디어를 많이 다루는 작업을 대상으로 한다. 현실이 지루한 것처럼, 이런 작업이 가장 현실적이라고 할 수 있을 것이다.

오피스나 사무적이고 딱딱한 아웃룩 성능에 열광하는 사람에게는 라이젠보다 16% 빠른 코어 i9-12900K가 유리한 것으로 나타났다. 개별 애플리케이션을 결과에 따르면 12세대 코어 i9는 워드에서 14%, 엑셀에서 19%, 파워포인트에서 10%, 아웃룩에서 19% 더 빠르다. 

ⓒ IDG
ⓒ IDG

게이밍 성능

첫 번째 차트의 수직 축 눈금은 60와트에서 340와트까지를 표시하며, 0은 시간 수평 축을 의미한다. 먼저 모든 코어를 사용하여 시네벤치 R20을 실행했는데, 12900K(빨간색) 막대가 320와트의 총소비량까지 올라간 것을 볼 수 있다. 이것은 거의 라이젠 9 5950X(보라색)의 최대치보다 거의 100와트 더 많다. 약 45% 더 많은 양이다. 일단 모든 코어에 대해 두 칩 모두 시네벤치를 완료하면, 단일 코어나 쓰레드를 사용하여 칩을 실행한다. 이제 115와트 범위의 12세대 코어 i9의 총 시스템 전력을 볼 수 있는데, 라이젠 9가 약 10와트를 더 소비한다. 코어 i9가 테스트를 더 빨리 끝내고 라이젠 9 시스템보다 더 적은 전력을 사용한 것도 확인할 수 있다. 

ⓒ IDG

전력 소비

ⓒ IDG
ⓒ IDG

쓰레드 스케일링

인텔의 11세대부터 12세대까지의 세대별 성능 변화는 경이롭다. 단일 쓰레드를 사용함으로써 코어 i9-12900K는 이전 제품보다 42% 더 빠르며 그 속도에서 조금 올라간다. 8개 쓰레드에서 최신 세대의 코어 i9 최대치를 기록할 때 12세대 코어 i9은 놀랍게도 82% 더 빠르다. 지난 3월 출시된 11세대 칩과 비교하면 완전히 놀라운 변화다. 직접 전력 양을 추적해보지는 않았지만, 이전 11세대 코어 i9-11900K는 시네벤치 R20 실행에 거의 380와트 가까이를 사용한 반면, 12세대 코어 i9는 약 320와트를 사용했다. 따라서, 12세대 코어는 훨씬 적은 전력을 사용하면서도 훨씬 더 빠르다.

ⓒ IDG
ⓒ IDG

인텔 코어 i9-12900K, 결론

조금 의외일지도 모르겠다. 최고의 CPU라는 것은 존재하지 않는다는 것이 결론이다.

그보다는 특정 요구에 가장 적합한 CPU가 곧 최고의 CPU다. 이 긴 벤치마크는 각 요구사항을 6개 부문으로 나눠 각 분야에서 어떤 칩이 승리했는지를 확인했다. 인텔에 좋은 소식은 거의 모든 부문에서 좋은 위치를 차지하고 있다는 것이다.

렌더링 / 하이쓰레드 카운트 
하이 쓰레드 카운트 애플리케이션 및 렌더링에서 코어 i9-12900K는 시네벤치 R23 테스트에서 가까스로 승리라는 결과를 냈지만, 다른 CPU 렌더링 테스트에서는 훨씬 미묘한 결과가 나왔다. 솔직히 90% 렌더링 PC용 칩을 선택한다면, 라이젠 9 5950X가 아마 더 나은 선택일 것이다. 
승리 : 라이젠 9 5950X.

콘텐츠 제작
앞서 살펴본 바와 같이, 콘텐츠 제작은 단순히 쓰레드가 제일 많기만 하면 되는 작업이 아니고, 12세대 코어 i9은 라이젠 9 5950X보다 더 많은 역량을 증명했다. 포토샵, 라이트룸 클래식, 프리미어 프로를 주로 다룬다면 인텔이 더 나은 선택이 될 것이다. 
승리 : 코어 i9-12900K.

실생활
오피스 생산성과 크롬의 벤치마크를 통해 반응성이 더 높은 것이 인텔 CPU라는 점을 확인했다. 물론 결과에 동의하지만 동시에 라이젠 9 5950X도 두 사용례를 모두 잘 처리할 수 있다고도 믿는다. 아웃룩, 워드 실행이나 인터넷 검색이 주 작업인 하이엔드 데스크톱을 조립할 경우 약간 등급을 낮춰도 될 것 같다.
승리: 코어 i9-12900K.

게이밍
실제 게임 플레이에서 차이를 보려면 CPU보다 GPU에 더 집중해야 한다. 그렇지만 게임 테스트에서 인텔 12세대 코어 i9은 분명히 라이젠보다 점수가 높거나 거의 동점이었다. 의심의 여지없이 최고의 게임용 CPU다. 하지만 어느 쪽을 택해도 좋은 선택이다.
승리 : 코어 i9-12900K.

기능
인텔 12세대 플랫폼은 PCIe 5.0 및 DDR5 메모리라는 새로운 세계를 열었다. 또한, 필요한 경우 썬더볼트를 사용할 수 있고 와이파이 6E까지도 통합되어 있다. 물론, DDR5의 가치가 없다고 말하는 이들도 있고 그런 주장에도 이유가 있겠지만, 인텔로서는 충분히 새로운 점이 있다. 
승리 : 코어 i9-12900K.

가치
아직도 AMD 라이젠 9 5950X가 그리 대단한 가치가 없다고 생각하는 사람도 있고, 그 전 해에 2,000달러나 했던 CPU와 성능이 동등한데도 가격이 750달러에 불과한 것을 칭찬하는 사람도 있다. 만약 라이젠 9의 가격이 터무니없이 저렴하다고 생각하는 쪽이라면, 589달러라는 코어 i9-12900K의 공격적인 가격표를 보고 당장 구매하겠다고 소리칠 것이다. 하지만 이 가격은 대량 구매시 적용되는 값이다. 그렇지만 전통적으로 대량구매 가격은 초기 수요가 확정되면 시중가와 몇 달러 차이 나지 않는다. 그렇다. 여기서 가격 대비 가치가 높은 제품은 인텔이다. 그야말로 해가 서쪽에서 뜰 기세다.
승리 : 코어 i9-12900K.

코어 i9-12900K는 위대한 과거 명성을 회복하고 다시 왕좌를 탈환하려고 나섰다. 앨더 레이크는 기다릴 가치가 충분했다. 인텔에게 박수를 보낸다, 브라보. editor@itworld.co.kr 

Best Ultrabooks and Premium Laptops 2021

FLOW-3D 해석용 노트북 선택 가이드

2021년 12월 15일

Best Ultrabooks and Premium Laptops 2021
Best Ultrabooks and Premium Laptops 2021

일반적으로 수치해석을 주 업무로 사용하는 경우 노트북을 사용하는 경우는 그리 많지 않습니다. 그 이유는 CPU 성능을 100%로 사용하는 해석 프로그램의 특성상 발열과 부품의 성능 측면에서 데스크탑이나 HPC의 성능을 따라 가기는 어렵기 때문입니다.

그럼에도 불구하고, 이동 편의성이나 발표,  Demo 등의 업무 필요성이 자주 있는 경우, 또는 계산 시간이 짧은 경량 해석을 주로 하는 경우, 노트북이 주는 이점이 크기 때문에 수치해석용 노트북을 고려하기도 합니다.

보통 수치해석용 컴퓨터를 검토하는 경우 CPU의 Core수나 클럭, 메모리, 그래픽카드 등을 신중하게 검토하게 되는데 모든 것이 예산과 직결되어 있기 때문입니다.  따라서 해석용 컴퓨터 구매 시 어떤 것을 선정 우선순위에 두는지에 따라 사양이 달라지게 됩니다.

해석용으로 노트북을 고려하는 경우, 보통 CPU의 클럭은 비교적 선택 기준이 명확합니다. 메모리 또한 용량에 따라 가격이 정해지기 때문에 이것도 비교적 명확합니다. 나머지 가격에 가장 큰 영향을 주는 것이 그래픽카드인데, 이는 그래픽 카드의 경우 일반적인 게임용이나 포토샵으로 일반적인 이미지 처리 작업을 수행하는 그래픽카드와 3차원 CAD/CAE에 사용되는 업무용 그래픽 카드는 명확하게 분리되어 있고, 이는 가격 측면에서 매우 차이가 많이 납니다.

한가지 안타까운 현실은 최근에 디지털화폐 (비트코인 등)열풍으로 인해 채굴용으로 수요가 급증하여 좋은 그래픽 카드를 적정가격으로 구입하기 어려운 상황입니다.

통상 게임용 그래픽카드는 수치해석의 경우 POST 작업시 문제가 발생하는 경우가 종종 발생하기 때문에 일반적으로 선택 우선 순위에서 충분한 확인을 한 후 구입하는 것이 좋습니다.

FLOW-3D는 OpenGL 드라이버가 만족스럽게 수행되는 최신 그래픽 카드가 적합합니다. 최소한 OpenGL 3.0을 지원하는 것이 좋습니다. FlowSight는 DirectX 11 이상을 지원하는 그래픽 카드에서 가장 잘 작동합니다. 권장 옵션은 NVIDIA의 Quadro K 시리즈와 AMD의 Fire Pro W 시리즈입니다.

특히 엔비디아 쿼드로(NVIDIA Quadro)는 엔비디아가 개발한 전문가 용도(워크스테이션)의 그래픽 카드입니다. 일반적으로 지포스 그래픽 카드가 게이밍에 초점이 맞춰져 있지만, 쿼드로는 다양한 산업 분야의 전문가가 필요로 하는 영역에 광범위한 용도로 사용되고 있습니다. 주로 산업계의 그래픽 디자인 분야, 영상 콘텐츠 제작 분야, 엔지니어링 설계 분야, 과학 분야, 의료 분석 분야 등의 전문가 작업용으로 사용되고 있습니다. 따라서 일반적인 소비자를 대상으로 하는 지포스 그래픽 카드와는 다르계 산업계에 포커스 되어 있으며 가격이 매우 비싸서 도입시 예산을 고려해야 합니다.

‘코어 i7 vs. 코어 i9’ 나에게 맞는 고성능 노트북 CP

2021.06.14

고성능 노트북을 구매할 때는 코어 i7과 코어 i9 사이에서 선택의 갈림길에 서게 된다. 코어 i7 CPU도 강력하지만 코어 i9는 최고의 성능을 위해 만들어진 CPU이며 보통 그에 상응하는 높은 가격대로 판매된다.

CPU에 초점을 둔다면 관건은 성능이다. 성능을 좌우하는 두 가지 주요소는 CPU의 동작 클록 속도(MHz), 그리고 탑재된 연산 코어의 수다. 그러나 노트북에서 한 가지 중요한 제약 요소는 냉각이다. 냉각이 제대로 되지 않으면 고성능도 쓸모가 없다. 가장 적합한 노트북 CPU를 결정하는 데 도움이 되도록 인텔의 지난 3개 세대 CPU의 코어 i7과 i9에 대한 정보를 모았다. 최신 세대부터 시작해 역순으로 살펴보자.

11세대: 코어 i9 vs. 코어 i7

인텔의 11세대 타이거 레이크(Tiger Lake) H는 한 가지 큰 이정표를 달성했다. 인텔이 2015년부터 H급 CPU에 사용해 온 14nm 공정을 마침내 최신 10nm 슈퍼핀(SuperFin) 공정으로 바꾼 것이다. 오랫동안 기다려온 변화다.

인텔이 자랑할 만한 10nm 고성능 칩을 내놓자 타이거 레이크 H를 장착한 노트북도 속속 발표됐다. 얇고 가볍고 예상외로 가격도 저렴한 에이서 프레데터 트라이톤(Acer Predator Triton) 300 SE를 포함해 일부는 벌써 매장에 출시됐다. 모든 타이거 레이크 H 칩이 8코어 CPU라는 점도 달라진 부분이다. 이전 세대의 경우 같은 제품군 내에서 코어 수에 차이를 둬 성능 기대치를 구분했다.

클록 차이도 크지 않다. 코어 i7-11800H의 최대 클록은 4.6GHz, 코어 i9-11980HK는 5GHz로, 클록 속도 증가폭은 약 8.6% 차이다. 나쁘지 않은 수치지만 둘 다 8코어 CPU임을 고려하면 대부분의 사용자에게 코어 i9는 큰 매력은 없다.

다만 코어 i9에 유리한 부분을 하나 더 꼽자면 코어 i9-11980HK가 65W의 열설계전력(TDP)을 옵션으로 제공한다는 점이다. 높은 TDP는 최상위 코어 i9에만 제공되는데, 이는 전력 및 냉각 요구사항을 충족하는 노트북에서는 코어 i7 버전보다 더 높은 지속 클록 속도를 제공할 수 있음을 의미한다.

대신 이런 노트북은 두껍고 크기도 클 가능성이 높다. 따라서 두 개의 얇은 랩톱 중에서(하나는 코어 i9, 하나는 코어 i7) 고민하는 사람에겐 열 및 전력 측면의 여유분은 두께와 크기를 희생할 만큼의 가치는 없을 것이다.

*11세대의 승자: 대부분의 사용자에게 코어 i7

10세대: 코어 i9 vs. 코어 i7

인텔은 10세대 코멧 레이크(Comet Lake) H 제품군에서 14nm를 고수했다. 그 대신 코어 i9 CPU 외에 코어 i7에도 8코어 CPU를 도입, 사용자가 비싼 최상위 CPU를 사지 않고도 더 뛰어난 성능을 누릴 수 있게 했다.

11세대 노트북이 나오기 시작했지만 10세대 CPU 제품 중에서도 아직 괜찮은 제품이 많다. 예를 들어 MSI GE76 게이밍 노트북은 빠른 CPU와 고성능 155W GPU를 탑재했고, 전면 모서리에는 RGB 라이트가 달려 있다.

11세대 칩과 마찬가지로 코어와 클록 속도의 차이가 크지 않으므로 대부분의 사용자에게 코어 i7과 코어 i9 간의 차이는 미미하다. 코어 i9-10980HK의 최대 부스트 클록은 5.3GHz, 코어 i7-10870H는 5GHz로, 두 칩의 차이는 약 6%다. PC를 최대 한계까지 사용해야 하는 경우가 아니라면 더 비싼 비용을 들여 10세대 코어 i9를 구매할 이유가 없다.

*10세대 승자: 대부분의 사용자에게 코어 i7

9세대: 코어 i9 대 코어 i7

인텔은 9세대 커피 레이크 리프레시(Coffee Lake Refresh) 노트북 H급 CPU에서 14nm 공정을 계속 유지했다. 코어 i9는 더 높은 클록 속도(최대 5GHz)를 제공하며 8개의 CPU 코어를 탑재했다. 물론 이 칩은 2년 전에 출시됐지만 인텔이 설계를 도운 XPG 제니아(Xenia) 15 등 아직 괜찮은 게이밍 노트북이 있다. 얇고 가볍고 빠르며 엔비디아 RTX GPU를 내장했다.

8코어 4.8GHz 코어 i9-9880HK와 4.6GHz 6코어 코어 i7-9850의 클록 속도 차이는 약 4%로, 실제 사용 시 유의미한 차이로 이어지는 경우는 극소수다. 두 CPU 모두 기업용 노트북에 많이 사용됐다. 대부분의 소비자용 노트북에는 8코어 5GHz 코어 i9-9880HK와 6코어 4.5GHz 코어 i7-9750H가 탑재됐다. 이 두 CPU의 클록 차이는 약 11%로, 이 정도면 유의미한 차이지만 마찬가지로 대부분의 경우 실제로 체감하기는 어렵다.

그러나 코어 수의 차이는 멀티 스레드 애플리케이션에서 큰 체감 효과로 이어지는 경우가 많다. 3D 모델링 테스트인 씨네벤치(Cinebench) R20에서 코어 i9-9980HK를 탑재한 구형 XPS 15의 점수는 코어 i7-9750H를 탑재한 게이밍 노트북보다 42% 더 높았다. 8코어 코어 i9의 발열을 심화하는 무거운 부하에서는 성능 차이가 약 7%로 줄어들었다. 여기에는 노트북의 설계가 큰 영향을 미칠 것이다. 어쨌든 일부 상황에서는 8코어가 6코어보다 유리하다.

그래픽 카드

AMD FirePro Naver Shopping 검색 결과

2021-12-15 기준

현재 NVIDIA Quadro pro graphic card : 네이버 쇼핑 (naver.com)

코어가 많은 그래픽카드의 경우 가격이 상상 이상으로 높습니다. 빠르면 빠를수록 좋겠지만 어디까지나 예산에 맞춰 구매를 해야 하는 현실을 감안할 수 밖에 없는 것 같습니다.

한가지 유의할 점은 엔비디아의 GTX 게이밍 하드웨어는 모델에 따라 다르기는 하지만, 볼륨 렌더링의 속도가 느리거나 오동작 등 몇 가지 제한 사항이 있습니다. 일반적으로 노트북에 내장된 통합 그래픽 카드보다는 개별 그래픽 카드를 강력하게 추천합니다. 최소한 그래픽 메모리는 512MB 이상이어야 하고 1GB이상을 권장합니다.


2021-12-15 현재 그래픽카드의 성능 순위는 위와 다음과 같습니다.
출처: https://www.videocardbenchmark.net/high_end_gpus.html

주요 Notebook

출시된 모든 그래픽 카드가 노트북용으로 장착되어 출시되지는 않기 때문에, 현재 오픈마켓 검색서비스를 제공하는 네이버에서 Lenovo Quadro 그래픽카드를 사용하는 노트북을 검색하면 아래와 같습니다. 검색 시점에 따라 상위 그래픽카드를 장착한 노트북의 대략적인 가격을 볼 수 있을 것입니다.

<검색 방법>
네이버 쇼핑 검색 키워드 : 컴퓨터 제조사 + 그래픽카드 모델 + NoteBook 형태로 검색
Lenovo quadro notebook or HP quadro notebook 또는 Lenovo firepro notebook or HP firepro notebook


( 2021-12-15기준)

대부분 검색 시점에 따라 최신 CPU와 최신 그래픽카드를 선택하여 검색을 하면 예산에 적당한 노트북을 자신에게 맞는 최상의 노트북을 어렵지 않게 선택할 수 있습니다.

(주)에스티아이씨앤디 솔루션사업부

EVGA 지포스 RTX 2060 KO 같은 현대적인 그래픽카드는 여러 디스플레이를 동시에 연결할 수 있다. ⓒ BRAD CHACOS/IDG

FLOW-3D POST, 그래픽 카드, 멀티모니터

좋은 하드웨어는 향상된 FLOW-3D POST 경험을 제공

FLOW Science, inc의 최첨단 POST Processor인 FLOW-3D POST를 최대한 활용하려면 좋은 하드웨어가 있어야 합니다. 이 블로그에서 소프트웨어 엔지니어링의 GUI 개발자/관리자인 Stephen Sanchez는 이러한 하드웨어 권장 사항에 따라 최적의 FLOW-3D POST 경험을 얻을 수 있는 방법에 대해 정보를 제공 합니다.

고품질 그래픽 하드웨어

최소 3GB의 VRAM 이 있는 그래픽 카드로 시작하는 것이 좋습니다 . 이것은 많은 볼륨 렌더링을 수행할 경우 특히 중요합니다. 볼륨 렌더링은 FLOW-3D POST 의 고급 기능으로 iso-surface가 아닌 유체 도메인 전체에서 변수의 세부 사항을 시각화합니다. 이 기능은 매우 통찰력 있지만 후 처리 중에 효과적으로 사용하려면 좋은 하드웨어가 필요합니다.

다음으로 Intel 통합 그래픽을 기본 그래픽 하드웨어로 사용해서는 안됩니다. 인텔 통합 그래픽은 전용 그래픽 하드웨어가 있는 랩톱에서도 대부분의 랩톱에서 일반적입니다(자세한 내용은 아래 참조). 

대부분의 FLOW-3D POST 기능은 이 구성에서 작동하지 않으므로 Intel 통합 그래픽을 지원하지 않습니다. 

FLOW-3D POST 는 NVIDIA 그래픽 카드 와 함께 사용할 때 가장 잘 수행됩니다. FLOW-3D POST 가 잘 작동하는 것으로 확인되었으므로 Maxwell 아키텍처 제품군 이상의 NVIDIA 그래픽 하드웨어를 적극 권장 합니다. 

NVIDIA Quadro 카드는 가장 안정적인 것으로 입증되었습니다. 고급 AMD 카드도 작동해야 하지만 NVIDIA 하드웨어 및 드라이버만큼 안정적이지 않다는 사실을 발견 했으므로 항상 AMD보다 NVIDIA를 권장합니다.

Nvidia 그래픽 카드

노트북의 듀얼 그래픽 카드 – 간단하지만 숨겨진 솔루션

이제 많은 노트북에 NVIDIA 그래픽 카드와 Intel 통합 그래픽 간에 전환 할 수 있는 기능이 있습니다. NVIDIA 카드로 FLOW-3D POST 가 실행되고 있는지 확인하는 것이 중요합니다 . NVIDIA 제어판을 통해 NVIDIA 카드로 노트북을 강제로 실행할 수 있습니다.

그래픽 카드를 Nvidia로 전환

비디오 드라이버 업데이트

비디오 드라이버가 업데이트 되었는지 확인하는 것이 좋습니다. FLOW-3D POST 에서 비디오 드라이버를 업데이트하여 쉽게 해결할 수 있는 아티팩트 및 디스플레이 문제에 대한 보고가 있었습니다 . 비디오 드라이버를 최신 상태로 유지하는 것은 이러한 문제를 방지하는 좋은 방법입니다.

RAM, RAM, RAM!

메모리가 충분하지 않으면 시뮬레이션 후 처리가 불가능할뿐만 아니라 메모리 요구 사항을 인식하는 것이 중요합니다. 최대 10 배의 성능 저하로 이어질 수 있습니다! FLOW-3D POST 에 필요한 RAM 양은 여러 요소, 특히 시뮬레이션 크기에 따라 다릅니다. 사용자에게 최대한의 유연성을 제공하기 위해 메시의 셀 수에 따라 다음과 같은 RAM 권장 사항이 있습니다.

  • 초대형 (2 억 개 이상의 셀) : 최소 128GB
  • 대용량 (6 천 ~ 1 억 5 천만 셀) : 64-128GB
  • 중간 (3 천만 ~ 6 천만 셀) : 32-64GB
  • 소형 (3,000 만 셀 이하) : 최소 32GB

FLOW-3D POST 는 메모리 집약적 일 수 있습니다. 실행할 시뮬레이션 크기에 대한 대략적인 아이디어가 있는 경우, 이 지침을 가능한 한 잘 따르는 것이 좋습니다. 즉, 유연성을 극대화하고 가장 원활한 FLOW-3D POST 경험을 보장하기 위해 문제 크기에 관계없이 가능한 한 많은 RAM을 확보하는 것이 좋습니다.


그래픽 카드를 업그레이드 교체 설치하는 방법

그래픽 카드를 업그레이드하는 것은 성능 향상을 위한 좋은 방법이다. 그래픽 카드 업그레이드를 통해 시각적으로 고사양을 요구하는 POST 작업을 쉽게 소화할 수 있는 컴퓨터로 진화할 수 있다. 

업그레이드를 위한 그래픽 카드 구매시 고려 사항, 기존 PC에 적합한가? 

원하는 그래픽 카드를 결정하는 것은 복잡하고 미묘한 문제다. AMD와 엔비디아는 200달러 미만에서부터 최대 1,500달러에 이르는 지포스(GeForce) RTX 3090에 이르기까지 거의 모든 예산에 대한 선택지를 제공하기 때문이다.

카드의 소음, 발열, 전력 소비 등과 같은 사항을 고려할 수 있겠지만, 일반적으로는 비용 대비 가장 큰 효과를 제공하는 그래픽 카드를 원한다.

컴퓨터가 새 그래픽 카드를 지원하는 적절한 하드웨어인지 확인한다. 

사용자가 겪는 가장 일반적인 문제는 부적절한 파워 서플라이(power supply)다. 충분한 전력을 공급할 수 없거나 사용 가능한 PCI-E 전원 커넥터가 충분하지 않을 수 있다. 필자의 경험상 파워 서플라이는 적어도 제조업체에서 권장하는 파워 서플라이의 요구 사항을 충족해야 한다. 예를 들어, 350W를 소비하는 지포스 GTX 3090을 구입했다면 8핀 전원 커넥터 한 쌍과 함께 엔비디아에서 제안한 최소 750W의 전력 공급 장치를 갖춰야 한다. 

현재 파워 서플라이가 얼마나 많은 전력을 제공하는지 알아보려면 PC 본체를 열고 모든 파워 서플라이에 기본 정보가 나열된 표준 식별 스티커를 확인하면 된다. 또한 사용 가능한 6핀 및 8핀 PCI-E 커넥터의 수를 확인할 수 있다. 

ⓒ Thomas Ryan 파워서플라이
ⓒ Thomas Ryan 파워서플라이

마지막으로 본체 내부에 새 그래픽 카드를 넣을 충분한 공간이 있는지 확인한다. 일부 고급 그래픽 카드는 길이가 상당히 길어 30Cm 이상일 수 있으며, 확장 슬롯이 2개 또는 3개가 될 수 있다. 해당 그래픽 카드의 실제 크기는 제조업체 웹사이트에서 찾을 수 있다. 

여기까지 해결했다면 이제 본격적으로 설치 작업에 착수한다. 


생각보다 간단한 그래픽 카드 설치 작업

그래픽 카드 설치에는 새 그래픽 카드, 컴퓨터, 그리고 십자 드라이버 3가지만 있으면 된다. 설치하기 전 PC를 끄고 전원 플러그를 뽑는다. 

기존 GPU를 제거해야 하는 경우가 아니면, 먼저 프로세서의 방열판에 가장 가까운 긴 PCI-E x16 슬롯을 찾아야 한다. 이 슬롯은 메인보드의 첫 번째 또는 두 번째 확장 슬롯이다. 

이 슬롯에 접근을 차단하는 느슨한 전선이 없는지 확인한다. 기존 그래픽 카드를 교체하는 경우, 연결된 케이블을 모두 분리하고, PC 본체 후면 내부에 고정 브래킷에서 나사를 제거한 다음, 카드를 제거한다. 대부분의 메인보드에는 그래픽 카드를 제자리에 고정하는 PCI-E 슬롯 끝에 작은 플라스틱 걸쇠(latch)가 있다. 이 걸쇠를 눌러 이전 그래픽 카드의 잠금을 해제하고 분리한다.

ⓒ Thomas Ryan PCI-E x16 슬롯에 설치
ⓒ Thomas Ryan PCI-E x16 슬롯에 설치

이제 새 그래픽 카드를 개방형 PCI-E x16 슬롯에 설치할 수 있다. 카드를 슬롯에 완전히 삽입한 다음, PCI-E 슬롯 끝에 있는 플라스틱 걸쇠를 눌러 제자리에 고정한다. 그런 다음 나사를 사용해 그래픽 카드의 금속 고정 브래킷을 PC 본체에 고정한다. 덮개 브래킷 또는 이전 그래픽 카드를 고정했던 나사를 재사용할 수 있다. 

ⓒ Thomas Ryan 그래픽 카드에는 추가 전원 커넥터 연결
ⓒ Thomas Ryan 그래픽 카드에는 추가 전원 커넥터 연결

대부분의 게임용 그래픽 카드에는 추가 전원 커넥터가 필요하다. 추가 전원이 필요한 경우, 해당 PCI-E 전원 케이블을 연결했는지 확인한다. 전원이 제대로 공급되지 않으면 그래픽 카드가 제대로 작동하지 않는다. 이 PCI-E 전원 케이블을 연결하지 않으면 PC 자체가 부팅되지 않을 수 있다.  

그래픽 카드를 고정하고 난 후, 전원을 켠 상태에서 본체 측면 패널을 제자리로 밀어넣고 디스플레이 케이블을 새 그래픽 카드에 연결해 작업을 완료한다. 이제 컴퓨터를 켠다. 

이제 그래픽 카드의 소프트웨어를 업그레이드할 단계가 왔다. 

새 그래픽 카드가 이전 카드와 동일한 브랜드일 경우에는 절차가 간단하다. 제조업체의 웹사이트로 이동해 운영체제에 맞는 최신 드라이버 패키지를 다운로드한다. 그래픽 드라이버는 일반적으로 약 500MB로, 상당히 크다. 인터넷 연결 속도에 따라 다운로드하는 데 시간이 걸릴 수도 있다. 드라이버를 설치하고 컴퓨터를 다시 시작하면 이제 새 그래픽 카드가 제공하는 부드럽고 매끄러운 프레임 속도를 즐길 수 있다.
  
그래픽 카드 제조업체가 바뀐 경우(인털에서 AMD로, 혹은 AMD에서 인텔로), 새 그래픽 카드용 드라이버를 설치하기 전에 이전 그래픽 드라이버를 제거하고 컴퓨터를 다시 시작해야 한다. 이전 드라이버를 제거하지 않으면 새 드라이버와 충돌할 수 있다. 

editor@itworld.co.kr 기사 일부 발췌 인용

그래픽 카드 GPU 온도 확인하는 방법

그래픽 카드 온도 확인은 아주 쉽다. 윈도우에서 바로 온도를 확인할 수 있는 내장 도구도 추가됐다. 또한, 무료 GPU 모니터링 도구가 많이 있고 그중 대다수가 온도를 측정해준다. 조금 더 자세히 알아보자.

ⓒ MARK HACHMAN / IDG 그래픽카드 온도 확인
ⓒ MARK HACHMAN / IDG 그래픽카드 온도 확인

마이크로소프트가 윈도우 10 2020년 5월 업데이트에서 GPU 온도 모니터링 툴을 작업 관리자에 추가했다. 무려 24년이나 걸렸다.

Ctrl+Shift+Esc를 열어 작업 관리자 대화창을 열거나 Ctrl+Alt+Delete에서 ‘작업 관리자’를 선택하거나 윈도우 시작 메뉴 아이콘을 오른쪽 클릭해서 ‘작업 관리자’를 선택한다. 여기에서 ‘성능’ 탭으로 들어가면 왼쪽에 GPU를 확인할 수 있을 것이다. 윈도우 10 2020년 5월 업데이트 혹은 그 이후 버전의 윈도우가 설치되어 있을 때만 사용할 수 있는 기능이다.

하지만 이 기능은 매우 단순하다. 시간 흐름에 따른 온도 변화를 추적하지 않고, 현재의 온도만을 보여준다. 그리고 업무를 하거나 오버클럭 조정 중에 작업 관리자를 여는 것도 귀찮을 수 있다. 마침내 윈도우에 GPU 온도를 확인할 수 있는 기능이 들어간 것은 환영하지만, 뒤이어 설명할 서드파티 도구가 훨씬 더 나은 GPU 온도 확인 옵션을 제공한다.

AMD 라데온 그래픽 카드 사용자가 라데온 세팅(Radeon Setting) 앱을 최신 버전으로 유지하고 있다면 방법은 쉽다. 2017년 AMD는 시각 설정을 변경할 수 있는 라데온 오버레이(Radeon Overlay)를 출시했다. 여기에도 GPU 온도와 다른 중요한 정보를 확인할 수 있는 성능 모니터 기능이 있다.

프로그램을 활성화하려면 Alt+R 키를 눌러 라데온 오버레이를 불러온다. 성능 모니터링 섹션에서 원하는 탭을 선택한다. Ctrl+Shift + 0을 눌러서 성능 모니터링 도구 설정을 단독으로 불러올 수 있다.

라데온 세팅 앱에서 오버클럭 도구인 와트맨(Wattman)으로 이동해 GPU 온도를 확인할 수 있다. 윈도우 바탕 화면을 우클릭하고, 라데온 설정을 선택한 후 게이밍(Gaming) > 글로벌 세팅(Global Setting) > 글로벌 와트맨(Global Wattman) 항목으로 이동한다. 도구를 사용해 지나친 오버클럭으로 그래픽 카드를 날려버리지 않겠다고 서약한 후에는 와트맨에 액세스하고 GPU 온도, 그리고 그래프 형태로 된 핵심적 통계 수치를 볼 수 있다. 여기까지가 전부다.

라데온 사용자가 아닌 사람도 많을 것이다. 스팀의 하드웨어 설문 조사는 전체 응답자 PC 중 75%가 엔비디아 지포스 그래픽 카드를 탑재했다는 결과를 발표했다. 그리고 지포스 익스피리언스 소프트웨어는 GPU 온도 확인 기능을 제공하지 않아서 서드파티 소프트웨어의 손을 빌려야 한다.

그래픽 카드 제조 업체는 보통 GPU 오버 클럭을 위한 특수한 소프트웨어를 제공한다. 이 도구에는 라데온 오버레이처럼 가장 중요한 측정을 실행할 때 OSD(On-Screen Display)를 지속하는 옵션 등이 있다. 여러 종류 중에서 가장 추천하는 것은 다재다능함을 갖춘 MSI의 애프터버너(Afterburner) 도구다. 이 제품은 오랫동안 인기를 얻었는데 엔비디아 지포스, AMD 라데온 그래픽 카드 두 제품 모두에서 잘 작동하고, 반길 만한 다른 기능도 더했다.

IDG HWInfo는 언제나 누구에게나 적합한 모니터링 프로그램
IDG HWInfo는 언제나 누구에게나 적합한 모니터링 프로그램

GPU 온도에 전혀 관심이 없다면? 그렇다면 시스템의 온도 센서를 보여주는 모니터링 소프트웨어를 설치하면 편리할 것이다. HWInfo는 언제나 누구에게나 적합한 모니터링 프로그램으로, PC의 모든 부품의 가상 스냅샷을 보여준다. 스피드팬(SpeedFan) 과 오픈 하드웨어 모니터(Open Hardware Monitor)도 신뢰할 만한 서드파티 앱이다.

‘착한’ GPU 온도는 몇 도?

이제 그래픽 카드를 모니터링하는 소프트웨어를 갖췄다. 하지만 화면을 채우는 숫자는 맥락이 없이는 아무것도 아니다. 그래픽 카드 온도는 어디까지 괜찮은 것일까?

쉬운 대답은 없다. 제품마다 다르다. 이럴 때는 구글이 친구가 된다. 대다수 칩은 섭씨 90도 중반에도 작동하고, 게이밍 노트북에서도 90도까지 온도가 올라가는 경우가 흔히 있다. 그러나 일반 데스크톱 PC 온도가 90도 이상으로 올라간다면 구조 신호나 다름없다. 공기 흐름이 원활한 GPU 1대 시스템에서는 80도 이상 올라가면 위험하다. 팬이 여러 개 달린 커스텀 그래픽 카드는 무거운 워크로드 하에서도 60~70도가 적당하고, 수냉쿨러가 달린 GPU라면 온도가 더 낮아야 할 것이다.

그래픽 카드가 최근 5년 안에 생산된 제품이고 90도 이상으로 뜨거워진다면, 또는 최근 몇 주간 온도가 급격히 상승했다면 다음의 냉각 방법을 고려해보자.


그래픽 카드 온도 낮추는 법

그래픽 카드 온도가 높아졌을 때 하드웨어 업그레이드에 돈을 들이지 않고 개선하지 않기란 어렵다. 그러나 돈을 쏟아붓기 전에 정말 그래야 하는지 필요성을 점검해 보자. 다시 한번 강조하지만 그래픽 카드는 뜨거운 온도를 버틸 수 있도록 설계되어 있다. PC가 무거운 게임이나 영상 편집 중에 강제 종료되는 경우가 아니라면 아마도 걱정할 필요가 없을 것이다.

우선, 시스템의 케이블을 깨끗하게 정리해 GPU 주변의 공기가 원활하게 순환되는지 확인하라. 케이블이 깔끔하게 정리됐다면 케이스에 팬을 추가하는 것도 고려한다. 모든 PC는 최적의 성능을 위해 공기를 빨아들이고 내보내는 팬이 여럿 달려 있는데, POST PC라면 팬은 더 많아야 한다. 저렴한 팬은 10달러부터 구입할 수 있고, RGB 조명이 붙은 화려한 제품은 조금 더 가격이 높다.

마지막으로, GPU와 히트싱크의 써멀 페이스트가 오래되어 말라 있다면 효율이 떨어질 수 있다. 특히 오래된 그래픽 카드라면 더더욱 그렇다. 그리고 아주 드문 경우지만 품질이 좋지 않은 써멀 페이스트가 발라져서 출시되는 경우도 있다. 다른 방법이 모두 효과가 없다면 써멀 페이스트를 다시 바르는 것을 시도해보자. 그러나 과정이 매우 어려울 수 있고 카드마다 조금씩 다르고, 잘못 손댈 경우 사용자 보증 기한의 보호를 받을 수 없게 된다. 

온도를 확실하게 낮추려면 수랭 쿨러를 위한 쿨링 시스템을 고려한다. 대다수 사용자에게는 지나친 모험이지만 대부분 수냉쿨러는 발열과 노이즈 감소 효과가 확실하고 공기 냉각에 있어 병목 현상도 없다.


“업무 효율 향상의 기본” 멀티 모니터 구축 가이드

듀얼 모니터를 사용하면 업무 생산성이 높아진다는 연구 결과가 있지만, 모니터가 많을수록 생산성이 높아지는지 여부에 대해서는 아직 이렇다 할 근거는 없다. 그러나 업무 생산성을 생각하지 않더라도 모니터를 여러 대(3대~6대까지) 사용하는 것은 멋진 일이며, 많은 화면을 봐야 하는 엔지니어는 정말 필요할지도 모른다.

모니터를 세로로 세워두면 긴 문서를 볼 때 스크롤을 적게 해도 된다는 장점이 있다. 멀티 디스플레이 환경을 구축하기 위해 고려해야 할 모든 것들을 살펴보겠다.

멀티 모니터 구축 가이드(www.itworld.co.kr)
멀티 모니터 구축 가이드(www.itworld.co.kr)

1단계 : 그래픽 카드 확인하기

보조 모니터를 구입하기 전에 컴퓨터가 물리적으로 이 모든 모니터들을 감당할 수 있을지 점검해 봐야 한다. 가장 쉬운 방법은 PC의 뒷면을 보고, 그래픽 포트(DVI, HDMI, 디스플레이포트, VGA 등)가 몇 개나 있는지 확인하는 것이다.

별도의 그래픽 카드가 없다면 포트를 2개밖에 발견하지 못할 것이다. 그래픽이 통합된 대부분의 마더보드는 모니터 2개 밖에 설치하지 못한다. 별도의 그래픽 카드가 있다면, 마더보드의 포트를 제외하고 최소 3개의 포트를 발견할 수 있을 것이다.

팁 : 마더보드와 별도 그래픽 카드의 포트를 모두 이용해서 멀티 모니터를 설치할 수도 있지만, 이 경우 성능 저하와 모니터끼리의 속도 차이가 발생할 것이다. 그래도 이렇게 하고 싶다면, PC의 BIOS에서 Configuration > Video > Integrated graphics 로 진입한 다음, ‘always enable’로 설정한다.

그러나 별도의 그래픽 카드에 3개 이상의 포트가 있다고 해서 이것을 모두 동시에 사용할 수 있다는 의미는 아니다. 예를 들어서 구형 엔비디아 카드는 포트가 2개 이상이어도 하나의 카드에 모니터를 2개 이상 연결할 수 없다. 자신의 그래픽 카드가 멀티 모니터를 지원하는지 판단하는 가장 좋은 방법은 그래픽 카드 모델명을 찾아서 원하는 모니터 개수와 함께 검색하는 것이다. 예를 들어, ‘엔비디아 GTX 1660 모니터 4대’라고 검색하면 된다.

EVGA 지포스 RTX 2060 KO 같은 현대적인 그래픽카드는 여러 디스플레이를 동시에 연결할 수 있다. ⓒ BRAD CHACOS/IDG
EVGA 지포스 RTX 2060 KO 같은 현대적인 그래픽카드는 여러 디스플레이를 동시에 연결할 수 있다. ⓒ BRAD CHACOS/IDG

그래픽 카드가 원하는 만큼 충분히 모니터를 지원할 수 있으면 좋지만, 그렇지 않다면 추가 그래픽 카드를 구입해야 한다. 그래픽 카드를 추가로 구입하기 전 타워 안에 충분한 공간(PCI 슬롯)이 있는지, 전원 공급은 충분한지 확인해야 한다.

멀티 모니터용으로만 그래픽 카드를 구입한다면 최신 그래픽 카드 중에서도 저렴한 옵션을 선택하는 것이 좋다. 

아니면 멀티 스트리밍이 지원되는 디스플레이포트를 탑재한 신형 모니터를 사용하는 방법도 있다. 그래픽 카드의 디스플레이포트 1.2에 연결하고, 디스플레이포트 케이블을 사용해 다음 모니터로 연결하는 것이다. 모니터의 크기나 해상도가 같지 않아도 된다. 뷰소닉(ViewSonic)의 VP2468이 이런 제품 중 하나다. 아마존에서 약 210달러에 판매되는 이 24인치 모니터는 디스플레이포트 아웃 외에도 프리미엄 IPS 스크린, 아주 얇은 베젤 등 멀티 모니터 설정에 이상적인 특징을 제공한다.

2단계 : 모니터 선택하기 

그래픽 카드에 대해서 파악했다면 이제 추가 모니터를 구입할 차례다. 사용자에 따라서 기존에 사용하고 있는 모니터, 책상 크기, 추가 모니터 용도 등에 따라서 완벽한 모니터가 달라질 것이다.

필자의 경우, 이미 24인치 모니터 2대를 가지고 있었기 때문에 중앙에 설치할 더 큰 모니터가 필요해서 27인치 모니터를 선택했다. 게임을 하지 않기 때문에 모니터 크기 차이는 상관없었다. 하지만 사용자에 따라서 멀티 모니터로 POST를 하거나 동영상을 보기 위해서는 이러한 구성보다 같은 모니터를 연결하는 것이 더 좋을 것이다.

모니터를 구입하기 전에 PC와 모니터의 포트 호환성을 설펴야 한다. DVI-HDMI 혹은 디스플레이포트-DVI 등 전환해주는 케이블을 이용할 수도 있지만 다소 귀찮다. 그러나 PC나 모니터에 VGA 포트가 있다면, 교체를 권한다. VGA는 아날로그 커넥터이기 때문에 선명도가 떨어진다.

3단계 : PC설정

모니터를 구입하고 나면 PC에 연결하고 PC의 전원을 켠다. 이것으로 모니터 설치가 끝났다. 하지만 완전히 끝난 것은 아니다.

윈도우가 멀티 모니터 환경에서 잘 동작하게 만들어야 하는데, 윈도우 7이나 윈도우 8 사용자라면 바탕화면에서 오른쪽 클릭하고 ‘화면 해상도’를 선택한다. 윈도우 10 사용자라면 ‘디스플레이 설정’을 클릭한다. 그러면 디스플레이를 정렬할 수 있는 창이 나타난다.

ⓒ ITWorld 디스플레이 설정
ⓒ ITWorld 디스플레이 설정

여기서 모니터들이 모두 탐지되는지 확인할 수 있다. ‘식별’을 클릭하면 각 디스플레이에 큰 숫자가 나타난다. 주 모니터(작업 표시줄과 시작 버튼이 나타나는 모니터)로 사용할 모니터에 1번이 나타나야 하는데, 원하는 것을 선택한 다음 아래 여러 디스플레이 설정에서 ‘이 디스플레이를 주 모니터로 만들기’를 클릭한다. 그 다음 ‘다중 디스플레이’ 드롭다운 메뉴에서 복제할 것인지 확장할 것인지를 선택하면 되는데, 대부분의 경우 ‘디스플레이 확장’이 적합하다.

GPU 제어판에서도 다중 모니터를 설정할 수 있다. 바탕화면에서 오른쪽 클릭을 하고 엔비디아, AMD, 인텔 등 그래픽 제조사의 제어판 메뉴를 열어 윈도우와 유사한 방식으로 디스플레이를 설정할 수 있다.

멀티 디스플레이를 구축할 경우에는 같은 모델을 이용하는 것이 해상도나 선명도, 색보정 등의 문제가 발생하지 않아 ‘끊김 없는’ 경험을 할 수 있다.

수치해석 담당자가 궁금한 현재 살 수 있는 최강 성능의 PC 하드웨어

수치해석 업무를 담당하는 엔지니어들은 항상 시간에 쫒기며 산다고 해도 과언은 아니다. 새로운 강력한 컴퓨터를 갖는 것이 항상 소원이 되가는 수치해석 엔지니어에게 유용한 정보를 제공합니다.
아래에 한국 ITWORLD에서 PCWorld의 기사를 번역 게시한 기사를 소개합니다.

현재 살 수 있는 최강 성능의 PC 하드웨어

PCWorld
PC의 장점 가운데 하나는 뛰어난 유연성이다. 다양한 형태와 크기, 제조업체 및 모델을 갖춘 수많은 하드웨어가 있기 때문에 구매자가 아무리 돈이 많더라도 혼선이 생기게 마련이다. 이번 기사에서 AMD의 괴물 같은 스레드리퍼(Threadripper) 칩에서부터 지포스 RTX 2080 Ti에 이르기까지 오늘날 구입할 수 있는 최고 성능의 PC 구성 요소를 소개한다.

Credit: Gordon Mah Ung/IDG

CPU
PC의 핵심은 프로세서다. AMD의 32코어, 64 스레드 라이젠 스레드리퍼 2990WX만큼 강력한 CPU는 없다(아마존 1,750달러). 다만 비즈니스 및 데이터센터 장비는 일반 소비자용보다 더 강력하다.

이 CPU는 인텔 18코어 대표작인 코어 i9-7980XE(아마존 2,000달러)보다 거의 2배 많은 코어와 쓰레드를 갖고 있음에도 200달러 이상 싸다. 인텔의 코어는 개별적으로는 더 빠르지만, 2990WX의 엄청난 코어 수를 제대로 활용할 수 있다면 그 어떤 것도 비교할 수 없다.

최상의 PC 게임 성능을 원한다면 코어 i7-8700K(아마존 350달러)가 가장 적합한 프로세스로, 6코어, 12쓰레드는 3.7GHz와 4.7GHz 사이에서 동작하면서 인텔의 18코어보다 훨씬 더 높은 성능이다.

바로 지금 사용할 수 있는 것을 구매한다면, 첫번째 코어 i7-8086K(이 칩은 창립 40주년을 기념해 만들어졌다)은 싱글 쓰레드 애플리케이션에서 5GHz로 출시된 최초의 인텔 칩이다. 또한 수동으로 오버클럭된 경우, 모든 코어에서 5GHz를 기록하는 것이 확실하다. 그러나 표준 성능은 훨씬 저렴한 8700K와 유사하다. 이 칩은 5만 개만 만들어졌다. 뉴에그, 아마존, 베스트바이에서 425달러에 판매하고 있다.

Credit: Gordon Mah Ung

메인보드
프로세서를 골랐다면 메인보드 유형을 알 수 있다. 스레드리퍼 칩은 AMD의 X399 메인보드와 호환된다. 본지는 MSI MEG X399 크리에이션(Creation)(뉴에그 499달러)으로, 스레드리퍼 2990WX를 검토했다. 이 메인보드는 연결성이 좋으며 스틱 형태의 SSD를 냉각할 M.2 프로저 히트싱크, 견고한 전력 공급 시스템을 자랑한다.

여기에서는 간략하게 정리하고 AMD X399 메인보드에 대한 자세한 내용은 여기에서 확인하라.

Credit: MSI

메모리
인텔의 X99 플랫폼은 64GB RAM 한계를 넘어섰으며 DDR4는 이전보다 더 빠른 메모리를 지원한다. 128GB 키트까지 보장하는 3,200MHz 커세어 도미네이터 플레티넘(Corsair Dominator Platinum) 메모리(아마존 1,750달러), 세계에서 가장 큰 RAM 디스크를 만든 이유는 무엇일까. 적절한 속도를 느끼고 싶다면 벤전스(Vengeance) LPX DDR4의 16GB 키트(아마존 430달러)가 적합하다.

이렇게 많은 RAM을 가진 PC를 가질 적절한 이유가 없다는 점에서 이 가격은 단점이 될 수 있다. 용량이 더 작은 키트나 다른 공급업체의 제품을 선택하더라도 DDR3가 아닌 DDR4 메모리여야 한다. X299 메인보드는 최첨단이다.

Credit: Gordon Mah Ung

그래픽 카드
지금 당장 가장 강력한 그래픽 카드를 구입해야 한다면, 대부분의 게임 사용자는 지포스 GTX 1080Ti 또는 EVGA GTX Ti SC2(아마존 670달러)와 같은 맞춤형 오버클럭킹 버전을 선택할 것이다. 이 제품은 GTX 1080보다 25~35% 더 빠르며 4K 해상도로 60fps를 기록할 수 있는 최초의 저렴한 일반 소비자용 그래픽 카드로, 이미 많은 게임에서 적절하게 호환을 이뤘다.

그러나 조금 시간적 여유가 있다면 지금 이를 살 필요는 없다. 엔비디아는 이미 차세대 지포스 RTX 2080 Ti의 예약 구매 신청을 받고 있다. 이는 전작을 날려버릴 준비가 됐다. 2080 Ti 제품의 리뷰는 아직 나오지 않았지만 9월 20일이면 출시된다. 가능한 한 본지의 리뷰를 읽어 검토하고 사전 예약을 해도 늦지 않다.

Credit: Brad Chacos/IDG

모니터
그래픽카드에 큰 돈을 쓸 계획이라면, 하이엔드 디스플레이도 원할 것이다. 하이엔드 디스플레이의 경우, 기본적으로 G싱크(G-Sync) HDR 디스플레이라는 걸출한 제품이 있다.

에이서 프레데터(Acer Predator) X27, 에이수스(Asus) ROG 스위프트(Swift) PG27UQ(뉴에그 각각 2,000달러) 또한 최대 144Hz로, 고급스러운 27인치 4K 패널이다. 말 그대로 이 패널들은 384개 백라이트 영역과 함께 최대 1,000니트의 밝기로 HDR(High-Dynamic Range) 영상을 지원한다. 비-HDR 콘텐츠 또한 아름답게 보인다. 이 모니터는 어도비RGB(AdobeRGB) 색역의 99%를 차지하고 지싱크는 게임 플레이를 부드럽게 해준다.

Credit: Martyn Williams/IDG

주 스토리지
스토리지는 다양한 옵션을 제공한다. 4TB 삼성 860 EVO(아마존 1,400달러)와 WD 골드(아마존 500달러)는 각각 소비자용 SSD와 HDD 시장에서 최고의 성능을 자랑하는데, 본지의 리뷰에서 최고 점수를 받았다.

삼성의 SSD는 분명히 빠르지만 많은 비용이 든다. WD 골드의 7,200rpm 플래터는 기계식 하드드라이브에서 놀라운 엑세스 속도를 제공한다. 이 제품은 같은 가격 제품대에서는 찾아볼 수 없는 엔터프라이즈급 기능으로 자랑한다.

Credit: Western Digital

급속 스토리지
저장 용량과 상관없이 순수하게 속도가 주요 목표라면 좋은 제품이 있다. 약간의 공간에 대한 대가로, 사용자는 M.2 PCI-e NVMe SSD의 엄청난 전송 속도를 즐길 수 있다. 4TB 삼성 960 프로(뉴에그 1,50달러)는 크리스탈디스크마크(CrystalDiskMark) 리뷰에서 읽기 속도가 3.5GBps를 훨씬 웃도는 가장 빠른 드라이브 가운데 하나다.

이 제품을 부팅 드라이브로 삼으면 지연에 대해 걱정할 필요가 없다. 시간 절약을 위해 아주 많은 비용을 투자하는 것이 부담스럽다면 1TB WD 블랙 3D NVMe(아마존 450달러)를 대신 사용하자.

또한 인텔의 혁신적인 옵테인 900P SSD(뉴에그 600달러)는 삼성이 독차지하는 시장에 타격을 가하고 작은 파일을 많이 읽을 때 엄청난 성능을 자랑하지만 280GB 및 480GB 용량으로만 제공한다.

다른 제품을 찾고자 한다면 본지의 “나에게 맞는” SSD 선택 가이드 2018에서 최고의 SSD를 찾을 수 있을 것이다.

Credit: Samsung

사운드카드
PC의 다른 부분에 엄청난 비용을 지불했다면 최고 수준의 오디오에도 투자할 수 있을 것이다. 크리에이티브 테크놀로지의 사운드블라스트(Sound Blaster)X AE-5(아마존 150달러)는 32비트, 384KHz ESS ES9016K2M SABRE32 Ultra DAC 칩셋을 사용한다. 가격은 기본적으로 고가의 전문 사운드 장치에서 볼 수 있는 DAC 수준이다.

이 제품은 최초의 프리미엄 일반 소비자용 사운드카드로, 5.1 아날로그 서라운드 사운드, 600 옴 헤드셋까지 구동할 수 있는 듀얼 앰프 Xamp, RGB 조명 등을 제공한다.

Credit: Gordon Mah Ung/IDG

전원공급장치
현재 인텔 프로세서와 엔비디아 그래픽카드의 놀라운 전력 효율성으로 인해 대부분의 단일 GPU 시스템은 아마도 600W 이상의 전원공급장치를 필요로 하지 않을 것이다.
그러나 이번 기사는 최상의 제품에 관한 것이기에 최고 전원공급장치를 소개한다. 여러 개의 그래픽 카드를 사용하거나 미래 확장을 위해 공간을 확보하길 원한다면, 이 제품을 사용해도 좋다.

커세어(Corsair) AX1500i(아마존 450달러)는 본질적으로 전력 공급에 있어 모범적이다. 요즘 코인 채굴작업으로 인해 수요가 많아 종종 재고가 없을 수 있다. 이 모듈식 커세어 AX1500i PSU는 최첨단 디지털 제어시스템 덕분에 모든 면에서 완벽한 등급을 자랑한다. 최근 커세어는 한단계 진보한 AX1600i(뉴에그 500달러)도 발표했다.

이번 기사에서 설명한 바와 같이 유사한 장비를 설치하고 하나 또는 2개의 그래픽 카드를 사용할 경우, 좀더 낮은 전원 공급장치를 구입할 수 있다.

editor@itworld.co.kr

FLOW-3D 해석용 컴퓨터 안내 – 2018년 2분기 업데이트

FLOW-3D 수치해석용 컴퓨터 선택 가이드

수치해석을 하는 엔지니어들은 사용하는 컴퓨터의 성능에 무척 민감합니다. 그 이유는 수치해석을 하기 위해 여러 준비단계와 분석 시간들이 필요하지만 당연히 압도적으로 시간을 소모하는 것이 계산 시간이기 때문일 것입니다.

따라서 수치해석용 컴퓨터의 선정을 위해서 단위 시간당 시스템이 처리하는 작업의 수나 처리량, 응답시간, 평균 대기 시간 등의 요소를 복합적으로 검토하여 결정하게 됩니다.

또한 수치해석에 적합한 성능을 가진 컴퓨터를 선별하는 방법으로 CPU 계산 처리속도인 Flops/sec 성능도 중요하지만 수치해석을 수행할 때 방대한 계산 결과를 디스크에 저장하고, 해석결과를 분석할 때는 그래픽 성능도 크게 좌우하기 때문에 SSD 디스크와 그래픽카드에도 관심을 가져야 합니다.

현재 고성능컴퓨터는 장기적인 전망으로 보는 Quantum Computing, DNA-based Computing, Optical Computing 등의 미래의 컴퓨팅 기술과 단기적인 고성능 컴퓨터 기술인  Symmetric -Multi Processing 기술과 MPP(Massively Pallel Processing)기술이 일반화되고 있습니다. (아래 그림 참조)

일반적으로 슈퍼컴퓨터로 불리는 고성능 HPC는 규모가 큰 운영관리시설과 전문인력이 필요하고 매우 고가이기 때문에, 실제 업무를 수행하는 대부분의 기업이나 기관에서는 단일 SMP 컴퓨터를 많이 사용하고 있습니다.

FLOW-3D에 적합한 일반적인 최소 권장사양은 아래 사양을 참고하시면 됩니다.

다만, 가능하면 최신 CPU의 고성능, 저전력 등 최신기술이 반영된 제품을 선택하는 것은 언제나 투자비와 연관되어 있기 때문에 항상 고민의 대상인 것은 틀림없는것 같습니다.

1) Processors

– FLOW-3D는  x86-64 (Intel/AMD) 프로세스를 지원합니다.

CPU는 전반적인 성능에 큰 영향을 미치며, 대부분의 경우 컴퓨터의 가장 중요한 구성 요소입니다. 그러나 데스크탑 프로세서를 구입할 때가되면 인텔과 AMD의 모델 번호와 사양이 어려워 보일 것입니다.
그리고, CPU 성능을 평가하는 방법에 의해 가장 좋은 CPU를 고른다고 해도 보드와, 메모리, 주변 Chip 등 여러가지 조건에 의해 성능이 달라질 수 있기 때문에 성능평가 결과를 기준으로 시스템을 구입할 경우, 단일 CPU나 부품으로 순위가 정해진 자료보다는 시스템 전체를 대상으로 평가한 순위표를 보고 선정하는 지혜가 필요합니다.

부동소숫점 계산을 하는 수치해석과 밀접한 Computer의 연산 성능 벤치마크 방법은 대표적으로 널리 사용되는 아래와 같은 방법이 있습니다.

2) Operating Systems
  • 64-bit Windows 7, Windows 8, Windows 8.1, Windows 10, Windows Server 2008, and Windows Server 2012
  • 64-bit Red Hat Enterprise Linux 6, Red Hat Enterprise Linux 7 and SUSE 11*

Windows 및 Linux에 대한 시뮬레이션 시간은 대등합니다. 사용자가 사용하기 편리한 운영 체제를 선택하면 됩니다.

3) Graphics Support
FLOW-3D는 OpenGL 드라이버가 만족스럽게 수행되는 최신 그래픽 카드가 필요합니다. 최소한 OpenGL 3.0을 지원하는 것이 좋습니다. FlowSight는 DirectX 11 이상을 지원하는 그래픽 카드에서 가장 잘 작동합니다. 권장 옵션은 엔비디아의 쿼드로 K 시리즈와 AMD의 파이어 프로 W 시리즈입니다. 엔비디아의 GTX 게이밍 하드웨어는 볼륨 렌더링의 속도가 느리거나 오동작 등 몇 가지 제한 사항이 있습니다. 일반적으로 노트북에 내장된 통합 그래픽 카드보다는 개별 그래픽 카드를 강력하게 추천합니다. 최소한 그래픽 메모리는 512MB 이상을 권장합니다.
4) Memory and Processor Speed

프로세서 코어 당 최소 2GB의 RAM을 권장합니다. 예를 들어, 두 개의 6 코어 CPU가 있을 경우 워크스테이션의 메모리는 최소 24 GB가 있어야합니다. 필요한 RAM의 양은 해석 대상 문제에 매우 의존적입니다. 큰 도메인 또는 복잡한 형상에서 좋은 해상도를 원하는 시뮬레이션은 필요한 최소한 RAM보다 훨씬 더 많은 RAM이 필요합니다. 메모리 속도는 시뮬레이션 시간에 영향을 적게 받지만 통상적으로 1333MHz 또는 1600 MHz이면 충분합니다.

5) HDD

수치해석은 해석결과 데이터 양이 매우 크기 때문에 읽고 쓰는데 속도면에서 매우 빠른 SSD를 적용하면 성능면에서 큰 도움이 됩니다. 다만 SSD 가격이 비싸서 가성비 측면을 고려하여 적정수준에서 결정이 필요합니다.
그리고 SSD를 선택할 경우에도 SSD 종류 중에서 PCI Express 타입은 매우 빠르지만 가격 또한 매우 고가이므로 예산 범위내에서 선택을 고민해야 합니다.

기존의 물리적인 하드 디스크의 경우, 디스크에 기록된 데이터를 읽기 위해서는 데이터를 읽어내는 헤드(바늘)가 물리적으로 데이터가 기록된 위치까지 이동해야 하므로 이동에 일정한 시간이 소요됩니다. (이러한 시간을 지연시간, 혹은 레이턴시 등으로 부름) 따라서 하드 디스크의 경우 데이터를 읽기 위한 요청이 주어진 뒤에 데이터를 실제로 읽기 까지 일정한 시간이 소요되는데, 이 시간을 일정한 한계(약 10ms)이하로 줄이는 것이 불가능에 가까우며, 데이터가 플래터에 실제 기록된 위치에 따라서 이러한 데이터에의 접근시간 역시 차이가 나게 됩니다.

하지만 HDD의 최대 강점은 가격대비 용량입니다. 현재 상용화되어 판매하는 대용량 HDD는 12TB ~ 15TB가 공급되고 있으며, 이는 데이터 저장이나 백업용으로 가장 좋은 선택이 됩니다.
결론적으로 데이터를 직접 읽고 쓰는 드라이브는 SSD를 사용하고 보관하는 용도의 드라이브는 기존의 HDD를 사용하는 방법이 효과적인 선택이 될 수 있습니다.

수치해석용 컴퓨터의 성능분석 방법 및 권장사양

1. 개요

수치해석을 하는 엔지니어들은 사용하는 컴퓨터의 성능에 무척 민감합니다. 그 이유는 수치해석을 하기 위해 여러 준비단계와 분석 시간들이 필요하지만 당연히 압도적으로 시간을 소모하는 것이 계산 시간이기 때문일 것입니다.

따라서 컴퓨터의 성능 평가를 하기 위해서 기본적으로 검토해야 하는 사항을 살펴보도록 하겠습니다.

1-1시스템 성능의 정의

컴퓨터 시스템의 성능이란 단위 시간당 시스템이 처리하는 작업의 수에 의해 결정되거나 처리량, 응답시간, 평균 대기 시간 등의 요소가 복합적으로 상호작용하여 결정되는 것으로 시스템 총 생산성을 결정하는 요인입니다.

1-2시스템 성능 평가의 정의

  • 시스템(HW+SW)의 성능을 측정하거나 그 성능을 향상시킬 수 있는 방법을 조사하는 작업
  • 작업부하모델(Workload model)로 수행능력을 측정하여 시스템의 성능을 객관적이고 종합적으로 판단하는 것

1-3 목적

  • 선정(Selection) : 컴퓨터 시스템 구매나 선정시 이용.
  • 개선(Improvement) : 시스템 성능 향상이나 운용비용 절감
  • 설계(Design) : 제조, 개발업체들이 제품설계에 활용

2. 벤치마크

비교대상이 되는 여러 컴퓨터에 표준 벤치마크 프로그램을 수행시켜 속도를 비교 검사하여 성능을 측정하는 방법을 의미합니다.

2-1 벤치마크의 종류

SPEC ( Standard Performance Evaluation Corporation ) : 각 분야별 주요 환경을 통해 정수, 부동소수 또는 다수의 CPU에 대한 성능 측정방법

LADDIS : NFS 업체의 비공식 기구로 NFS의 업무 부하 증가에 따른 서버 응답 속도를 측정하는 방법

FLOPS (floating-point operations per second) : 플롭스는 초당 수행할 수 있는 실수 연산(부동소수점)의 횟수를 의미하는 컴퓨터 성능 단위로 1메가 플롭스라면 1초에 백만번의 실수을 처리할 수 있다는 것을 의미함. 플롭스 단위는 일반적으로 컴퓨터의 실수연산(FPU) 성능을 나타낼 때 주로 이용하고 있습니다.

LINPACK(linear programming package) : Single User FORTRAN Benchmark TEST로 공학 및 과학계산을 위한 선형 방정식을 풀고, 정수 및 부동소수점 계산을 수행하여 Cache Performance 측정. 프로그램 크기가 최근에 적용되는 캐시기억장치 크기보다 작아 실제 수행능력을 평가하는데 부족함이 있어서 최근에는 사용자가 실제 사용하는 응용프로그램 환경에서의 수행속도를 측정하기 위해 SPEC,AIM,코너스톤(Khornerstone) 등이 사용되고 있습니다.

Dhrystone : 정수계산 및 레코드와 포인터 조작 등을 위한 연산을 행하고 I/O 작업, 운영체제 호출(Operating system calling) 및 실수 연산은 하지 않음. 원시 프로그램을 시험하고자하는 컴퓨터에서 컴파일 한 후 실행시키므로 하드웨어 개선없이 단지 시험하고자하는 루틴에 해당하는 컴파일러 부분만을 개선하여도 빠른 결과를 얻을 수 있으므로 신뢰도가 떨어집니다.

Whetstone : 주로 부동소수점 처리 성능(Flops)을 평가하는 표준적인 벤치마크(benchmark) 프로그램의 하나로 부동소수점 처리성능을 평가하는 최초의 프로그램으로 정수처리능력을 평가하는 드라이스톤 벤치 프로그램처럼 컴파일러에 의존하여 신뢰도가 떨어집니다.

TPC ( Transaction Processing Performance Council) : OLTP 시스템의 처리성능 평가 기준의 표준 규격을 제정하기 위하여 결성된 비영리단체(1988)에서 제정했습니다.

2-2 전세계 슈퍼컴 현황

전세계에서 가장 빠른 슈퍼컴퓨터(HPC)의 현황은 https://www.top500.org 에서 1년에 2회 발표합니다. 현재까지 발표된 컴퓨터의 순위는 아래와 같습니다. 슈퍼컴은 대용량 데이터처리 또는 수치해석 처럼 대용량 과학기술 계산에 특화되어 있기 때문에 LINPACK 벤치마크 기준을 이용하여 Flops/s 성능을 기준으로 정하고 있습니다.

Top500_2016

3. 내가 사용하는 컴퓨터의 성능 알아보기

3-1 방대한 순위 데이터베이스를 가지고 있는 “퍼포먼스테스트” 프로그램

이 프로그램은 시스템의 PC를 구성하는 각 주요 하드웨어에 부하를 가한 후 이를 토대로 성능을 수치화한 데이터를 사용자로부터 수집하여 데이터베이스를 가지고 있어서 자신의 컴퓨터가 어느정도 수준의 컴퓨터인지 쉽게 알 수 있습니다. 프로그램은 30일간 무료로 사용해볼 수 있는데 성능테스트는 늘 하는 것이 아니고 한번만 해보면 되기 때문에 사용기간은 충분합니다. 다음 사이트 (http://www.passmark.com/) 에서 다운로드 받을 수 있습니다.

이 외에도 게임에 특화된 ‘3D마크(3DMark)” 프로그램이나 하드디스크 성능 분석에 특화된 “HD튠 프로(HD Tune Pro)”나 “크리스탈디스크마크(CrystalDiskMark)” 등이 있습니다.

PerformanceTest8_00PerformanceTest8_01PerformanceTest8_02PerformanceTest8_03PerformanceTest8_04

위 그림은 필자의 일반적인 업무용 노트북 컴퓨터를 대상으로 테스트한 결과로 초록색 Bar는 필자의 컴퓨터 성능을 의미합니다. 일반 사무 업무용으로 꽤 쓸만한 LG i5 gram 노트북으로  계산성능이 고사양이 아니어서 비교 순위는 좀 낮은편에 속한 것을 알 수 있습니다.

그래픽 성능의 경우 내장 그래픽을 사용하는 일반 업무용 노트북의 특성상 최하위에 속한 것을 알 수 있습니다. 그래픽카드의 경우 수치해석 결과를 분석하는 POST 업무는 꽤 많은 시간이 소요되는데, 일반적으로 내장 그래픽을 사용하는 컴퓨터의 경우 속도가 늦거나 프로그램 실행이 안되거나 화면의 일부 색상이나 형상등이 보이지 않는 여러가지 문제들이 발생합니다.

따라서 수치해석 결과분석을 하는 컴퓨터는 반드시 메인보드에 내장된 그래픽칩셉이 아닌 성능좋은 별도의 그래픽카드를 사용하는것을 권장합니다.
계산결과를 읽거나 저장하는 필자의 디스크 성능은 SSD가 기본 장착되어 있어서, 그나마  상위권에 속해 위안을 받았습니다.

3-2 계산용 컴퓨터의 선택

위에서 잠깐 살펴본 것처럼 컴퓨터의 성능이 어느정도 되는지 분석할 수 있는 여러가지 벤치마크 기준과 테스트 프로그램 들이 있습니다.
벤치마크 기준을 통해 수치해석에 적합한 성능을 가진 컴퓨터를 선별하는 Flops/sec 성능도 중요하지만, 방대한 계산 결과를 디스크에 읽고 쓰는 I/O 성능과, 해석결과를 분석할 때 절대적으로 필요한 그래픽 성능은 매우 중요하므로 메모리 디스크인 SSD 디스크와 고성능 그래픽카드에도 관심을 가져야 합니다.