Top 20 Fastest Desktops for 2024

Top 20 Fastest Desktops for 2024

Edit: 2024-11-28

원문 출처: https://www.pcbenchmarks.net/fastest-desktop.html

PositionScoreBL#CPU TypeCPU speed (MHz)#Phys. CPUsOSMotherboardRAMVideo cardDate uploaded
126331.82512517Intel Core Ultra 9 285K36861Windows 11 Pro for Workstations build 26100 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z890 APEX48.7 GBGeForce RTX 50902025-03-27 13:04:55
225231.92667231Intel Core i9-14900KS31881Windows 11 Pro for Workstations build 26100 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z790 APEX ENCORE49.0 GBGeForce RTX 50902025-06-01 19:02:22
325140.32102766Intel Core i9-14900KS31881Windows 11 Pro for Workstations build 26100 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z790 APEX ENCORE49.0 GBGeForce RTX 40902024-05-16 19:37:40
425070.22912009Intel Core Ultra 9 285K36871Windows 11 Professional Edition build 26100 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z890 APEX48.7 GBGeForce RTX 40902025-09-16 06:38:14
525006.12547265Intel Core Ultra 9 285K36861Windows 11 Professional Edition build 26100 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z890 APEX48.7 GBGeForce RTX 40902025-04-11 08:42:11
624725.52460587AMD Ryzen Threadripper 7980X32001Windows 11 Pro for Workstations build 26100 (64-bit)ASUSTeK COMPUTER INC. Pro WS TRX50-SAGE WIFI130.6 GBGeForce RTX 50902025-03-05 20:36:17
724689.82094503Intel Core i9-14900KF31881Windows 11 Pro for Workstations build 26100 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z790 APEX ENCORE49.0 GBGeForce RTX 40902024-05-05 15:30:09
824613.32539005Intel Core Ultra 9 285K36861Windows 11 Professional Edition build 26100 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z890 APEX48.7 GBGeForce RTX 40902025-04-07 19:05:52
924598.32725366Intel Core Ultra 9 285K36861Windows 11 Professional Edition build 22000 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z890 APEX48.6 GBGeForce RTX 40902025-06-27 08:44:08
1024550.71756060Intel Core i9-13900KS31881Windows 10 Home build 19045 (64-bit)Micro-Star International Co., Ltd. MAG Z790 TOMAHAWK WIFI DDR4(MS-7D91)32.5 GBGeForce RTX 40902023-02-27 01:36:21
1124401.73038462Intel Core Ultra 9 285K36861Windows 11 Professional Edition build 26200 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z890 APEX48.7 GBGeForce RTX 40902025-11-08 16:59:04
1224359.62808704Intel Core Ultra 9 285K36861Windows 11 Professional Edition build 22621 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z890 APEX48.7 GBGeForce RTX 40902025-08-02 10:29:04
1324190.32538133Intel Core Ultra 9 285K36861Windows 11 Professional Edition build 26100 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z890 APEX48.7 GBGeForce RTX 40902025-04-07 10:56:35
1424034.13007434Intel Core Ultra 9 285K36871Windows 11 Professional Edition build 26100 (64-bit)ASUSTeK COMPUTER INC. Z890 AYW GAMING WIFI W48.5 GBRadeon RX 7900 XTX2025-10-27 00:37:31
1524008.82086170Intel Core i9-14900KF31871Windows 11 Pro for Workstations build 22631 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z790 APEX ENCORE32.6 GBGeForce RTX 40902024-04-25 01:38:41
1623924.41989560Intel Core i9-13900KS31881Windows 11 Pro for Workstations build 22631 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z790 APEX ENCORE32.6 GBGeForce RTX 40902024-01-06 11:51:42
1723682.33059816Intel Core Ultra 9 285K36871Windows 11 Professional Edition build 26100 (64-bit)Gigabyte Technology Co., Ltd. Z890 AERO G48.6 GBRadeon RX 7900 XTX2025-11-17 01:14:07
1823223.22424595AMD Ryzen Threadripper 7980X31951Windows 11 Professional Edition build 26100 (64-bit)ASUSTeK COMPUTER INC. Pro WS TRX50-SAGE WIFI130.6 GBGeForce RTX 50802025-02-18 11:51:03
1923193.02424914AMD Ryzen Threadripper 7980X31961Windows 11 Professional Edition build 26100 (64-bit)ASUSTeK COMPUTER INC. Pro WS TRX50-SAGE WIFI130.6 GBGeForce RTX 50802025-02-18 14:23:51
2023117.01986111Intel Core i9-14900K31871Windows 11 Pro for Workstations build 22631 (64-bit)ASUSTeK COMPUTER INC. ROG MAXIMUS Z790 APEX ENCORE32.6 GBGeForce RTX 40902024-01-02 23:37:24

CPU 벤치마크

아래는 차트에 나타나는 모든 단일 및 다중 소켓 CPU 유형의 목록입니다. 열특정 프로세서 이름을 클릭하면 해당 프로세서가 나타나는 차트로 이동하여 강조 표시됩니다.

https://www.cpubenchmark.net/CPU_mega_page.html

CPU NameCoresCPU MarkThread Mark TDP (W) SocketCategory
[Dual CPU] AMD EPYC 9J45128201,3353,488NAUnknownServer
[Dual CPU] AMD EPYC 965596200,5553,869400SP5Server
[Dual CPU] AMD EPYC 9575F64200,1974,255400SP5Server
[Dual CPU] AMD EPYC 9755128198,5883,505500SP5Server
[Dual CPU] AMD EPYC 9K65192187,9233,176NASP5Server
[Dual CPU] AMD EPYC 9965192183,2143,106500SP5Server
[Dual CPU] AMD EPYC 955564182,4713,743360SP5Server
AMD Ryzen Threadripper PRO 9995WX96176,3414,575350sTR5Desktop, Server
[Dual CPU] AMD EPYC 9745128173,7173,157400SP5Server
AMD EPYC 9755128166,3283,503500SP5Server
AMD EPYC Embedded 9755128164,0103,508500UnknownMobile/Embedded
[Dual CPU] Intel Xeon 6960P72160,7853,164500FCLGA7529Server
AMD EPYC 9965192160,7783,210500SP5Server
AMD EPYC 9655P96160,4903,849400SP5Server
[Dual CPU] AMD EPYC 9475F48159,7653,6834000SP5Server
AMD EPYC 9B4532158,7903,540390SP5Server
[Quad CPU] Intel Xeon Platinum 8490H60157,1562,925350FCLGA4677Server
[Dual CPU] Intel Xeon 6767P64157,0283,298350FCLGA4710Server
AMD EPYC 965596156,1103,847400SP5Server
AMD Ryzen Threadripper PRO 9985WX64154,3614,512350sTR5Desktop, Server
[Dual CPU] AMD EPYC 9845160153,2653,105390SP5Server
[Dual CPU] Intel Xeon 6760P64153,1873,214330FCLGA4710Server
AMD EPYC 9845160152,9853,144390SP5Server
[Dual CPU] AMD EPYC 9684X96150,9742,893400SP5Server
[Dual CPU] Intel Xeon 6787P86148,8963,137350FCLGA4710Server
[Dual CPU] AMD EPYC 9474F48147,8983,212360SP5Server
AMD EPYC 9575F64147,5414,152400SP5Server
[Dual CPU] AMD EPYC 965496145,4212,786360SP5Server
[Dual CPU] AMD EPYC 9B1496145,3972,859NAUnknownServer
AMD Ryzen Threadripper PRO 7995WX96143,0173,830350sTR5Desktop, Server
[Dual CPU] AMD EPYC 955464142,4922,948360SP5Server
[Dual CPU] AMD EPYC 963484142,2812,863290SP5Server
[Dual CPU] Intel Xeon 6747P48142,2573,227330FCLGA4710Server
AMD Ryzen Threadripper 9980X64142,0694,526350sTR5Desktop
[Dual CPU] Intel Xeon Platinum 8592+64139,9243,215350FCLGA4677Server
[Dual CPU] Intel Xeon Platinum 857056137,5883,224350FCLGA4677Server
AMD Ryzen Threadripper 7980X64135,7874,014350sTR5Desktop
AMD EPYC 9555P64135,4413,736360SP5Server
AMD EPYC 956572135,2213,696400SP5Server
[Dual CPU] AMD EPYC 953464135,0592,882280SP5Server
[Dual CPU] Intel Xeon Platinum 8558P48133,2233,217350FCLGA4677Server
AMD Ryzen Threadripper PRO 7985WX64132,9463,962350sTR5Desktop, Server
[Dual CPU] AMD EPYC 933532132,4383,741210SP5Server
[Quad CPU] AMD Instinct MI300A Accelerator24132,0202,926550UnknownServer
AMD EPYC 9745128130,6982,806400SP5Server
Intel Xeon 6960P72130,6593,287500FCLGA7529Server
[Dual CPU] AMD EPYC 9734112130,0342,369340SP5Server
[Dual CPU] AMD EPYC 9754128130,0152,362360SP5Server
[Dual CPU] AMD EPYC 945448129,7012,982290SP5Server
[Dual CPU] Intel Xeon Platinum 8488C48127,2073,096385UnknownServer
[Dual CPU] Intel Xeon Platinum 8568Y+48127,1723,033350FCLGA4677Server
[Dual CPU] Intel Xeon 6737P32127,0753,366270FCLGA4710Server
[Dual CPU] Intel Xeon Platinum 8480+56126,3532,996350FCLGA4677Server
AMD EPYC 9B1496126,2882,897NAUnknownServer
[Dual CPU] Intel Xeon 6736P36125,4443,445205FCLGA4710Server
[Dual CPU] AMD EPYC 9374F32125,2593,264320SP5Server
AMD EPYC 9J1496124,6372,903NASP5Server
[Dual CPU] Intel Xeon 6530P32124,4343,453225FCLGA4710Server
[Quad CPU] Intel Xeon Gold 6448H32123,3612,664250FCLGA4677Server
AMD EPYC 9475F48122,4763,7794000SP5Server
[Dual CPU] Intel Xeon 6740P48122,1653,185270FCLGA4710Server
AMD EPYC 9684X96122,0172,892400SP5Server
[Dual CPU] AMD EPYC 9384X32121,5603,085320SP5Server
[Dual CPU] Intel Xeon Platinum 846848121,2192,967350FCLGA4677Server
AMD EPYC 965496119,2462,898360SP5Server
[Dual CPU] AMD EPYC 7J1364119,1342,594NAUnknownServer
[Dual CPU] Intel Xeon 6730P32118,8743,215250FCLGA4710Server
Intel Xeon 6781P80117,9463,152350FCLGA4710Server
AMD EPYC 9V7480117,6062,888400SP5Server
[Dual CPU] Intel Xeon Platinum 8458P44117,1362,841350FCLGA4677Server
AMD EPYC 9455P48116,9263,747300SP5Server
AMD EPYC 9R1496116,4752,920NAUnknownServer
AMD EPYC 9654P96116,3242,731360SP5Server
[Dual CPU] AMD EPYC 7T8364115,5222,540280SP3Server
[Dual CPU] Intel Xeon Platinum 858060114,4072,402350FCLGA4677Server
AMD EPYC 9D25126114,2752,481NAUnknownServer
[Dual CPU] AMD Ryzen Threadripper PRO 3995WX64113,6932,559280sWRX8Desktop, Server
[Dual CPU] AMD EPYC 935432113,5442,934280SP5Server
[Dual CPU] AMD EPYC 776364113,4412,446280SP3Server
[Dual CPU] AMD EPYC 9274F24112,9433,371NASP5Server
[Dual CPU] Intel Xeon Platinum 8462Y+32111,2343,054300FCLGA4677Server
[Dual CPU] Intel Xeon Max 948056111,2132,528350FCLGA4677Server
[Dual CPU] AMD EPYC 7B1364110,9442,461240UnknownServer
[Dual CPU] Intel Xeon Gold 6554S36110,8353,267270FCLGA4677Server
[Dual CPU] AMD EPYC 7773X64110,4122,445280SP3Server
[Dual CPU] Intel Xeon Platinum 8457C48109,9052,564NAFCLGA4677Server
[Dual CPU] Intel Xeon Platinum 847052109,6102,485350FCLGA4677Server
[Dual CPU] AMD EPYC 7R1348109,3482,438NAUnknownServer
[Dual CPU] AMD EPYC 771364109,2072,454225SP3Server
[Dual CPU] AMD EPYC 933432109,1093,042NASP5Server
AMD Ryzen Threadripper 9970X32108,4404,536350sTR5Desktop
[Dual CPU] AMD EPYC 7Y8364108,2812,622280SP3Mobile/Embedded
AMD EPYC 963484107,9442,924290SP5Server
AMD Ryzen Threadripper PRO 9975WX32106,9424,439350sTR5Desktop, Server
[Dual CPU] Intel Xeon Platinum 855848105,5342,554330FCLGA4677Server
AMD EPYC 9554P64104,9202,737360SP5Server
AMD EPYC 955464104,3362,909360SP5Server
[Dual CPU] AMD EPYC 7573X32103,4662,665280SP3Server
[Dual CPU] Intel Xeon Platinum 8562Y+32102,8772,912300FCLGA4677Server
[8-Way CPU] Intel Xeon E7-8890 v4 @ 2.20GHz24102,4112,211165LGA2011-v3Server
AMD EPYC 9734112102,2862,310340SP5Server
AMD EPYC 9474F48102,2553,155360SP5Server
[Dual CPU] AMD EPYC 7K8364102,0532,458NAUnknownServer
Intel Xeon 6747P48101,6853,236330FCLGA4710Server
[Dual CPU] AMD EPYC 75F332101,4292,664280SP3Server
Intel Xeon 6741P48100,6603,195300FCLGA4710Server
[Dual CPU] Intel Xeon Gold 6448Y32100,6423,065225FCLGA4677Server
[Dual CPU] AMD EPYC 7V1364100,3182,171240SP3Server
[Dual CPU] AMD EPYC 9175F1699,8063,610320SP5Server
AMD Ryzen Threadripper 7970X3299,1824,169350sTR5Desktop
[Dual CPU] Intel Xeon 6520P2499,0163,349210FCLGA4710Server
[Dual CPU] AMD Ryzen Threadripper PRO 3975WX3298,8112,676280sWRX8Desktop, Server

Hardware Selection for FLOW-3D Products – FLOW-3D

부분 업데이트 / ㈜에스티아이씨앤디 솔루션사업부

In this blog, Flow Science’s IT Manager Matthew Taylor breaks down the different hardware components and suggests some ideal configurations for getting the most out of your FLOW-3D products.

개요

본 자료는 Flow Science의 IT 매니저 Matthew Taylor가 작성한 자료를 기반으로 STI C&D에서 일부 자료를 보완한 자료입니다. 본 자료를 통해 FLOW-3D 사용자는 최상의 해석용 컴퓨터를 선택할 때 도움을 받을 수 있을 것으로 기대합니다.

수치해석을 하는 엔지니어들은 사용하는 컴퓨터의 성능에 무척 민감합니다. 그 이유는 수치해석을 하기 위해 여러 준비단계와 분석 시간들이 필요하지만 당연히 압도적으로 시간을 소모하는 것이 계산 시간이기 때문일 것입니다.

따라서 수치해석용 컴퓨터의 선정을 위해서 단위 시간당 시스템이 처리하는 작업의 수나 처리량, 응답시간, 평균 대기 시간 등의 요소를 복합적으로 검토하여 결정하게 됩니다.

또한 수치해석에 적합한 성능을 가진 컴퓨터를 선별하는 방법으로 CPU 계산 처리속도인 Flops/sec 성능도 중요하지만 수치해석을 수행할 때 방대한 계산 결과를 디스크에 저장하고, 해석결과를 분석할 때는 그래픽 성능도 크게 좌우하기 때문에 SSD 디스크와 그래픽카드에도 관심을 가져야 합니다.

FLOW SCIENCE, INC. 에서는 일반적인 FLOW-3D를 지원하는 최소 컴퓨터 사양과 O/S 플랫폼 가이드를 제시하지만, 도입 담당자의 경우, 최상의 조건에서 해석 업무를 수행해야 하기 때문에 가능하면 최고의 성능을 제공하는 해석용 장비 도입이 필요합니다. 이 자료는 2022년 현재 FLOW-3D 제품을 효과적으로 사용하기 위한 하드웨어 선택에 대해 사전에 검토되어야 할 내용들에 대해 자세히 설명합니다. 그리고 실행 중인 시뮬레이션 유형에 따라 다양한 구성에 대한 몇 가지 아이디어를 제공합니다.

CPU 최신 뉴스

2025년 11월 26일 기준

CPU Benchmarks
이미지 출처 : https://www.cpubenchmark.net/high_end_cpus.html

CPU의 선택

CPU는 전반적인 성능에 큰 영향을 미치며, 대부분의 경우 컴퓨터의 가장 중요한 구성 요소입니다. 그러나 데스크탑 프로세서를 구입할 때가 되면 Intel 과 AMD의 모델 번호와 사양을 이해하는 것이 어려워 보일 것입니다.
그리고, CPU 성능을 평가하는 방법에 의해 가장 좋은 CPU를 고른다고 해도 보드와, 메모리, 주변 Chip 등 여러가지 조건에 의해 성능이 달라질 수 있기 때문에 성능평가 결과를 기준으로 시스템을 구입할 경우, 단일 CPU나 부품으로 순위가 정해진 자료보다는 시스템 전체를 대상으로 평가한 순위표를 보고 선정하는 지혜가 필요합니다.

<출처>https://www.cpubenchmark.net/high_end_cpus.html

수치해석을 수행하는 CPU의 경우 예산에 따라 Core가 많지 않은 CPU를 구매해야 하는 경우도 있을 수 있습니다. 보통 Core가 많다고 해석 속도가 선형으로 증가하지는 않으며, 해석 케이스에 따라 적정 Core수가 있습니다. 이 경우 예산에 맞는 성능 대비 최상의 코어 수가 있을 수 있기 때문에 Single thread Performance 도 매우 중요합니다. 아래 성능 도표를 참조하여 예산에 맞는 최적 CPU를 찾는데 도움을 받을 수 있습니다.

CPU 성능 분석 방법

부동소수점 계산을 하는 수치해석과 밀접한 Computer의 연산 성능 벤치마크 방법은 대표적으로 널리 사용되는 아래와 같은 방법이 있습니다.

FLOW-3D의 CFD 솔버 성능은 CPU의 부동 소수점 성능에 전적으로 좌우되기 때문에 계산 집약적인 프로그램입니다. 현재 출시된 사용 가능한 모든 CPU를 벤치마킹할 수는 없지만 상대적인 성능을 합리적으로 비교할 수는 있습니다.

특히, 수치해석 분야에서 주어진 CPU에 대해 FLOW-3D 성능을 추정하거나 여러 CPU 옵션 간의 성능을 비교하기 위한 최상의 옵션은 Standard Performance Evaluation Corporation의 SPEC CPU2017 벤치마크(현재까지 개발된 가장 최신 평가기준임)이며, 특히 SPECspeed 2017 Floating Point 결과가 CFD Solver 성능을 매우 잘 예측합니다.

이는 유료 벤치마크이므로 제공된 결과는 모든 CPU 테스트 결과를 제공하지 않습니다. 보통 제조사가 ASUS, Dell, Lenovo, HP, Huawei 정도의 제품에 대해 RAM이 많은 멀티 소켓 Intel Xeon 기계와 같은 값비싼 구성으로 된 장비 결과들을 제공합니다.

CPU 비교를 위한 또 다른 옵션은 Passmark Software의 CPU 벤치마크입니다. PerformanceTest 제품군은 유료 소프트웨어이지만 무료 평가판을 사용할 수 있습니다. 대부분의 CPU는 저렴한 옵션을 포함하여 나열됩니다. 부동 소수점 성능은 전체 벤치마크의 한 측면에 불과하지만 다양한 워크로드에서 전반적인 성능을 제대로 테스트합니다.

예산을 결정하고 해당 예산에 해당하는 CPU를 선택한 후에는 벤치마크를 사용하여 가격에 가장 적합한 성능을 결정할 수 있습니다.

<참고>

SPEC의 벤치 마크https://www.spec.org/benchmarks.html#cpu )

SPEC CPU 2017 (현재까지 가장 최근에 개발된 CPU 성능측정 기준)

다른 컴퓨터 시스템에서 컴퓨팅 계산에 대한 집약적인 워크로드를 비교하는데 사용할 수 있는 성능 측정을 제공하도록 설계된 SPEC CPU 2017에는 SPECspeed 2017 정수, SPECspeed 2017 부동 소수점, SPECrate 2017 정수 및 SPECrate 2017 부동 소수점의 4 가지 제품군으로 구성된 43 개의 벤치 마크가 포함되어 있습니다. SPEC CPU 2017에는 에너지 소비 측정을 위한 선택적 메트릭도 포함되어 있습니다.

<SPEC CPU 벤치마크 보고서>

벤치마크 결과보고서는 제조사별, 모델별로 테스트한 결과를 아래 사이트에 가면 볼 수 있습니다.

https://www.spec.org/cgi-bin/osgresults

<보고서 샘플>

  • SPEC CPU 2017

Designed to provide performance measurements that can be used to compare compute-intensive workloads on different computer systems, SPEC CPU 2017 contains 43 benchmarks organized into four suites: SPECspeed 2017 Integer, SPECspeed 2017 Floating Point, SPECrate 2017 Integer, and SPECrate 2017 Floating Point. SPEC CPU 2017 also includes an optional metric for measuring energy consumption.

고성능 컴퓨팅 성능 기준 FLOP의 이해

출처: https://www.itworld.co.kr/article/4113033

플롭은 부동소수점 연산 1회를 뜻하며, 소수점이 있는 숫자를 대상으로 한 번의 산술 계산(덧셈, 뺄셈, 곱셈, 나눗셈)을 의미한다. 컴퓨팅 벤치마킹에서 정수보다 부동소수점을 쓰는 이유는 정수보다 측정 지표로서 정확도가 훨씬 높기 때문이다.

플롭 앞에는 1초 동안 수행하는 연산 횟수를 나타내는 접두어가 붙으며, 메가플롭(1초당 100만 회)부터 기가플롭(10억), 테라플롭(1조), 페타플롭(1천조), 그리고 최근에는 엑사플롭(100경)까지 확장됐다. 최근 몇 년 동안 업계가 엑사플롭 달성 경쟁에 매달린 이유는 마법 같은 성능 도약이나 대발견 때문이 아니라, 단지 자랑거리를 위한 것이었다.

컴퓨팅에서 부동소수점 정밀도는 FP4, 즉 4비트 부동소수점에서 시작해 FP64까지 두 배씩 커진다. 이론적으로 FP128도 있지만, 지표로는 사실상 쓰지 않는다. FP64는 IEEE 754 표준에 따른 64비트 배정밀도(double-precision) 부동소수점 형식으로도 불리며, 실수를 높은 정확도로 표현하기 위한 규격이다.

FP64는 정밀도가 높기 때문에 계산하는 데 가장 많은 시간이 필요하다. FP64 계산 시간은 FP32의 2배, FP16의 4배가 걸리지만, 계산 정확도는 FP32의 2배, FP16의 4배에 해당한다. 메모리 사용량도 같은 원리로 FP64가 FP32의 2배, FP16의 4배를 사용한다.

매년 6월과 11월에 집계·발표되는 톱500 슈퍼컴퓨터 목록은 슈퍼컴퓨터 성능을 FP64 기준으로 측정하며, 슈퍼컴퓨터에 가장 가혹한 스트레스 테스트로 통한다.

톱500 목록이 32비트나 16비트가 아니라 64비트로 측정되는 이유는 톱500 목록이 과학 컴퓨팅 애플리케이션의 대리 지표이며 과학 컴퓨팅 애플리케이션이 여전히 계산에서 64비트 정확도에 주로 의존하기 때문이다. HPC·슈퍼컴퓨팅 전문 시장조사업체 인터섹트 360의 CEO 애디슨 스넬은 “일부 영역에서 정밀도를 낮춰 속도를 더 낼 수 있지 않느냐는 지적도 있고 중요하지 않은 영역에서 과도한 계산을 하고 있지 않느냐는 질문도 나오지만, 과학 컴퓨팅에서는 64비트가 여전히 사실상 표준이다”라고 말했다.

스넬은 FP64가 과학 컴퓨팅의 거의 모든 분야에서 쓰인다고 말했다. 연구 영역에서는 유체가 포함돼 높은 정확도로 모델링해야 하는 기상 시뮬레이션이나 해양 모델링이 포함된다. 또한, 자동차 충돌 시뮬레이션, 항공기 날개 공력 분석, 석유 시추 지점을 찾기 위한 탄성파 분석, 신약 설계를 위한 분자 모델링 같은 폭넓은 상용 애플리케이션에도 적용된다. 이런 애플리케이션은 계산을 위해 높은 수준의 과학적 정밀도를 요구한다고 말했다.

그 다음 단계는 FP32, 즉 단정밀도 부동소수점이다. FP32는 생명과학 시뮬레이션과 금융 모델링에도 쓰이며, 모델 요구 수준이 그리 엄격하지 않아 FP32를 써도 되는 경우에 주로 사용된다.

FP16은 AI 추론에서 일상적으로 쓰이지만, AI 학습은 FP64에 전적으로 의존한다. 이유는 간단하다. 예를 들어 AI로 개나 고양이 이미지를 구분하도록 학습시킨다고 가정해 보자. 개나 고양이를 구성하는 특징을 인식하려면 FP64의 미세한 정밀도가 필요하다. 학습이 끝나면 작업은 패턴 매칭으로 바뀌며, 개 이미지인지 고양이 이미지인지 판단하는 데는 덜 부담스러운 FP16으로도 충분하다. 스넬은 언어 학습이나 인식에서도 비슷하게, 말할 때 단어 하나를 약간 틀리게 발음해도 AI는 대체로 의도를 파악한다고 설명했다.

16비트 정밀도에는 bfloat16이라는 두 번째 형태도 있다. bfloat는 구글의 텐서 프로세서용으로 처음 개발됐지만, 이후 인텔과 AMD, 엔비디아에 라이선스를 제공했다. bfloat는 유연한 가변 형식인 반면 FP16은 매번 동일한 16비트 형식이다. 스넬은 “기술적으로 복잡하지만 결론은 bfloat가 FP16보다 정밀도는 낮고 속도는 더 빠르기 때문에 주요 칩 업체가 모두 bfloat를 쓴다”라고 설명했다.

마지막으로 FP8과 FP4가 있다. FP8은 정밀도 요구가 낮은 추론 처리 연산에 사용한다. 또 다른 핵심 용도는 오류 허용도가 더 높은 신경망 학습이다. 연산 부담이 적은 작업을 수행하는 엣지 컴퓨팅에서도 쓰인다. FP8은 GPU에서만 쓰이며, 인텔과 AMD 프로세서에서는 쓰지 않는다.

클럭 대 코어

일반적으로 클럭 속도가 높은 칩은 CPU 코어를 더 적게 포함합니다. FLOW-3D는 병렬화가 잘되어 있지만, 디스크 쓰기와 같이 일부 작업은 기본적으로 단일 스레드 방식으로 수행됩니다. 따라서 데이터 출력이 빈번하거나 큰 시뮬레이션은 종종 더 많은 코어가 아닌, 더 높은 클럭 속도를 활용합니다. 마찬가지로 코어 및 소켓의 다중 스레딩은 오버헤드를 발생시키므로 작은 문제의 해석일 경우 사용되는 코어 수를 제한하면 성능이 향상될 수 있습니다.

CPU 아키텍처

CPU 아키텍처는 중요합니다. 최신 CPU는 일반적으로 사이클당 더 많은 기능을 제공합니다. 즉, 현재 세대의 CPU는 일반적으로 동일한 클럭 속도에서 이전 CPU보다 성능이 우수합니다. 또한 전력 효율이 높아져 와트당 성능이 향상될 수 있습니다. Flow Science에는 구형 멀티 소켓 12, 16, 24 코어 Xeon보다 성능이 뛰어난 최근 세대 10~12 Core i9 CPU 시스템을 보유하고 있습니다.

오버클럭

해석용 장비에서는 CPU를 오버클럭 하지 않는 것이 좋습니다. 하드웨어를 다년간의 투자라고 생각한다면, 오버클럭화는 발열을 증가시켜 수명을 단축시킵니다. CPU에 따라 안정성도 저하될 수 있습니다. CPU를 오버클럭 할 때는 세심한 열 관리가 권장됩니다.

하이퍼스레딩

<이미지출처:https://gameabout.com/krum3/4586040>

하이퍼스레딩은 물리적으로 1개의 CPU를 가상으로 2개의 CPU처럼 작동하게 하는 기술로 파이프라인의 단계수가 많고 각 단계의 길이가 짧을때 유리합니다. 다만 수치해석 처럼 모든 코어의 CPU를 100% 사용중인 장시간 수행 시뮬레이션은 일반적으로 Hyper Threading이 비활성화 된 상태에서 더 잘 수행됩니다. FLOW-3D는 100% CPU 사용률이 일반적이므로 새 하드웨어를 구성할 때 Hyper Threading을 비활성화하는 것이 좋습니다. 설정은 시스템의 BIOS 설정에서 수행합니다.

몇 가지 워크로드의 경우에는 Hyper Threading을 사용하여 약간 더 나은 성능을 보이는 경우가 있습니다. 따라서, 최상의 런타임을 위해서는 두 가지 구성중에서 어느 구성이 더 적합한지 시뮬레이션 유형을 테스트하는 것이 좋습니다.

스케일링

여러 코어를 사용할 때 성능은 선형적이지 않습니다. 예를 들어 12 코어 CPU에서 24 코어 CPU로 업그레이드해도 시뮬레이션 런타임이 절반으로 줄어들지 않습니다. 시뮬레이션 유형에 따라 16~32개 이상의 CPU 코어를 선택할 때는 FLOW-3D 및 FLOW-3D CAST의 HPC 버전을 사용하거나 FLOW-3D CLOUD로 이동하는 것을 고려하여야 합니다.

AMD Ryzen 또는 Epyc CPU

AMD는 일부 CPU로 벤치마크 차트를 석권하고 있으며 그 가격은 매우 경쟁력이 있습니다. FLOW SCIENCE, INC. 에서는 소수의 AMD CPU로 FLOW-3D를 테스트했습니다. 현재 Epyc CPU는 이상적이지 않고 Ryzen은 성능이 상당히 우수합니다. 발열은 여전히 신중하게 다뤄져야 할 문제입니다.

<관련 기사>

https://www.techspot.com/news/78122-report-software-fix-can-double-threadripper-2990wx-performance.html

Graphics 고려 사항

FLOW-3D는 OpenGL 드라이버가 만족스럽게 수행되는 최신 그래픽 카드가 필요합니다. 최소한 OpenGL 3.0을 지원하는 것이 좋습니다. 권장 옵션은 엔비디아의 쿼드로 K 시리즈와 AMD의 파이어 프로 W 시리즈입니다.

특히 엔비디아 쿼드로(NVIDIA Quadro)는 엔비디아가 개발한 전문가 용도(워크스테이션)의 그래픽 카드입니다. 일반적으로 지포스 그래픽 카드가 게이밍에 초점이 맞춰져 있지만, 쿼드로는 다양한 산업 분야의 전문가가 필요로 하는 영역에 광범위한 용도로 사용되고 있습니다. 주로 산업계의 그래픽 디자인 분야, 영상 콘텐츠 제작 분야, 엔지니어링 설계 분야, 과학 분야, 의료 분석 분야 등의 전문가 작업용으로 사용되고 있습니다. 따라서 일반적인 소비자를 대상으로 하는 지포스 그래픽 카드와는 다르계 산업계에 포커스 되어 있으며 가격이 매우 비싸서 도입시 예산을 고려해야 합니다.

유의할 점은 엔비디아의 GTX 게이밍 하드웨어는 볼륨 렌더링의 속도가 느리거나 오동작 등 몇 가지 제한 사항이 있습니다. 일반적으로 노트북에 내장된 통합 그래픽 카드보다는 개별 그래픽 카드를 강력하게 추천합니다. 최소한 그래픽 메모리는 512MB 이상을 권장합니다.

출처 : https://www.videocardbenchmark.net/high_end_gpus.html

원격데스크탑 사용시 고려 사항

Flow Science는 nVidia 드라이버 버전이 341.05 이상인 nVidia Quadro K, M 또는 P 시리즈 그래픽 하드웨어를 권장합니다. 이 카드와 드라이버 조합을 사용하면 원격 데스크톱 연결이 완전한 3D 가속 기능을 갖춘 기본 하드웨어에서 자동으로 실행됩니다.

원격 데스크톱 세션에 연결할 때 nVidia Quadro 그래픽 카드가 설치되어 있지 않으면 Windows는 소프트웨어 렌더링을 사용합니다. FLOW-3D 가 소프트웨어 렌더링을 사용하고 있는지 확인하려면 FLOW-3D 도움말 메뉴에서 정보를 선택하십시오. GDI Generic을 소프트웨어 렌더링으로 사용하는 경우 GL_RENDERER 항목에 표시됩니다.

하드웨어 렌더링을 활성화하는 몇 가지 옵션이 있습니다. 쉬운 방법 중 하나는 실제 콘솔에서 FLOW-3D를 시작한 다음 원격 데스크톱 세션을 연결하는 것입니다. Nice Software DCV 와 같은 일부 VNC 소프트웨어는 기본적으로 하드웨어 렌더링을 사용합니다.

RAM 고려 사항

프로세서 코어당 최소 4GB의 RAM은 FLOW-3D의 좋은 출발입니다. POST Processor를 사용하여 후처리 작업을 할 경우 충분한 양의 RAM을 사용하는 것이 좋습니다.

DDR5 램의 공식 규격은 2020년 7월 14일에 발표되었습니다. 하지만 일반 소비자를 대상으로 한 제품은 인텔 12세대 CPU(Alder Lake)와 함께 2021년 하반기부터 본격적으로 출시되기 시작했습니다.

일반적으로 FLOW-3D를 이용하여 해석을 할 경우 격자(Mesh)수에 따라 소요되는 적정 메모리 크기는 아래와 같습니다.페이지 보기

  • 초대형 (2억개 이상의 셀) : 최소 128GB
  • 대형 (60 ~ 1억 5천만 셀) : 64 ~ 128GB
  • 중간 (30-60백만 셀) : 32-64GB
  • 작음 (3 천만 셀 이하) : 최소 32GB

HDD 고려 사항

수치해석은 해석결과 파일의 데이터 양이 매우 크기 때문에 읽고 쓰는데, 속도면에서 매우 빠른 SSD를 적용하면 성능면에서 큰 도움이 됩니다. 다만 SSD 가격이 비싸서 가성비 측면을 고려하여 적정수준에서 결정이 필요합니다.

CPU와 저장장치 간 데이터가 오고 가는 통로가 그림과 같이 3가지 방식이 있습니다. 이를 인터페이스라 부르며 SSD는 흔히 PCI-Express 와 SATA 통로를 이용합니다.

흔히 말하는 NVMe는 PCI-Express3.0 지원 SSD의 경우 SSD에 최적화된 NVMe (NonVolatile Memory Express) 전송 프로토콜을 사용합니다. 주의할 점은 MVMe중에서 SATA3 방식도 있기 때문에 잘 구별하여 구입하시기 바랍니다.

그리고 SSD를 선택할 경우에도 SSD 종류 중에서 PCI Express 타입은 매우 빠르고 가격이 고가였지만 최근에는 많이 저렴해졌습니다. 따라서 예산 범위내에서 NVMe SSD등 가장 효과적인 선택을 하는 것이 좋습니다.
( 참고 : 해석용 컴퓨터 SSD 고르기 참조 )

기존의 물리적인 하드 디스크의 경우, 디스크에 기록된 데이터를 읽기 위해서는 데이터를 읽어내는 헤드(바늘)가 물리적으로 데이터가 기록된 위치까지 이동해야 하므로 이동에 일정한 시간이 소요됩니다. (이러한 시간을 지연시간, 혹은 레이턴시 등으로 부름) 따라서 하드 디스크의 경우 데이터를 읽기 위한 요청이 주어진 뒤에 데이터를 실제로 읽기까지 일정한 시간이 소요되는데, 이 시간을 일정한 한계(약 10ms)이하로 줄이는 것이 불가능에 가까우며, 데이터가 플래터에 실제 기록된 위치에 따라서 이러한 데이터에의 접근시간 역시 차이가 나게 됩니다.

하지만 HDD의 최대 강점은 가격대비 용량입니다. 현재 상용화되어 판매하는 대용량 HDD는 12TB ~ 15TB가 공급되고 있으며, 이는 데이터 저장이나 백업용으로 가장 좋은 선택이 됩니다.
결론적으로 데이터를 직접 읽고 쓰는 드라이브는 SSD를 사용하고 보관하는 용도의 드라이브는 기존의 HDD를 사용하는 방법이 효과적인 선택이 될 수 있습니다.

PassMark – Disk Rating High End Drives

출처 : https://www.harddrivebenchmark.net/high_end_drives.html

상기 벤치마크 테스트는 테스트 조건에 따라 그 성능 곡선이 달라질 수 있기 때문에 조건을 확인할 필요가 있습니다. 예를 들어 Windows7, windows8, windows10 , windows11 모두에서 테스트한 결과를 평균한 점수와 자신이 사용할 컴퓨터 O/S에서 테스트한 결과는 다를 수 있습니다. 상기 결과에 대한 테스트 환경에 대한 내용은 아래 사이트를 참고하시기 바랍니다.

참고 : 테스트 환경

페이지 보기