NVIDIA Driver 설치는 NVIDIA Driver install 문서를 참조하도록 한다.
이 문서는 장착된 GPU의 적당한 부하를 테스트 하기 위한 방법에 대해 설명한다. 당연하게도 NVIDIA드라이버 및 CUDA드라이버는 설치되어있다고 가정한다.
부하 테스트를 위해서 gpu-burn
유틸리티를 이용할 것이다.
yum -y install gcc gcc-c++ libcublas-devel-12-0 cuda-cudart-devel-12-0 cuda-nvcc-12-0
$ git clone https://github.com/wilicc/gpu-burn.git $ cd gpu-burn/ $ make
이후 컴파일을 통해 실행파일gpu_burn
이 생성된다.
[root@kvm33 gpu-burn]# ./gpu_burn Run length not specified in the command line. Burning for 10 seconds. GPU 0: NVIDIA T1000 8GB (UUID: GPU-174cc61b-dfff-73a1-b752-314e391236a4) Initialized device 0 with 7967 MB of memory (7710 MB available, using 6939 MB of it), using FLOATS Results are 16777216 bytes each, thus performing 431 iterations 40.0% proc'd: 431 (2083 Gflop/s) errors: 0 temps: 45 C Summary at: Thu Jan 5 02:28:47 PM KST 2023 70.0% proc'd: 862 (2389 Gflop/s) errors: 0 temps: 56 C Summary at: Thu Jan 5 02:28:50 PM KST 2023 100.0% proc'd: 1293 (2390 Gflop/s) errors: 0 temps: 56 C Summary at: Thu Jan 5 02:28:53 PM KST 2023 100.0% proc'd: 1724 (2376 Gflop/s) errors: 0 temps: 60 C Killing processes.. Freed memory for dev 0 Uninitted cublas done Tested 1 GPUs: GPU 0: OK
nvidia-smi
명령어로 상태를 확인하면 아래와 같은 정보를 얻을수 있다.
Thu Jan 5 14:29:33 2023 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 525.60.13 Driver Version: 525.60.13 CUDA Version: 12.0 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 NVIDIA T1000 8GB Off | 00000000:61:00.0 Off | N/A | | 41% 61C P0 N/A / 50W | 7185MiB / 8192MiB | 100% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ +-----------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=============================================================================| | 0 N/A N/A 12849 C ./gpu_burn 7182MiB | +-----------------------------------------------------------------------------+