목차

GPU 부하 테스트

NVIDIA Driver 설치는 NVIDIA Driver install 문서를 참조하도록 한다.

이 문서는 장착된 GPU의 적당한 부하를 테스트 하기 위한 방법에 대해 설명한다. 당연하게도 NVIDIA드라이버 및 CUDA드라이버는 설치되어있다고 가정한다.
부하 테스트를 위해서 gpu-burn 유틸리티를 이용할 것이다.

필요 패키지

yum -y install gcc gcc-c++ libcublas-devel-12-0 cuda-cudart-devel-12-0 cuda-nvcc-12-0

컴파일 및 실행

$ git clone https://github.com/wilicc/gpu-burn.git
$ cd gpu-burn/
$ make

이후 컴파일을 통해 실행파일gpu_burn이 생성된다.

[root@kvm33 gpu-burn]# ./gpu_burn
Run length not specified in the command line. Burning for 10 seconds.
GPU 0: NVIDIA T1000 8GB (UUID: GPU-174cc61b-dfff-73a1-b752-314e391236a4)
Initialized device 0 with 7967 MB of memory (7710 MB available, using 6939 MB of it), using FLOATS
Results are 16777216 bytes each, thus performing 431 iterations
40.0%  proc'd: 431 (2083 Gflop/s)   errors: 0   temps: 45 C
        Summary at:   Thu Jan  5 02:28:47 PM KST 2023

70.0%  proc'd: 862 (2389 Gflop/s)   errors: 0   temps: 56 C
        Summary at:   Thu Jan  5 02:28:50 PM KST 2023

100.0%  proc'd: 1293 (2390 Gflop/s)   errors: 0   temps: 56 C
        Summary at:   Thu Jan  5 02:28:53 PM KST 2023

100.0%  proc'd: 1724 (2376 Gflop/s)   errors: 0   temps: 60 C
Killing processes.. Freed memory for dev 0
Uninitted cublas
done

Tested 1 GPUs:
        GPU 0: OK

nvidia-smi 명령어로 상태를 확인하면 아래와 같은 정보를 얻을수 있다.

Thu Jan  5 14:29:33 2023
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.60.13    Driver Version: 525.60.13    CUDA Version: 12.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA T1000 8GB    Off  | 00000000:61:00.0 Off |                  N/A |
| 41%   61C    P0    N/A /  50W |   7185MiB /  8192MiB |    100%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A     12849      C   ./gpu_burn                       7182MiB |
+-----------------------------------------------------------------------------+

참조링크