문서의 선택한 두 판 사이의 차이를 보여줍니다.
| 양쪽 이전 판 이전 판 | |
| nvidia_vgpu_types [2025/11/17 08:25] – koov | nvidia_vgpu_types [2025/11/17 08:32] (현재) – koov |
|---|
| |
| |
| ==== 스케쥴링 정책에 따른 코어 사용 방식 ==== | * 스케쥴링 정책에 따른 코어 사용 방식 |
| |
| ^ 정책 ^ 코어 사용 방식 ^ | ^ 정책 ^ 코어 사용 방식 ^ |
| | B (Best Effort) | 코어는 경쟁적 사용 → 비어 있는 SM을 먼저 점유 | | | B (Best Effort) | 코어는 경쟁적 사용 → 비어 있는 SM을 먼저 점유 | |
| | A (Equal Share) | 모든 vGPU가 동등하게 SM 공유 | | | A (Equal Share) | 모든 vGPU가 동등하게 SM 공유 | |
| | |
| | |
| | 따라서 엄격하게 자원을 나눠서 사용하는경우에는 ''Q''타입을 사용하면 되고 부하에 따라 자동으로 경쟁적으로 알아서 사용하게 하려면 ''B''타입을 사용 하면 된다. ''A''타입의 경우는 모든 인스턴스가 동일하게 GPU를 나눠쓰게 된다. |
| | |
| | |
| | 위 규칙에 따라 ''P40-2Q/B/A'' 형식의 인스턴스 8개를 생성했을때 타입별로 아래와 같은 효과가 난다. |
| | |
| | ^ 상황 ^ Q 타입 (Fixed) ^ B 타입 (Best Effort) ^ A 타입 (Equal Share) ^ |
| | | 1개 VM만 작업 중(7개 휴식) | 거의 100% 성능 사용 가능 | 거의 100% 성능 사용 가능 | 무조건 1/8(12.5%)만 사용 | |
| | | 8개 VM 모두 풀 로드 | 각 VM 정확히 1/8 성능 보장 | 먼저 시작한 VM이 더 많이 가져감 (불공평 가능) | 모든 VM 정확히 1/8 성능 | |
| | | AI 학습 (성능 예측 중요) | ◎ 최고 | △ 변동 심함 | △ 너무 느림 | |
| | | VDI/가상 데스크톱 (밀도 중요) | △ 밀도 낮음 | ◎ 최고 (B4까지 가능) | △ 느림 | |
| | | 테스트/개발 환경 | ○ 괜찮음 | ○ 괜찮음 | ◎ 완벽 공정 | |
| | |
| |