1
DataCrunch
₩240/GPU·시간
V10032GB VRAM
Volta리전 미공개
결제 전 공식 사이트를 통해 정확한 정보를 확인하세요.
GPU 가격 불러오는 중…
용도 선택
작업 유형
규모 / 도구
소형 오픈웨이트 모델은 RTX 4090·L4가 가성비 면에서 자주 유리합니다.
오픈웨이트 LLM 서빙, 챗 애플리케이션, 에이전트 백엔드처럼 지연 시간과 VRAM 여유가 중요한 작업입니다.
결과당 비용
시간당 요금을 보수적인 vLLM 처리량 추정치로 환산해, 서로 다른 GPU를 같은 기준에서 비교합니다.
RTX 4090iwinv
1,050 tok/s · Llama 3.1 8B (FP16)
₩190/1M 토큰
RTX A6000DataCrunch
920 tok/s · Llama 3.1 8B (FP16)
₩260/1M 토큰
RTX A6000iwinv
920 tok/s · Llama 3.1 8B (FP16)
₩390/1M 토큰
L4AWS
620 tok/s · Llama 3.1 8B (INT8)
₩500/1M 토큰
L4AWS
620 tok/s · Llama 3.1 8B (INT8)
₩500/1M 토큰
추천
추적 중인 제공사 데이터를 가격과 갱신 시각 순으로 정렬합니다.
₩240/GPU·시간
결제 전 공식 사이트를 통해 정확한 정보를 확인하세요.
₩520/GPU·시간
결제 전 공식 사이트를 통해 정확한 정보를 확인하세요.
₩700/GPU·시간
결제 전 공식 사이트를 통해 정확한 정보를 확인하세요.
₩840/GPU·시간
결제 전 공식 사이트를 통해 정확한 정보를 확인하세요.
₩890/GPU·시간
결제 전 공식 사이트를 통해 정확한 정보를 확인하세요.
₩980/GPU·시간
결제 전 공식 사이트를 통해 정확한 정보를 확인하세요.