반응형
AMD GPU 주요 제품 정리
제품명 | 아키텍처 | 출시연도 | CU수 | 메모리 | FP16 연산성능(최대, FLOPS) | FP32 연산 성능(TFLOPS) | FP64 연산 성능(TFLOPS) | 메모리 대역폭 | TDP |
MI100 | CDNA 1 | 2020 | 120 | 32GB HBM2 | 184.6 | 23.1 | 11.5 | 1.23 TB/s | 300W |
MI210 | CDNA 2 | 2022 | 104 | 64GB HBM2e | 181 (FP16/BF16/INT8/INT4 TOPS)* | 22.6 | 22.6 | 1.6 TB/s | 300W |
MI250 | CDNA 2 | 2021 | 208 | 128GB HBM2e | 362.1 (FP16/BF16) | 45.3 | 90.5 | 3.28 TB/s | 560W |
MI250X | CDNA 2 | 2021 | 220 | 128GB HBM2e | 383 (FP16/BF16) | 47.9 | 95.7 | 3.28 TB/s | 560W |
MI300A | CDNA 3 | 2023 | 228 | 128GB HBM3 | 980.6 (FP16, 1961 sparsity) | 122.6 | 61.3 | 5.3 TB/s | 550-760W |
MI300X | CDNA 3 | 2023 | 304 | 192GB HBM3 | 1307 (FP16, 2615 sparsity) | 163.4 | - | 75.3TB/s | 750W |
- AMD Instinct MI 시리즈는 HPC(High Performance Computing) 및 AI/ML 워크로드를 위해 설계된 데이터센터 전용 가속기
- CDNA(Compute DNA) 아키텍처를 기반으로 하며, 게임 및 그래픽을 위한 RDNA 아키텍처와는 다른 연산 중심 설계 철학을 지님
- CNDA 구조에 대한 설명은 아래 블로그 글 참조 부탁드립니다.
https://futureseed.tistory.com/64
AMD GPU 구조 분석 및 정리 — CDNA vs RDNA
정리항목RDNA(그래픽용)CDNA(연산용)설계 목적게임·3D 렌더링, 영상 처리AI·HPC·행렬 연산 특화그래픽 파이프라인포함 (픽셀 쉐이더, 레이 트레이싱 등)전면 제거디스플레이 출력 엔진존재 (Display C
futureseed.tistory.com
세대별 특징 요약
CDNA 1 (MI100)
- AMD의 첫 CDNA 아키텍처 기반 가속기
- HPC용 FP64 연산 강화
- HBM2 기반 1.23 TB/s 대역폭
CDNA 2 (MI210, MI250, MI250X)
- MCM(Multi-Chip Module) 설계 도입
- BF16, INT8 등 다양한 연산 포맷 지원
- 메모리 대역폭 및 용량 대폭 향상
- MI250/250X는 128GB HBM2e 구성으로 AI 학습에 적합
CDNA 3 (MI300A, MI300X)
- APU형 통합 설계(MI300A: Zen4 CPU + GPU)
- 최대 192GB HBM3 (MI300X)
- Sparsity 연산을 활용한 초고속 FP16 연산
- 대규모 LLM 추론에 적합한 고용량 메모리와 연산 능력
MI308 이슈 정리
- MI308은 정식 발표된 제품은 아니며, AMD의 2025년 2분기 10-Q 보고서에서 처음 언급
- 중국 고객용 특화 제품으로 추정되며, MI300 시리즈 기반일 가능성 높음
- 미국의 수출 제재로 인해 납품 불가 → 약 8억 달러 규모 재고 평가 손실 발생
- 이 때문에 Q2 실적발표(25/8/6) 후 주가 급락($170불 대 → $160불)
- 다만 단기 하락 후 빠르게 상승하여 $175선 회복 중(25/8/8)
- 출시 예정 제품이라기보다는, 지정학적 리스크에 따른 회계상 충당 사례로 주목받음
반응형