반응형
서론
엔비디아(NVIDIA) GPU 아키텍처는 이제 단순한 그래픽 카드 기술을 넘어, AI 인프라의 핵심으로 자리 잡았습니다.
많은 분들이 “암페어(Ampere)와 호퍼(Hopper)의 차이는 무엇인가?”, “블랙웰(Blackwell)과 GB 아키텍처는 또 뭐지?”라는 궁금증을 가지시는데요.
이번 글에서는 암페어 → 호퍼 → 블랙웰·GB까지 이어지는 아키텍처 변화를 한눈에 정리해 보겠습니다.
1. 암페어(Ampere) 아키텍처
- 출시: 2020년 (A100, RTX 30 시리즈)
- 주요 특징
- 3세대 Tensor Core: FP16, TF32 연산 최적화
- MIG (Multi-Instance GPU): GPU를 분할해 여러 사용자 동시 활용 가능
- HPC와 AI 학습에서 대세로 자리잡음
2. 호퍼(Hopper) 아키텍처
- 출시: 2022년 (H100)
- 주요 특징
- Transformer Engine → FP8 연산 지원, LLM 학습·추론 속도 대폭 향상
- NVLink 4세대 → GPU 간 연결 대역폭 4배 확대
- Confidential Computing 지원 → 보안 강화
3. 암페어 vs 호퍼 차이 요약
구분 | 암페어 (A100) | 호퍼 (H100) |
출시 연도 | 2020 | 2022 |
핵심 연산 | FP16, TF32 | FP8, Transformer Engine |
성능 | 볼타 대비 최대 20배 | 암페어 대비 최대 4배 |
GPU 연결 | NVLink 3세대 | NVLink 4세대 |
주요 활용 | HPC, 초기 AI 학습 | 대규모 언어모델(LLM) 학습·추론 |
4. 블랙웰(Blackwell) 아키텍처
- 출시: 2024년 (GB200, B200 시리즈)
- 주요 특징
- 초대형 AI 모델 학습을 겨냥 → 메모리 용량·대역폭 강화
- 전력 효율 개선 → 동일한 전력으로 더 많은 연산 가능
- AI 추론 성능 최적화
5. GB 아키텍처 (Grace + Blackwell)
- GB는 Grace CPU + Blackwell GPU의 통합 아키텍처
- ARM 기반 CPU(Grace)를 GPU와 초고속 NVLink로 연결
- 장점
- CPU–GPU 간 병목 현상 최소화
- 초대형 AI 모델 학습 속도 개선
- 차세대 데이터센터 표준으로 부상
6. 엔비디아 GPU 아키텍처 타임라인 (시간순 정리)
연도 | 아키텍처 | 대표 제품 | 특징 |
2017 | 볼타 (Volta) | V100 | 최초 Tensor Core, 딥러닝 가속화 시작 |
2018 | 튜링 (Turing) | RTX 20 | 실시간 레이트레이싱, 2세대 Tensor Core |
2020 | 암페어 (Ampere) | A100, RTX 30 | MIG 지원, FP16·TF32 최적화 |
2022 | 호퍼 (Hopper) | H100 | Transformer Engine, FP8, NVLink 4세대 |
2024 | 블랙웰 (Blackwell) | B200, GB200 | AI 최적화, 전력 효율 극대화 |
2024~ | GB (Grace+Blackwell) | GB200 | CPU+GPU 통합, 초대형 AI 모델 대응 |
정리
- 암페어 → 호퍼: FP16/TF32에서 FP8로 진화, AI 학습·추론 속도 혁신
- 블랙웰·GB: CPU와 GPU까지 통합해 AI 슈퍼컴퓨팅을 겨냥
- 앞으로의 키워드는 “AI 최적화 + 전력 효율”입니다.
반응형
'Tech' 카테고리의 다른 글
PCIe Relaxed Ordering과 Ordering Rules 정리, Ordering rule 표 읽는 법 (0) | 2025.08.22 |
---|---|
Spark급 AI 워크스테이션, 어떤 하드웨어가 있을까? 사양·가격 비교 (4) | 2025.08.16 |
엔비디아 DGX Spark 하드웨어 분석 — 가격, 사양, 활용 정리 (1) | 2025.08.16 |
[논문 리뷰] On-Device Training Under 256KB Memory — Tiny Training, 256KB 메모리로 AI 학습 (2) | 2025.08.09 |
AMD GPU 라인업 조사 정리 — MI100 부터 MI300X 까지, 그리고 MI308 (2) | 2025.08.08 |