Tech

NVIDIA SCADA(SCaled Accelerated Data Access) 관련 내용 정리, 차세대 Data Access 기술, NVIDI

Futureseed 2025. 6. 2. 13:57
반응형

1. SCADA(SCaled Accelerated Data Access)란?

SCADA는 기존의 산업제어 시스템을 의미하는 SCADA(Supervisory Control and Data Acquisition)와는 다릅니다. 여기서 말하는 SCADA는 NVIDIA가 2024년 하반기 Open Compute Project(OCP) 및 GTC 등에서 공식적으로 발표한 새로운 프로그래밍 모델이자, GPU가 대규모 데이터셋을 직접, 병렬, 고속으로 접근할 수 있게 해주는 차세대 데이터 액세스 기술을 뜻합니다.

이 기술은 초대형 AI·그래프·분석 데이터셋이 GPU 메모리 한계를 넘어서는 시대에, GPU가 직접 NVMe 등 스토리지에 On-demand 로 접근해 필요한 데이터를 실시간으로 불러오고 처리할 수 있도록 설계되었습니다.


2. 핵심 기술 및 구조 - 핵심 기술 요약

GPU Centric 데이터 접근
GPU 스레드(수십~수백만 개)가 직접 스토리지에 load/store 방식으로 데이터 요청. CPU 개입 최소화.

단일 API, 무한 확장성
데이터 크기·시스템 규모와 무관하게 동일한 API로 데이터 접근. 10TB 이상 데이터도 단일 노드에서 처리.

Tiered(계층화) Storage 및 Caching
GPU 내부 Cache와 Server Cache를 계층적으로 활용. Cache miss 시 Server에서 DMA로 데이터 전송.

Serverless Abstraction
개발자는 데이터의 위치, 분산, 샤딩, 포맷 등을 신경 쓸 필요 없이, "데이터만 요청"하면 SCADA가 자동으로 최적화.

고성능, 대량 동시 요청 처리
대규모 그래프 분석, GNN 학습 등에서 수십만 스레드가 동시에 데이터에 접근 가능.

계층설명
User ViewApplication에서 Object 단위로 Data Request, GPU Cache 활용
Tiered ViewSCADA가 Data Tiering/Orchestration, Caching/Prefetching 자동화
Backing Storage실제 데이터 Storage(NVMe SSD 등), Server가 DMA로 GPU에 Data 전송

 


3. 어디서, 언제, 어떻게 발표됐나?
 
2024년 10월 24일 Open Compute Project(OCP) Summit에서 NVIDIA의 Distinguished Engineer Cj Newburn과 Vikram Sharma Mailthody가 공식적으로 SCADA(Scaled Accelerated Data Access) 프로그래밍 모델을 발표함.

발표에서 "GPU를 데이터 액세스 엔진으로 진화시키는 새로운 패러다임"을 제시하며, 차세대 AI·그래프·분석 워크로드의 데이터 병목 문제를 해결할 솔루션으로 SCADA를 소개함.

이후 GTC 2025 등 주요 컨퍼런스에서 관련 기술과 로드맵이 추가 공개됨.


4. 미래 로드맵 및 전망
 
단기:
SCADA 프로토타입 및 개발자 프리뷰 공개, NVIDIA Blackwell GPU 및 차세대 데이터센터 플랫폼에 우선 적용.

중기:
주요 스토리지 벤더(DDN, Dell, NetApp 등)와 협력해 SCADA 호환 스토리지 생태계 확장, 대규모 AI/그래프 분석/생성 AI 등 실전 워크로드에 적용.

장기:
Rubin Ultra 등 차세대 GPU·DPU·네트워킹과 통합, 포토닉스(광네트워크) 등 혁신 기술과 연계해 초대형 AI 팩토리, 실시간 디지털 트윈, 자율공장 등 미래형 인프라의 표준 기술로 자리매김할 전망.
 


5. 주요·핵심 기술 요약
 
GPU-Centric 데이터 액세스:
GPU가 직접 스토리지에 접근, 대규모 데이터셋을 실시간으로 처리.

단일 API 및 Serverless Abstraction:
데이터 위치·분산·포맷 신경 쓸 필요 없는 고수준 추상화.

계층적 캐싱 및 데이터 오케스트레이션:
GPU 내부·서버 캐시, 프리페칭 등으로 데이터 접근 최적화.

대규모 동시 요청 처리:
수십만~수백만 스레드가 병렬로 데이터 요청, 그래프/GNN/AI 워크로드에 최적.

Storage-Compute 통합:
NVMe, 차세대 네트워킹, DPU 등과 통합해 초고속 데이터 전송 실현.
 


6. 한 줄 요약
NVIDIA SCADA(Scaled Accelerated Data Access)는 GPU가 초대형 데이터셋을 직접, 병렬, 고속으로 접근·처리할 수 있게 해주는 차세대 프로그래밍 모델이자 데이터 액세스 기술로, 2024년 OCP에서 첫 공개됐으며, AI·그래프·분석 등 데이터 중심 미래 인프라의 핵심 표준으로 빠르게 확산될 전망입니다.
 
핵심 구조


출처
OCP 발표: https://www.youtube.com/watch?time_continue=14&v=OZloQQZGmQQ&embeds_referring_euri=https%3A%2F%2Fwww.perplexity.ai%2F&embeds_referring_origin=https%3A%2F%2Fwww.perplexity.ai&source_ve_path=Mjg2NjQsMjg2NjY

 
FMS 발표: https://files.futurememorystorage.com/proceedings/2024/20240808_NETC-301-1_Newburn.pdf

 
 

반응형