Tech 23

퀄컴이 다시 주목받는 이유 | 온디바이스(On Device) AI, 메모리 반도체 중요성 강화

퀄컴이 다시 주목받는 이유 최근 퀄컴이 다시 주목받는 이유는 단순한 스마트폰 AP 성능 경쟁 때문만은 아닙니다. 최근 시장은 퀄컴을 모바일 칩 공급업체로만 보지 않고, AI PC와 스마트폰을 포함한 온디바이스 AI 플랫폼 사업자로 다시 평가하고 있습니다. 퀄컴은 2025년 1월 Snapdragon X 시리즈를 600달러대 Copilot+ PC까지 확장하겠다고 밝혔고, 당시 기준으로 60개 이상 디자인이 생산 또는 개발 단계에 있으며 2026년까지 100개 이상으로 확대될 것이라고 설명했습니다. 이 부분이 중요한 이유는 분명합니다. 퀄컴의 역할이 특정 스마트폰용 칩 공급에 머무르지 않고, AI PC 생태계 확산과 직접 연결되기 시작했기 때문입니다. 즉, 최근의 퀄컴 이슈는 개별 제품 경쟁보다는 온디바이스..

Tech 2026.04.09

Apple Mac Studio 내부 구조 및 BOM 원가 요소 분석 /w Gemini

Apple Mac Studio 의 하드웨어 구성 요소와 BOM(Bill of Materials) 검토하기 위한 요약 자료를 정리해 봤습니다. 업무상 여러 DGX Spark, Mac Mini나 Studio 같은 시스템을 분석할 일이 있었습니다. 여러 Teardown 자료들을 참조했지만 이런 작업을 Gemini와 얼마나 편하게 잘 할 수 있을지 확인도 할 겸, 따로 한 번 더 해봤습니다. 가능한 읽기 쉽도록 모듈 단위로 분리된 구조도를 통해 내부 아키텍처와 주요 원가 요인을 직관적으로 파악할 수 있도록 작성해보려고 노력했습니다.1. 구조적 특징 (Structural Architecture)맥 스튜디오는 하위 라인업인 맥 미니(Mac mini)와 대비되는 다중 보드 아키텍처(Multi-board archit..

Tech 2026.04.07

[Paper Review] 알리바바(Alibaba)의 PolarStore: High-Performance Data Compressionfor Large-Scale Cloud-Native Databases — 클라우드 네이티브 DB의 저장 비용 감소

한줄 요약:소프트웨어의 유연성과 하드웨어의 효율성을 결합한 이중 레이어 압축으로 성능 저하 없이 DB 저장 비용을 60% 절감클라우드 네이티브 RDBMS 환경에서 컴퓨팅 자원은 탄력적으로 관리되지만, 저장 비용은 여전히 사용자에게 큰 부담이다. 데이터 압축은 가장 직관적인 해결책이지만, 소프트웨어 방식은 CPU 오버헤드와 복잡한 인덱스 관리 문제가 있고, 하드웨어 방식은 고정된 알고리즘과 입력 크기 때문에 유연성이 떨어진다는 치명적인 Trade-off가 존재한다. 알리바바가 FAST '25에서 발표한 PolarStore는 이 문제를 하드웨어와 소프트웨어의 Co-design으로 풀어냈다. 1. 이 내용이 중요한 이유클라우드 DB 사용자들에게 성능만큼 중요한 것이 비용이다. 특히 데이터가 방대해질수록 저장 ..

Tech 2026.03.20

[GTC 2026 Keynote 요약] 젠슨 황 키노트 핵심 — Vera Rubin, Groq 통합, 그리고 OpenClaw

2026년 엔비디아 GTC 기조연설에서 젠슨 황 CEO는 AI 인퍼런스(추론) 시대로의 완전한 전환과 에이전틱(Agentic) AI 인프라의 확장을 발표했습니다. 본 포스팅은 데이터센터 인프라, 반도체 아키텍처, 기업용 AI 자동화 관점에서 GTC 2026의 핵심 내용을 요약하여 정리했습니다. 참고로 제가 영상을 보고 정리한 내용은 아니고 Gemini 와 Notebooklm의 도움을 받아서 정리한 내용입니다. 1. AI 팩토리와 토큰 경제 (AI 인프라)- 엔비디아는 컴퓨팅 토큰을 새로운 형태의 상품이자 인공지능을 구성하는 기본 단위로 정의했습니다.참고 원문: "this is how intelligence is made a new kind of factory generator of tokens the..

Tech 2026.03.18

AI 시대를 연 OpenAI, Agentic AI 시대를 여는 OpenClaw — OpenAI가 OpenClaw 인수? 개발자 영입

최근 AI 업계에서 흥미로운 움직임이 하나 있었습니다. Sam Altman이 X(트위터)를 통해 OpenClaw 창시자인 Peter Steinberger가 OpenAI에 합류했다고 발표한 것입니다. 단순한 인재 영입처럼 보일 수도 있지만, 이 소식은 AI의 다음 단계를 생각해 볼 수 있는 움직임으로 볼 수 있습니다. OpenAI는 ChatGPT로 AI 시대를 열었고 OpenClaw가 본격적으로 Agentic AI를 예고하는 것 처럼 보이기 때문입니다.Sam Altman X: https://x.com/sama/status/2023150230905159801?s=20 X의 Sam Altman님(@sama)Peter Steinberger is joining OpenAI to drive the next gene..

Tech 2026.03.18

[Paper Study] From Minutes to Seconds: Redefining the Five-Minute Rule for AI-Era Memory Hierarchies

링크: https://arxiv.org/html/2511.03944v1 From Minutes to Seconds: Redefining the Five-Minute Rule for AI-Era Memory HierarchiesFor simplicity, we assume a single data access granularity lblkl_{\text{blk}}. Let NblkN_{\text{blk}} be the number of size-lblkl_{\text{blk}} blocks in the working set (hence total size Nblk⋅lblkN_{\text{blk}}\cdot l_{\text{blk}}). To capture the workloarxiv.org최근 AI sys..

Tech 2026.03.15

NVIDIA Rubin CPX 설명 — Inference Prefill/Deocode 분리를 통한 AI 추론 최적화 아키텍처, Inference 인프라 TCO( 최적화 가능할까?

https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context InferenceNVIDIA® today announced NVIDIA Rubin CPX, a new class of GPU purpose-built for massive-context processing. This enables AI systems to handle million-token software coding and generative video with ..

Tech 2025.11.29

Phison aiDAPTIV+ 알아보기 — AI Storage, SSD를 활용하여 AI 스토리지 병목을 푸는 지능형 미들웨어 및 솔루션

개요(Executive Summary)Phison aiDAPTIV+는 GPU·DRAM·NVMe SSD를 하나의 계층형 메모리 풀처럼 묶어, 고가의 HBM/VRAM 의존도를 낮추고 온프레미스에서 대형 LLM(예: Llama 2/3 70B)까지 다룰 수 있게 하는 하드웨어+소프트웨어 하이브리드 솔루션입니다. 실제 GTC 2024 현장에서 4×RTX 6000 Ada 워크스테이션으로 70B급 워크로드를 시연했습니다. 링크: https://www.tomshardware.com/pc-components/cpus/phisons-new-software-uses-ssds-and-dram-to-boost-effective-memory-for-ai-training-demos-a-single-workstation-runnin..

Tech 2025.09.17

PCIe Relaxed Ordering과 Ordering Rules 정리, Ordering rule 표 읽는 법

1. 기본 개념PCIe에서 전송되는 모든 Transaction Layer Packet(TLP)은 순서(Ordering) 규칙을 따릅니다.즉, 패킷이 도착하는 순서가 시스템 동작에 영향을 미치므로, 어떤 경우에는 엄격한 순서 유지(Strict Ordering) 가 필요하고, 어떤 경우에는 순서를 완화(Relaxed Ordering, RO) 해도 무방합니다.Strict Ordering (RO=0): 전송된 순서 그대로 도착·처리되어야 함Relaxed Ordering (RO=1): 특정 조건에서 순서를 바꿔도 무방함 → 성능 최적화 가능2. Relaxed Ordering이 필요한 이유PCIe는 고성능 인터커넥트이므로, 무조건 순서를 지키면 병목이 발생할 수 있습니다.특히 메모리 읽기/쓰기 요청에서 독립적인 트..

Tech 2025.08.22
반응형