반응형

2025/06/14 2

[논문 요약/리뷰] INF²: High Throughput Generative Inference of LLMs using Near-Storage

1. 주요 내용하드웨어: Samsung SmartSSD 사용 (KU15P Xilinx FPGA + SSD로 구성)소프트웨어: attention 연산을 SmartSSD에 offload하는 custom FPGA logic 개발시스템 설계: GPU + SmartSSD 협업을 조율하는 host-side runtime 설계📌 즉, 하드웨어 가속기와 소프트웨어 스케줄링을 결합한 end-to-end LLM Inference 최적화 솔루션2. 문제점 착안LLM 추론에서 다음과 같은 병목이 존재:문제점설명KV cache 크기 폭증context 길이 및 batch가 커질수록 K/V 행렬이 수십~수백 GB 이상GPU 메모리 부족모델 파라미터 + KV cache → GPU memory 감당 불가SSD로 offload 시 I..

Tech 2025.06.14

[AI 사주 활용법] ‘운세박사 GPT’로 1분 만에 내 사주, 신년운세 뽑는 법

이렇게 쉽게 공짜로 사주를 본다고?사주 보려면 무조건 철학관 가야 한다는 생각을 아직도 갖고 계신가요?최근 ChatGPT 스토어에 ‘운세박사 GPT’가 등장하면서, 생년월일만 알면 1분 안에 AI가 명리학 기반 리포트를 뽑아줍니다.직접 써보니 속도도 빠르고 결과도 제법 그럴듯했습니다. 오늘은 이 GPT를 이용해 사주 보는 과정을 정리해봤습니다. 1. ‘운세박사 GPT’란?세계 1위 AI 사주 GPT로 소개되며, ChatGPT 스토어 글로벌 순위 Top 5에 올랐습니다.전통 명리학(음양오행·천간지지)을 GPT-4o가 해석해 “올해 재물운”, “직장운”, “궁합”까지 풀어줍니다.웹·모바일 모두 무료 사용 가능(2025년 6월 기준)2. 준비물은 단 두 가지 ChatGPT 계정 (무료 플랜 가능) ..

AI & Automation 2025.06.14
반응형