Tech

짐 켈러 자서전 | 2024년 인터뷰 내용을 자서전 형식으로 재구성

Futureseed 2026. 7. 1. 01:04
반응형

짐 켈러가 몸담고 있는 Tenstorrent가 Qualcomm에 인수될 것으로 보입니다.

AMD, Apple, Intel, Tesla 등을 거치며 굵직한 결과물들을 만들어 낸 짐 켈러가 퀄컴에서도 뭔가를 만들어내지 않을까 싶습니다.

https://www.reuters.com/technology/qualcomm-talks-buy-tenstorrent-information-reports-2026-06-15/

 

최근 Qualcomm은 서버 시장으로도 진출 계획을 밝히고 있고, Edge에서도 Inference용 AI Chip을 강화하는 움직임을 가져가고 있습니다. 여기에 Tenstorrent의 Scalable한 NPU 구조가 매우 잘 활용될 수 있을 것 같다는 생각도 듭니다.

 

높은 Computing Resource가 필요한 SVR용 Chip에는 많은 NPU를 넣고, Edge 쪽으로는 적게 넣으면 되는데 어떻게 보면 당연하지만, 같은 구조로 Processing resource를 Scalable 하게 조정할 수 있는 것은 매우 큰 장점입니다.

 

평소 짐 켈러에 대해 알고는 있었고 관심도 조금은 있었지만, 잘 알지 못하는 것 같아서 찾아보다가 아래 인터뷰가 정리된 문서를 발견했습니다.

 

아쉽게도 자서전 형식으로 정리된 내용이 없어서, 아래 인터뷰를 ChatGPT를 시켜서 자서전 형식으로 재구성해 봤습니다. 요즘은 이렇게 제가 원하는 형식으로 AI를 통해 컨텐츠를 바꿔서 볼 수 있는 점이 참 좋다는 생각이 듭니다.

 

Computer History Museum의 2024년 Jim Keller Oral History Interview를 바탕으로, 실제 자서전은 아니지만 “정리된 자서전풍 1인칭 서사”로 재구성한 버전이며, 직접 인용이 아니라, 인터뷰 내용을 한국어로 압축·재배열한 것이니 참고하시길 바랍니다.

 

https://archive.computerhistory.org/resources/access/text/2024/10/102809019-05-01-acc.pdf


 

 나는 뉴저지에서 태어났다. 아버지는 GE Aerospace에서 일한 기계공학자였고, 위성을 설계했다. 집에는 여섯 명의 아이들이 있었고, 어머니는 대학 수석 졸업생이었지만 내가 어릴 때는 주로 아이들을 키웠다. 우리 집에는 책이 많았고, 부모님은 지적인 대화를 중요하게 여겼다. 아버지는 다리나 기계 구조를 보면 바로 그림으로 그려주며 왜 그렇게 동작하는지 설명해주곤 했다. 나는 읽기를 늦게 배웠다. 나중에 보면 Dyslexia(난독증)가 있었던 것 같지만, 부모님은 크게 걱정하지 않았다. 3~4학년쯤 갑자기 책을 읽을 수 있게 되었고, 그때부터 책은 내게 중요한 세계가 되었다.

 

 학교생활은 전형적인 모범생의 길과는 거리가 있었다. 고등학교 때는 성적도 B 정도였고, 뚜렷한 계획도 없었다. 사실 Penn State에 간 이유도 대단한 비전이 있어서가 아니었다. 좋아하던 여학생이 Penn State에 간다는 이야기가 있었고, 나도 지원했다. 상담교사는 MIT에 가보라고 했지만, Boston으로 가고 싶지 않았다. 직업별 초봉 목록을 보고 화학공학, 석유공학은 별로라고 생각했고, 기계공학과 전기공학 사이에서 거의 동전 던지기처럼 고민하다가 전기공학을 골랐다. 전기 기술자였던 할아버지에게 말했더니, 그는 “Power Factor를 조심해라”라고 했다. 그게 내가 공학에 들어간 이야기의 거의 전부였다.

 

 Penn State에서 나는 처음으로 진지하게 공부했다. 첫해에는 방황했지만, 이후 전기공학 과목에서는 Straight A를 받았다. 한때 철학에도 관심이 많아 복수전공을 하려 했지만, 글을 너무 못 써서 철학과 학위는 포기해야 했다. 대신 원하는 철학 수업은 계속 들었다. 전기공학에서는 반도체, 전자기학, Fortran, Logic Design을 배웠다. 전자기학은 멋졌지만 복잡했다. 반면 Logic Design은 매우 단순한 원리에서 거의 모든 것을 만들 수 있다는 점이 충격적이었다. 그 단순성에 끌렸다.

 

 첫 직장은 Harris였다. Florida에서 해변 가까이 살며 Surfing도 할 수 있을 것 같았고, Fiber Optics와 고속 Data 기록 관련 멋진 Computer Project가 있다고 들었다. 그런데 막상 입사해보니 나를 뽑은 Boss는 해고되어 있었고, 회사는 내가 왜 왔는지도 잘 몰랐다. 결국 나는 Test Equipment를 고치고, 동작하지 않는 Microprocessor Board를 고치고, High-frequency Board의 Ground Plane 문제를 잡는 일을 했다. 겉보기엔 잡일처럼 보였지만, 그 경험이 나를 Digital Equipment Corporation, 즉 DEC로 데려갔다. 실제 Hardware가 왜 동작하지 않는지 끝까지 추적하는 법을 배운 시기였다.

 

 DEC에는 EE Times 광고를 보고 지원했다. 나는 고주파 Clock Designer 자리에 지원했지만, 사실 그 분야를 많이 아는 것은 아니었다. 그래도 회사는 나를 뽑았다. 나는 VAX 8800 Group에 들어갔고, Cache Subsystem의 Logic Design을 맡았다. 처음에는 Computer Architecture도 Cache도 잘 몰랐다. 비행기에서 VAX Manual을 읽고 면접장에 들어가 질문을 쏟아냈다. 회사 사람들은 이상한 젊은이라고 생각했지만, 결국 나를 받아들였다. 그곳에서 Logic Design, Board Design, Electrical Design을 하면서 밤에는 Logic Simulator와 Timing Verifier를 직접 만들었다.

 

 DEC는 나에게 Architecture 101이었다. 처음에는 Computer가 수많은 부품의 조합처럼 보였다. 하지만 VAX 8800을 Debug하면서 Pipeline, Cache, Branch Mispredict, Instruction Decode, Microcode, Privilege Architecture가 실제로 어떻게 연결되는지 알게 되었다. Pete Bannon과 나는 Lab에서 거의 살다시피 하며 Machine을 Bring-up했고, Operating System Group에 들어간 초기 Machine들이 Crash하면 직접 추적했다. 이 과정에서 나는 Computer를 End-to-end로 이해하기 시작했다.

 

 그다음에는 Alpha로 갔다. Pete Bannon과 나는 EV5의 Co-architect가 되었고, Dirk Meyer와 나는 EV6를 Architect했다. EV5는 빠른 Chip이었지만, 나는 그 안의 실수를 너무 잘 알고 있어서 부끄러울 정도였다. EV6에서는 Out-of-order Execution이라는 더 큰 전환이 있었다. 당시에는 Compiler가 성능을 계속 끌어올릴 수 있다는 믿음과 Hardware가 더 많은 일을 해야 한다는 생각이 경쟁하고 있었다. 나는 결국 고성능 CPU에서는 Out-of-order가 길이라고 보게 되었다.

 

 EV6를 Tape-out한 뒤 Dirk Meyer는 AMD로 갔고, 나도 뒤따라갔다. AMD에서는 K7과 K8에 관여했다. K7은 우리가 DEC에서 만들었던 EV6와 닮은 부분이 있었고, K8에서는 x86을 더 Micro-op 중심으로 바꾸고 64-bit로 확장하는 일을 했다. 내 큰 기여 중 하나는 x86-64 Spec과 HyperTransport Spec의 주요 저자 중 한 명이었다는 점이다. 이 작업은 나중에 Opteron으로 이어졌다. 하지만 1999년 Startup 열풍 속에서 나는 AMD를 떠났다.

 

 이후 SiByte에 합류했다. MIPS 기반 Networking SoC를 만들었고, Gigabit Ethernet Controller, Memory Controller, Processor, Accelerator Function을 한 Chip 안에 넣었다. 우리는 수많은 Network Company와 이야기했고, Cisco의 Senior Engineer들이 사실상 Napkin Drawing으로 “이런 Processor를 만들면 우리가 사겠다”고 말했다. 작은 Team이었고, 매우 재미있었다. SiByte는 나중에 Broadcom에 인수되었다. 이때 나는 고객이 실제로 원하는 System이 무엇인지, 너무 적게 넣으면 못 쓰고 너무 많이 넣으면 비싸서 못 파는 Embedded Business의 Sweet Spot을 배웠다.

 

 P.A. Semi는 SiByte의 Reboot 같은 회사였다. PowerPC Architecture License를 받아 더 강력하고 저전력인 Processor를 만들려 했다. Network Processor로도 쓸 수 있고, Standalone Processor로도 쓸 수 있는 구조였다. 목표는 단순히 빠른 것이 아니라 System 안에서 Deploy 가능한 Power Point를 맞추는 것이었다. 우리는 Chip을 Tape-out했고, 그 회사는 Apple에 인수되었다.

 

 Apple에서 나는 완전히 다른 문화를 경험했다. Apple은 Bottom-up Engineering Culture라기보다 “우리가 만들고 싶은 Product가 있고, 그걸 위해 모든 걸 한다”는 회사였다. 처음 iPhone Chip은 ARM IP, Memory Controller, Bus 같은 IP를 Spreadsheet에 나열하고 Samsung이 조합한 수준에 가까웠다. 성능과 Memory Latency는 좋지 않았지만, Software Team이 OS X를 줄이고 최적화해 iPhone에서 돌아가게 만들었다. 이후 우리는 H2, H3, H4, H5, H6로 이어지는 Chip을 만들었다. H4에서는 큰 GPU를 넣었고, H5에서는 P.A. Semi Team이 Swift Processor를 냈고, H6에서는 Gerard Williams와 함께 Apple이 이후 계속 발전시킨 큰 Out-of-order Core의 기반을 만들었다.

 

 Apple에서 배운 핵심은 Product와 Silicon이 함께 진화할 때 생기는 힘이었다. Apple은 Qualcomm이나 Nvidia에서 Chip을 사는 대신 Samsung, 나중에는 TSMC에서 Wafer를 직접 샀다. 중간 Margin Stack이 없었기 때문에 같은 Cost 안에서 더 많은 Transistor를 쓸 수 있었다. Apple은 자신들이 원하는 Camera, Display, GPU, UI 경험을 명확히 알고 있었고, 그래서 평균적인 범용 Chip이 아니라 Product에 맞춘 전용 Silicon을 만들 수 있었다.

Apple을 떠난 이유는 Steve Jobs와 Mike Culbert가 세상을 떠난 뒤, 회사가 달라질 것이라고 느꼈기 때문이다. 나는 Apple에서 배울 만큼 배웠다고 생각했고, 이제 그 방식을 다른 곳에서 시험해보고 싶었다. 그래서 다시 AMD로 갔다. 당시 AMD는 실패하고 있었다. Rory Read는 “나는 Business를 하고, 당신은 Technology를 해라. 돈이 떨어지지 않게 할 테니 Chip을 만들어달라”고 말했다. AMD Server Share는 Opteron 시절 35%까지 갔다가 4% 수준으로 떨어져 있었다. 내 판단은 단순했다. Product가 나빴고, 아무도 사고 싶어 하지 않았다.

 

 Zen은 다시 세우는 작업이었다. 문제는 Process만이 아니었다. Methodology도 나빴고, Team Organization도 나빴고, Architecture도 나빴다. 사람들은 Intel보다 Process가 뒤처져서 못 이긴다고 했지만, 나는 IPC가 Intel의 절반 수준이면 Process를 탓할 수 없다고 봤다. 그래서 목표를 다시 잡았다. Core Area, Power, Frequency, IPC 같은 Bounding Box를 정하고, Gap을 “못 하는 이유”가 아니라 “풀어야 할 문제”로 바꿨다. 기존 Roadmap을 거의 취소하고 Zen에 집중했다. 결국 4년이 걸렸다.

 

 그다음은 Tesla였다. 처음에는 “자동차 회사에서 내가 뭘 하지?”라고 생각했다. 그런데 Tesla 사람들은 Car가 Computing Platform이 될 것이라고 말했다. 나는 조사해보니 Autopilot Hardware가 필요하다는 걸 알았고, Elon Musk에게 18개월 안에 자동차를 운전할 Computer Chip을 만들 수 있다고 말했다. 그는 사실상 “좋다”고 했다. 우리는 Samsung에서 Chip을 만들었고, 실제로 14개월 만에 Tape-out하고, Fab 4개월, Software Bring-up 2개월 뒤 차를 운전했다.

 

 Tesla Hardware 3의 핵심은 AI Engine과 단순한 Compiler 방향이었다. Pete Bannon은 당시 AI Framework였던 CAFE의 Op와 Data를 거의 그대로 Instruction처럼 실행하면 어떻겠냐는 아이디어를 냈다. 우리는 CAFE가 생각하는 Data Access에 맞게 Memory Subsystem을 만들었고, 그 결과 Compiler가 매우 단순해졌다. 남들은 AI Compiler를 위해 수백 명을 고용하려 했지만, Pete는 거의 혼자 Compiler를 썼다. Hardware 3는 약 5년 동안 Tesla Autopilot Chip으로 Shipping되었다.

 

 Elon에게서 배운 것은 Solution-first 사고였다. 많은 회사에서는 문제와 Data를 설명하고 마지막에 Solution을 보여준다. Elon은 “Solution이 18 Page에 있으면 18 Page부터 시작하라”고 했다. 그는 Chip Expert는 아니었지만 Physics, Mechanical Engineering, Visualization에 강했고, First Principles를 말할 때 정말 원자 수준까지 내려갔다. 나는 그에게서 많은 것을 배웠지만, Tesla의 큰 Step 방식과 내가 선호하는 지속적인 Cadence 방식은 달랐다. Hardware 3 이후 나는 새로운 흥분을 원했고 Intel로 갔다.

 

 Intel은 규모가 달랐다. AMD에서 내 Team은 2,500명, Tesla에서는 400~500명 정도였지만, Intel에서는 10,000명 규모였다. Client, Server, Networking 등 범위는 거대했다. 하지만 많은 Technology가 오래된 CAD Tool과 Design Flow에 묶여 있었다. IP Team, SoC Team, CPU Team으로 나뉘어 있었지만 완전히 Refactor된 구조는 아니었다. 나는 CAD Tool Flow와 조직 구조를 고치려 했고, Bare Metal Flow 같은 접근도 도입했다. 그러나 CEO의 관점과 내 Engineering Reset의 관점은 충분히 맞지 않았다. 큰 회사에서 CEO와 방향이 다르면 원하는 만큼 바꾸기 어렵다는 것을 배웠다.

 

 그래서 Tenstorrent로 갔다. 나는 원래 Tenstorrent의 Angel Investor였고, Tesla에서 AI Technology의 중요성을 봤다. Tenstorrent에서는 AI Processor, AI Software, CPU를 모두 설계하려 한다. AI Stack은 단순하지 않다. PyTorch 수준의 Model이 바로 Chip에서 빠르게 도는 것이 아니라, 여러 단계의 Translation을 거쳐야 한다. High-level의 빠르게 변하는 AI Idea를 Low-level의 High-performance Computing으로 바꾸는 것이 핵심 문제다.

 

 Tenstorrent의 방향은 General-purpose AI Computing이다. 기본은 Tensor Processor이고, RISC-V Processor들이 Software Stack의 한 Layer를 해석하고 Tensor Processor에 Operation을 Feed하며, Processor 사이 Data Movement를 관리한다. 나는 AI를 위해 작은 RISC-V부터 큰 RISC-V까지 모두 필요하다고 본다. RISC-V 생태계에는 Low-end와 Mid-range는 있었지만, Wide Out-of-order High-end RISC-V Processor는 부족했다. 그래서 Tenstorrent는 AI Engine뿐 아니라 High-end RISC-V CPU도 만들려 한다.

 

 CEO가 된 지금, 나는 Tenstorrent를 단순 Chip Company가 아니라 Design Company로 본다. 우리는 AI Processor, AI Software, CPU, Chip, System을 모두 설계한다. Startup은 처음에는 큰 Idea를 믿게 만드는 단계에서 시작해, Research, Engineering, Product, Customer, Production 중심 회사로 변해간다. Tenstorrent는 이제 Product Company로 가는 단계다. Nvidia 같은 Incumbent가 모든 고객을 볼 수는 없다. 100만 Dollar Customer라도 10개면 1,000만 Dollar Business가 된다. 새로운 AI는 Data Center의 초대형 시장뿐 아니라 장비, 연구소, 작은 Data Center, 자체 Chip을 만들려는 회사들로 퍼질 것이다.

 

 내 삶을 돌아보면, 나는 한 회사에 오래 머물며 승진한 사람이 아니다. Harris에서 고장 난 Board를 고쳤고, DEC에서 Computer Architecture를 배웠고, AMD에서 x86-64와 Zen을 만들었고, SiByte와 P.A. Semi에서 고객과 System을 배웠고, Apple에서 Product-driven Silicon을 배웠고, Tesla에서 AI Chip을 매우 빠르게 만들었고, Intel에서 거대 조직의 한계를 봤고, Tenstorrent에서 AI Compute의 다음 구조를 만들고 있다.

 

 나는 아직도 많이 읽는다. 사람들에게 어떤 책을 읽어야 하냐는 질문을 받으면, 사실상 “전부 읽어라”고 생각한다. 좋은 책 하나도 100권의 맥락 속에서 읽으면 완전히 다른 책이 된다. Management도 책으로 배웠다. AMD에서 큰 Team을 맡기 전 Management Book을 20권쯤 읽었고, 실제로 해보니 놀랍게도 많은 것이 작동했다. 나는 여러 CEO와 Leader에게 배웠다. Bob Mansfield, Doug Field, Elon Musk 모두 달랐다. 하지만 결국 나는 내 방식으로 해야 한다. 나는 Force of Nature라기보다, 사람을 Enable하고 Gap을 메우는 사람에 가깝다.


 Jim Keller의 인생은 실무 경험과 능력을 바탕으로 “Hardware Debugger가 System Architect가 되고, 다시 Product Architect와 AI Compute CEO가 된 경로”입니다. 이 사람의 강점은 단순히 CPU를 잘 아는 것이 아니라, 문제를 Abstraction Layer별로 쪼개고, 성능·전력·Tool·Team·Customer를 하나의 System으로 다시 묶는 능력입니다.


 퀄컴으로 옮긴 뒤 짐 켈러가 어떤것을 만들어내는지 상당히 기대가 됩니다. 그리고 이번에도 짐 켈러가 보는 미래가 맞을지 궁금하기도 한데, 왠지 맞을 것 같습니다.

반응형