从Brook到CUDA:Ian Buck的GPU革命传奇

在21世纪初的斯坦福大学计算机图形实验室,一位年轻的研究生正面对着一块块闪烁着像素光芒的显卡。他不是在渲染游戏画面,而是试图让这些原本只为视觉服务的硬件,变成能处理科学计算、物理模拟乃至未来人工智能的超级引擎。这个人,就是Ian Buck。2004年,他带着自己发明的Brook语言,走进位于加州圣克拉拉的英伟达总部,从此开启了一段改变计算历史的传奇之旅。

一切要从Brook说起

那是Ian Buck博士论文的核心——《图形硬件上的流计算》(Stream Computing on Graphics Hardware)。当时,GPU编程还停留在原始阶段:开发者必须用汇编语言或着色器语言(Shader),把算法硬塞进图形管线,分配纹理、构造三角形、调用OpenGL或DirectX API。普通程序员望而却步,只有顶尖图形专家才能勉强上阵。

Ian Buck看透了这个问题。他在斯坦福导师Pat Hanrahan的指导下,提出了**“流编程模型”**:把GPU抽象成一个流处理器(streaming co-processor),数据像河流一样流动,计算像流水线一样并行执行。

Brook语言的核心概念

Brook语言是这个模型的具象化。它是C语言的简单扩展,引入了三个核心概念:

  • streams(数据流):一个stream就像一个数组,但不是普通数组,而是"需要相同计算的一组记录"——比如粒子位置、像素值、矩阵元素
  • kernels(内核函数):程序员只需写一个kernel函数
  • reductions(归约操作):用于聚合计算结果

程序员只需写一个kernel函数,比如:

1
2
3
kernel void saxpy(float a, float4 x<>, float4 y<>, out float4 z<>) {
z = a * x + y;
}

然后调用它,GPU就会自动并行处理成千上万的数据元素。Brook还虚拟化了硬件限制:纹理大小、输出通道、内存布局,全都由编译器和运行时处理。

2004年,Brook在SIGGRAPH大会上正式亮相,论文《Brook for GPUs: Stream Computing on Graphics Hardware》轰动一时。它开源后,迅速吸引了上万用户,成为GPGPU(通用GPU计算)领域的第一道曙光。

斯坦福8K游戏怪兽:WireGL的诞生

Ian Buck的灵感并非凭空而来。他的故事要回溯到普林斯顿大学本科时代。1999年,他以Summa Cum Laude(最高荣誉)毕业于普林斯顿计算机系。本科论文《动画远程会议》(Animated Teleconferencing)就已展现出他对图形的痴迷:他用高速面部跟踪器、图像变形算法和分类器,在1/30秒内把真人视频转换成动画头像,实现实时远程对话。

这项工作让他意识到,图形硬件的潜力远不止"画图"。毕业后,他先在NVIDIA实习(2000-2001年),接触到GeForce系列GPU;随后在斯坦福,他大胆搭建了史上最早的**“8K游戏怪兽”**——用32张GeForce显卡并联成一个PC渲染集群。

WireGL:分布式图形渲染的黑科技

这个怪兽级setup,正是Ian Buck最早亲手打造的传奇硬件实验。他开发了WireGL:一个分布式网络图形驱动(Scalable Graphics System for Clusters),允许未修改的OpenGL游戏无缝运行在多台PC组成的集群上。

技术架构:

  • 每个节点一台PC、一张GeForce卡
  • 最高支持32个渲染节点
  • 通过"状态与几何体分桶"(state and geometry bucketing)
  • 软件上下文切换等黑科技

WireGL能把独立图形流合并成单一输出,或驱动巨型拼接显示墙。Ian Buck的目标极致:让经典射击游戏《Quake 3》和《Doom》在真正的8K分辨率下运行——不是简单的upscale,而是原生8192×水平像素的超高分辨率画面,铺满整个实验室墙壁或巨型tiled display。

那是2000年代初,GPU还只是游戏卡的时代,这个"8K游戏怪兽"耗费了他无数个通宵调试,却成为计算史上一个标志性时刻。

从游戏到通用计算的顿悟

初衷纯粹是图形极限挑战:推高帧率、画质,让玩家在超分辨率下体验沉浸式射击。但在反复测试过程中,Ian Buck意外发现:这些GeForce卡在非图形任务上的并行计算能力同样惊人!

矩阵乘法、物理模拟、光线追踪……GPU的流处理天赋远超CPU。这次"意外"如醍醐灌顶,让他彻底转向:GPU不再只是画图工具,而是通用流处理器!

WireGL的集群经验,直接奠定了Brook的流模型基础——数据像河流般流动,计算并行爆发。斯坦福期间,他还参与了《图形硬件上的光线追踪》(Ray Tracing on Programmable Graphics Hardware,SIGGRAPH 2002),证明GPU能做真实物理渲染。

更重要的是,他与导师一起探索**"Merrimac超级计算机"项目**——一个纯流架构的超级计算系统。这让Ian Buck坚信:未来计算不是CPU的天下,而是流处理器的时代。Brook正是他把这一理念从研究推向实用的桥梁。

从Brook到CUDA:NVIDIA的豪赌

2004年,NVIDIA的慧眼发现了这位天才。公司CEO Jensen Huang亲自邀请Ian Buck加入圣克拉拉总部。那一刻,他从学术象牙塔走进工业前沿。

NVIDIA给他的任务简单却宏大:把Brook原型变成一个商业级平台。Ian Buck与架构大师John Nickolls合作,从零开始打造CUDA(Compute Unified Device Architecture)。

他们保留了Brook的C-like语法和流模型,但做了革命性升级:

  • 统一内存架构(Unified Memory)
  • 线程块(Thread Block)
  • 共享内存(Shared Memory)
  • 原子操作

CUDA不再是"图形着色器的变种",而是一个完整的并行计算生态。

CUDA 1.0的诞生

2007年,CUDA 1.0正式发布。开发者只需几行代码,就能让GPU处理矩阵乘法、FFT变换、图像分割,甚至完整光线追踪。早期用户震惊了:同样的算法,GPU比CPU快7倍甚至更多。

Ian Buck回忆,那时团队只有**“两个人、两个库”**,却肩负着让GPU"服务每一个行业"的使命。公司内部曾有质疑——CUDA免费开放,NVIDIA连续亏损多年。但Jensen Huang力排众议,坚持"硬件兼容、软件开放"的战略。

正是这份坚持,让CUDA成为NVIDIA最坚固的护城河。

CUDA点燃AI革命

传奇从这里真正爆发。CUDA点燃了科学计算的火种:天体物理模拟、分子动力学、天气预报、金融建模……无数论文引用Brook/CUDA作为基础。

2010年代深度学习崛起时,CUDA已是天选之子:

  • AlexNet(2012)- ImageNet冠军
  • ResNet(2015)- 残差网络
  • Transformer(2017)- 注意力机制

所有大模型训练都离不开它。ChatGPT、Stable Diffusion、AlphaFold,这些改变世界的AI背后,都有Ian Buck亲手铸造的并行引擎。

今天,CUDA支持900多个库和框架,服务数百万开发者,从微软、谷歌、亚马逊到OpenAI、DeepSeek,无一例外。NVIDIA市值飙升至万亿美元级别,90%的AI计算市场份额,正是CUDA的功劳。

CUDA之父的今天

Ian Buck本人也从"CUDA之父"成长为NVIDIA副总裁兼Hyperscale & HPC业务总经理。他领导的团队负责全球数据中心业务,推动**“AI工厂”**概念:把整个云端变成一台巨型GPU计算机。

他在2025年GTC大会上,看着Jensen Huang keynote里那张老幻灯片——从"两个人、两个库"到如今覆盖全行业的软件栈——感慨万千:**“这是我最喜欢的一张幻灯片。”**那一刻,20年的坚持化作热泪。

他的传奇不止于技术。Ian Buck始终是桥梁:连接学术与工业、研究与应用。他在国会作证AI,在白宫献策,还亲自指导中国团队优化CUDA代码,赞叹**“DeepSeek是中国最优秀的CUDA开发者之一”**。

他从不居功,而是把荣誉归给整个生态——数百万程序员在CUDA社区迭代创新,才让GPU从游戏卡变成AI引擎。

结语:并行计算的黄金时代

回顾Ian Buck的旅程,从普林斯顿的动画实验,到斯坦福的Brook梦想与那台32卡8K游戏怪兽,再到NVIDIA的CUDA帝国,我们看到一个经典的创新者画像:他不是天纵奇才,而是对"并行"二字的痴迷者。

2000年代初,当别人还在为GPU渲染三角形争论时,他已用WireGL和32张GeForce卡亲手搭建8K游戏怪兽,看见数据流的未来;当CUDA亏损十年时,他坚信"让GPU为每个行业工作"的愿景终将实现。

今天,当AI浪潮席卷全球,我们或许该记住:这一切的起点,是一个叫Brook的C语言扩展,是一个叫Ian Buck的年轻人,在实验室里先用32张卡玩转8K Quake 3,再写下的第一行流代码。

Ian Buck的传奇仍在继续。他如今领导NVIDIA对抗AMD、Intel乃至新兴挑战者,守护CUDA生态,推出Dynamo推理平台、更多AI优化工具。未来,量子计算、神经形态芯片或许会崛起,但只要并行计算仍是主流,Ian Buck的名字就将镌刻在计算史册上。

从Brook到CUDA,从斯坦福8K游戏怪兽到万亿市值AI帝国,他不只是发明了一种语言或架构,而是开启了一个时代——一个GPU不再是"图形卡",而是"人工智能心脏"的时代。

真正的传奇,始于对现有技术的质疑,终于对未来的无畏拥抱。Ian Buck,用代码书写了传奇,也用传奇照亮了我们这个加速计算的黄金时代!


参考链接:

分享到