Z Waves|3年干出280亿估值AI独角兽,前PyTorch负责人、复旦校友乔琳证明:技术务实是AI创业的最佳路径
创始人
2025-10-20 20:46:52
0

乔琳的技术根基,始于复旦大学计算机科学专业的系统培养。本科与硕士阶段的深耕,让她吃透了计算机科学的底层逻辑;随后赴美深造,在加州大学圣巴巴拉分校(UC Santa Barbara)斩获计算机科学博士学位,更让她站上了全球AI科研的前沿阵地。这段横跨中外的学术经历,不仅赋予她扎实的理论功底,更培养了她从科研到落地的全局思维——这也成为她日后打破技术实验室壁垒的核心竞争力。

然而真正让乔琳跻身全球AI核心玩家行列的,是她在Meta主导PyTorch生态建设的经历。 彼时,PyTorch尚是科研圈的小众工具,而乔琳带领300余人的工程团队,开启了一场框架革命:她主导重构PyTorch的底层架构,使其突破仅能在实验室运行的局限,成功适配Meta的数据中心、移动端及AR/VR设备,构建起从模型研发到生产部署的全链路平台。最终, PyTorch小众工具蜕变为支撑全球数百万开发者的行业标杆,成为AI模型训练与推理的基础设施,而乔琳也因此成为全球AI框架生态的核心奠基人之一。

离开Meta后,乔琳选择以创业延续技术理想,创立Fireworks AI,将突破点瞄准了大模型推理的效率痛点。她带领团队研发的两大核心技术,直接击中行业关键瓶颈:其一,Fire Attention推理引擎通过无损量化压缩技术,在几乎不损失精度的前提下,将模型运行精度从16位降至8位甚至4位,让资源消耗大幅锐减;其二,推测执行引擎打破逐字生成的传统模式,通过一次预测多个词序列再反向验证,彻底突破推理速度瓶颈。 这两项技术的叠加,让LlamaDeepSeek等主流开源模型的推理速度较行业标杆vLLM提升12倍,同时成本降低53%,为大模型的普惠化扫清了关键障碍。

图片来源:Fireworks

Meta带出来的改代码习惯,像一把钥匙,打开了Fireworks AI进入行业的大门让英伟达从最初的 A轮投资方,慢慢变成了既要合作又要警惕的竞争对手。而乔琳自己,从复旦大学机房里啃馒头改算法的姑娘,长成了AI推理服务赛道上,最懂把复 技术做简单 的华人女性创业者。

一、从PyTorchFireworks24年技术生涯里的问题清单

乔琳的办公桌上,始终摆着一个磨破封面的笔记本。翻开第一页,是1995年复旦大学计算机系的课堂笔记,页眉处用红笔写着:数据库索引能不能更轻?再往后翻,2001年加州大学圣巴巴拉分校的博士论文草稿里,画着密密麻麻的拆分箭头”——把大型计算任务拆成小节点分布式处理,导师当年笑称像把大象拆成积木,却拼得更灵活

这本问题清单,记了24年。IBM做研究员时记下企业级AI服务成本太高,到LinkedIn标注用户数据与模型训练的矛盾,再到Meta主导PyTorch框架开发时,贴满开发者的吐槽便签大模型好用但跑一次要花半个月预算”“开源模型便宜却调不通

图片来源:PyTorch

2019年某个深夜,乔琳在Meta的实验室里改代码到凌晨。一位初创公司的开发者抱着电脑找到她,眼圈通红:我们想用PyTorch做电商推荐模型,可租不起GPU,跑一次数据就要花掉三个月经费。那天她陪着对方坐了3小时,把原本100亿参数的模型拆成三个小模块,按用户行为分阶段调用算力,最后成本降了60%。开发者走时反复说:要是能有现成的轻量+定制服务就好了。

这句话像颗种子,落在了问题清单的最后一页。2021年,乔琳翻完17本笔记,突然在白板上画了个交叉图:横轴是开源/闭源,纵轴是轻量/定制,交点处写着“Fireworks”,这一个个简短的关键词就是乔琳从始至终所追求的企业新定位——Fireworks应该同时具备开源的灵活性与闭源的易用性,并希望在以轻量为优势的同时,做到与其他模型相当的定制化。

图片来源:chatgpt

图片来源:fireworks

二、雷德伍德市的创业:不买服务器的算力调度师

2022年春天,乔琳带着六位Meta时期的老同事,在雷德伍德市租下一间小办公室。创业第一天,她没讲估值蓝图,而是把大家分成三组,每组认领一个从问题清单里抄来的痛点:怎么整合闲置GPU”“怎么让API像点外卖一样简单”“怎么帮客户调模型不花钱

别盯着参数做模型,要注重开发者的难处。是乔琳在公司成立大会上说的第一句话。她太清楚中小企业的困境——想做AI,却买不起英伟达服务器,更养不起顶尖算法团队。所以Fireworks AI从一开始就走了条反常规的路:不直接购买硬件,而是做算力调度师

就像拼车软件整合私家车,乔琳团队把全球散落在科技公司、高校实验室的闲置GPU资源拧成一股绳。客户不用自己找服务器,只要通过FireworksAPI上传数据,就能直接调用这些整合后的算力。AI编程助手Cursor是最早的客户之一,创始人曾笑着说:原本要花200万美元买服务器,现在用他们的API,每月只花15万,推理速度还快了3倍。

图片来源:Fireworks

但真正让Fireworks AI站稳脚跟的,是乔琳藏在背后的技术杀器”——FireAttention推理引擎。2023年夏天,一家医疗公司找过来,想把基因测序数据的AI分析成本再降30%。乔琳带着技术总监在办公室睡了两晚,给FireAttention加了个动态参数开关:根据基因数据的复杂度自动调整模型参数,不用从头跑130亿参数的大模型,80亿参数加专有数据微调,精度反而提升了2%,成本直接砍了一半。

这就是我们的护城河。乔琳指着测试报告说。那时Fireworks的年化营收ARR刚突破1亿美元,但80%的客户都在复购时追加了微调服务”——比如Perplexity70%的推理业务迁过来,只因FireAttention能让搜索响应快0.3秒;阿里Qwen团队用它做模型压缩,原本需要两周的调试,现在3天就能完成。

20231114日凌晨两点,Fireworks AI的技术实验室突然爆发出一阵掌声。 乔琳盯着监控屏上跳动的数字——自研的FireAttention推理引擎,GPU算力利用率从行业平均的65%硬生生拽到了92%这意味着客户的AI模型推理成本能直接砍半。不过在此之后,乔琳将企业的新方向转至 ——企业模型微调。

就是这个在算力突破当晚拍板的决定,让Fireworks AI在半年后估值冲刺40亿美元,吸引LightspeedIndex等资本争相入局;也让英伟达从A轮投资方,悄悄将这家初创公司标为重点关注竞争对手。而站在白板前的乔琳,指尖还沾着马克笔的墨渍,恍惚间想起20年前在Meta调试PyTorch框架时,也是这样凭着一行代码的突破,推翻过既定的技术路线——这位从复旦机房走出来的华人女性,似乎总能在技术与市场的交叉点上,踩准改变命运的节拍。

三、当英伟达成为竞争对手,乔琳却微笑选择共赢——要一起把蛋糕做大

图片来源:Fireworks

2023A轮融资时,英伟达的投资经理坐在乔琳对面,抛出一个尖锐的问题:如果我们自己做推理服务,你们怎么办?

乔琳没回避,递过去一份客户清单——上面全是医疗、金融行业的小而精需求:帮银行调信用评估模型,要符合合规要求;帮药厂做分子模拟,要适配特殊实验数据。你们做的是算力水电网,我们做的是水电网上的定制水龙头她指着清单上的微调需求,这些活儿,巨头不愿做,小企业做不了,刚好是我们的位置。

这句话让英伟达投了钱,也让双方的关系变得微妙 20243月,英伟达收购推理服务商Lepton,推出自己的GPU云市场,从硬件供应商直接变成了下游服务竞争者。消息传来那天,乔琳反而在团队例会上笑了:这证明我们选的赛道对了。

她早有准备。在Fireworks AI的技术路线图上,反哺硬件优化成了新方向——通过FireAttention引擎积累的千万次微调数据,反向给英伟达提GPU优化建议。比如针对金融模型的稀疏计算需求,他们和英伟达联合开发了专用算力调度插件,让GPU在处理这类任务时,效率再提15%竞争不是你死我活,是一起把蛋糕做大。乔琳说。

这种差异化共存的智慧,藏在她的问题清单里。早在Meta时期,她就记下过:巨头的优势在规模,我们的机会在细分。如今Fireworks AI的客户里,有70%是英伟达云服务覆盖不到的中小企业,这些客户需要的不是通用算力,而是懂行业的微调方案”——就像有家做AI教育的初创公司,用Fireworks的服务把题库模型调了12版,最终实现学生错一道题,模型马上推同类考点,这种定制化能力,正是英伟达暂时给不了的。

四、AI界的实干派,把用不起改成用得好

图片来源:Fireworks

在硅谷的华人AI创业者圈里,乔琳不算最张扬的。当别人忙着在行业论坛上讲大模型参数竞赛时,她在跑客户;当资本追着通用AI”概念跑时,她在改FireAttention的代码。

华人创业者的优势,从来不是跟风,是把技术到落地。乔琳想起刚到美国时,导师让她做一个分布式计算项目,她花了三个月,把一个复杂算法拆成20个小模块,每个模块的运行时间精确到毫秒。导师说:你有把大象拆成积木的耐心。

这种耐心,现在成了Fireworks AI的标签。2024年,当公司估值冲向40亿美元,年化营收逼近3亿美元时,乔琳依旧把大部分时间泡在技术团队。有次为了修复一个API漏洞,她陪着工程师改代码到凌晨,饿了就像在复旦机房时那样,啃两口抽屉里的饼干。

“AI不是地壳式重组吗?重组的不是技术,是每个行业的做事方式。乔琳在最新的问题清单上写下这句话。现在她的办公桌上,摆着两样东西:Meta时期的PyTorch代码本,和Fireworks AI客户的微调需求清单前者记着怎么把模型做轻,后者写着怎么把模型用对

当华人创业的AI公司估值总额超过300亿美元,乔琳知道,自己不是孤身一人。从Scale AIAlexandr Wang,到Pika的郭文景,华人创业者正在用技术务实改写AI行业的规则。Fireworks AI的故事,更像一个缩影——不是靠概念造势,不是靠参数竞赛,而是把每个客户的用不起,改成用得好,一锤一锤凿出属于自己的护城河。

2024年深秋,乔琳在公司官网更新了slogan让每个企业都能用对’AI这句话的笔迹,和她1995年在复旦问题清单上写的把每个算法都做轻几乎一样——工整里带着点,就像她这个人:从江南小城到硅谷赛场,从改代码的姑娘到40亿独角兽的掌舵者,变的是舞台大小,不变的是那份把复杂问题做简单的初心。

AI创业的热潮里,有人追风口,有人造泡沫,而乔琳用Fireworks AI证明:真正的独角兽,从来不是估值堆出来的,是像打磨FireAttention引擎那样,在技术与市场的缝隙里,把每个痛点磨成亮点,慢慢长出来的。

Reference

[1] 搜狐|复旦才女创业AI推理,估值超5亿美元

[2]36氪|288亿,复旦女学霸3年干出一个独角兽

[3]Google PyTorch

https://www.google.com.hk/search?q=pytorch&rlz=1C9BKJA_enHK1179HK1179&hl=zh-CN&sourceid=chrome-mobile&ie=UTF-8

[4]Google Fireworks

https://fireworks.ai/

[5]DeepTech深科技|一年飙升7倍,复旦校友、前PyTorch负责人创办的AI云服务初创估值冲刺40亿美元

[7]头条|当华人女性按下AI加速键:Fireworks AI与她的独角兽征程

相关内容