Z Waves｜3年干出280亿估值AI独角兽，前PyTorch负责人、复旦校友乔琳证明：技术务实是AI创业的最佳路径_社区互动

Z Waves｜3年干出280亿估值AI独角兽，前PyTorch负责人、复旦校友乔琳证明：技术务实是AI创业的最佳路径

创始人

2025-10-20 20:46:52

0次

乔琳的技术根基，始于复旦大学计算机科学专业的系统培养。本科与硕士阶段的深耕，让她吃透了计算机科学的底层逻辑；随后赴美深造，在加州大学圣巴巴拉分校（UC Santa Barbara）斩获计算机科学博士学位，更让她站上了全球AI科研的前沿阵地。这段横跨中外的学术经历，不仅赋予她扎实的理论功底，更培养了她“从科研到落地”的全局思维——这也成为她日后打破“技术实验室壁垒”的核心竞争力。

然而真正让乔琳跻身全球AI核心玩家行列的，是她在Meta主导PyTorch生态建设的经历。彼时，PyTorch尚是科研圈的小众工具，而乔琳带领300余人的工程团队，开启了一场“框架革命”：她主导重构PyTorch的底层架构，使其突破“仅能在实验室运行”的局限，成功适配Meta的数据中心、移动端及AR/VR设备，构建起从模型研发到生产部署的全链路平台。最终， PyTorch从“小众工具”蜕变为支撑全球数百万开发者的行业标杆，成为AI模型训练与推理的“基础设施”，而乔琳也因此成为全球AI框架生态的核心奠基人之一。

离开Meta后，乔琳选择以创业延续技术理想，创立Fireworks AI，将突破点瞄准了大模型推理的“效率痛点”。她带领团队研发的两大核心技术，直接击中行业关键瓶颈：其一，Fire Attention推理引擎通过无损量化压缩技术，在几乎不损失精度的前提下，将模型运行精度从16位降至8位甚至4位，让资源消耗大幅锐减；其二，推测执行引擎打破“逐字生成”的传统模式，通过一次预测多个词序列再反向验证，彻底突破推理速度瓶颈。这两项技术的叠加，让Llama、DeepSeek等主流开源模型的推理速度较行业标杆vLLM提升12倍，同时成本降低53%，为大模型的“普惠化”扫清了关键障碍。

图片来源：Fireworks

从Meta带出来的“改代码习惯”，像一把钥匙，打开了Fireworks AI进入行业的大门，让英伟达从最初的 A轮投资方，慢慢变成了既要合作又要警惕的竞争对手。而乔琳自己，从复旦大学机房里啃馒头改算法的姑娘，长成了AI推理服务赛道上，最懂“把复杂技术做简单 ”的华人女性创业者。

一、从PyTorch到Fireworks：24年技术生涯里的“问题清单”

乔琳的办公桌上，始终摆着一个磨破封面的笔记本。翻开第一页，是1995年复旦大学计算机系的课堂笔记，页眉处用红笔写着：“数据库索引能不能更轻？”再往后翻，2001年加州大学圣巴巴拉分校的博士论文草稿里，画着密密麻麻的“拆分箭头”——把大型计算任务拆成小节点分布式处理，导师当年笑称“像把大象拆成积木，却拼得更灵活”。

这本“问题清单”，记了24年。从IBM做研究员时记下“企业级AI服务成本太高”，到LinkedIn标注“用户数据与模型训练的矛盾”，再到Meta主导PyTorch框架开发时，贴满开发者的吐槽便签：“大模型好用但跑一次要花半个月预算”“开源模型便宜却调不通”。

图片来源：PyTorch

2019年某个深夜，乔琳在Meta的实验室里改代码到凌晨。一位初创公司的开发者抱着电脑找到她，眼圈通红：“我们想用PyTorch做电商推荐模型，可租不起GPU，跑一次数据就要花掉三个月经费。”那天她陪着对方坐了3小时，把原本100亿参数的模型拆成三个小模块，按用户行为分阶段调用算力，最后成本降了60%。开发者走时反复说：“要是能有现成的‘轻量+定制’服务就好了。”

这句话像颗种子，落在了“问题清单”的最后一页。2021年，乔琳翻完17本笔记，突然在白板上画了个交叉图：横轴是“开源/闭源”，纵轴是“轻量/定制”，交点处写着“Fireworks”，这一个个简短的关键词就是乔琳从始至终所追求的企业新定位——Fireworks应该同时具备开源的灵活性与闭源的易用性，并希望在以“轻量”为优势的同时，做到与其他模型相当的定制化。

图片来源：chatgpt

图片来源：fireworks

二、雷德伍德市的创业：不买服务器的“算力调度师”

2022年春天，乔琳带着六位Meta时期的老同事，在雷德伍德市租下一间小办公室。创业第一天，她没讲估值蓝图，而是把大家分成三组，每组认领一个从“问题清单”里抄来的痛点：“怎么整合闲置GPU”“怎么让API像点外卖一样简单”“怎么帮客户调模型不花钱”。

“别盯着参数做模型，要注重开发者的难处。”这是乔琳在公司成立大会上说的第一句话。她太清楚中小企业的困境——想做AI，却买不起英伟达服务器，更养不起顶尖算法团队。所以Fireworks AI从一开始就走了条“反常规”的路：不直接购买硬件，而是做“算力调度师”。

就像拼车软件整合私家车，乔琳团队把全球散落在科技公司、高校实验室的闲置GPU资源“拧成一股绳”。客户不用自己找服务器，只要通过Fireworks的API上传数据，就能直接调用这些整合后的算力。AI编程助手Cursor是最早的客户之一，创始人曾笑着说：“原本要花200万美元买服务器，现在用他们的API，每月只花15万，推理速度还快了3倍。”

图片来源：Fireworks

但真正让Fireworks AI站稳脚跟的，是乔琳藏在背后的“技术杀器”——FireAttention推理引擎。2023年夏天，一家医疗公司找过来，想把基因测序数据的AI分析成本再降30%。乔琳带着技术总监在办公室睡了两晚，给FireAttention加了个“动态参数开关”：根据基因数据的复杂度自动调整模型参数，不用从头跑130亿参数的大模型，80亿参数加专有数据微调，精度反而提升了2%，成本直接砍了一半。

“这就是我们的护城河。”乔琳指着测试报告说。那时Fireworks的年化营收ARR刚突破1亿美元，但80%的客户都在复购时追加了“微调服务”——比如Perplexity把70%的推理业务迁过来，只因FireAttention能让搜索响应快0.3秒；阿里Qwen团队用它做模型压缩，原本需要两周的调试，现在3天就能完成。

2023年11月14日凌晨两点，Fireworks AI的技术实验室突然爆发出一阵掌声。乔琳盯着监控屏上跳动的数字——自研的FireAttention推理引擎，将GPU算力利用率从行业平均的65%硬生生拽到了92%，这意味着客户的AI模型推理成本能直接砍半。不过在此之后，乔琳将企业的新方向转至 ——企业模型微调。

就是这个在算力突破当晚拍板的决定，让Fireworks AI在半年后估值冲刺40亿美元，吸引Lightspeed、Index等资本争相入局；也让英伟达从A轮投资方，悄悄将这家初创公司标为“重点关注竞争对手”。而站在白板前的乔琳，指尖还沾着马克笔的墨渍，恍惚间想起20年前在Meta调试PyTorch框架时，也是这样凭着一行代码的突破，推翻过既定的技术路线——这位从复旦机房走出来的华人女性，似乎总能在技术与市场的交叉点上，踩准改变命运的节拍。

三、当英伟达成为竞争对手，乔琳却微笑选择共赢——要一起把“蛋糕”做大

图片来源：Fireworks

2023年A轮融资时，英伟达的投资经理坐在乔琳对面，抛出一个尖锐的问题：“如果我们自己做推理服务，你们怎么办？”

乔琳没回避，递过去一份客户清单——上面全是医疗、金融行业的“小而精”需求：帮银行调信用评估模型，要符合合规要求；帮药厂做分子模拟，要适配特殊实验数据。“你们做的是算力水电网，我们做的是水电网上的‘定制水龙头’。”她指着清单上的微调需求，“这些活儿，巨头不愿做，小企业做不了，刚好是我们的位置。”

这句话让英伟达投了钱，也让双方的关系变得微妙。2024年3月，英伟达收购推理服务商Lepton，推出自己的GPU云市场，从硬件供应商直接变成了下游服务竞争者。消息传来那天，乔琳反而在团队例会上笑了：“这证明我们选的赛道对了。”

她早有准备。在Fireworks AI的技术路线图上，“反哺硬件优化”成了新方向——通过FireAttention引擎积累的千万次微调数据，反向给英伟达提GPU优化建议。比如针对金融模型的稀疏计算需求，他们和英伟达联合开发了专用算力调度插件，让GPU在处理这类任务时，效率再提15%。“竞争不是你死我活，是一起把蛋糕做大。”乔琳说。

这种“差异化共存”的智慧，藏在她的“问题清单”里。早在Meta时期，她就记下过：“巨头的优势在规模，我们的机会在细分。”如今Fireworks AI的客户里，有70%是英伟达云服务覆盖不到的中小企业，这些客户需要的不是“通用算力”，而是“懂行业的微调方案”——就像有家做AI教育的初创公司，用Fireworks的服务把题库模型调了12版，最终实现“学生错一道题，模型马上推同类考点”，这种定制化能力，正是英伟达暂时给不了的。

四、AI界的实干派，把“用不起”改成“用得好”

图片来源：Fireworks

在硅谷的华人AI创业者圈里，乔琳不算最张扬的。当别人忙着在行业论坛上讲“大模型参数竞赛”时，她在跑客户；当资本追着“通用AI”概念跑时，她在改FireAttention的代码。

“华人创业者的优势，从来不是跟风，是把技术‘磨’到落地。”乔琳想起刚到美国时，导师让她做一个分布式计算项目，她花了三个月，把一个复杂算法拆成20个小模块，每个模块的运行时间精确到毫秒。导师说：“你有把‘大象拆成积木’的耐心。”

这种耐心，现在成了Fireworks AI的标签。2024年，当公司估值冲向40亿美元，年化营收逼近3亿美元时，乔琳依旧把大部分时间泡在技术团队。有次为了修复一个API漏洞，她陪着工程师改代码到凌晨，饿了就像在复旦机房时那样，啃两口抽屉里的饼干。

“AI不是地壳式重组吗？重组的不是技术，是每个行业的做事方式。”乔琳在最新的“问题清单”上写下这句话。现在她的办公桌上，摆着两样东西：Meta时期的PyTorch代码本，和Fireworks AI客户的“微调需求清单”。前者记着“怎么把模型做轻”，后者写着“怎么把模型用对”。

当华人创业的AI公司估值总额超过300亿美元，乔琳知道，自己不是孤身一人。从Scale AI的 Alexandr Wang，到Pika的郭文景，华人创业者正在用“技术务实”改写AI行业的规则。而Fireworks AI的故事，更像一个缩影——不是靠概念造势，不是靠参数竞赛，而是把每个客户的“用不起”，改成“用得好”，一锤一锤凿出属于自己的护城河。

2024年深秋，乔琳在公司官网更新了slogan：“让每个企业都能‘用对’AI。”这句话的笔迹，和她1995年在复旦“问题清单”上写的“把每个算法都做轻”几乎一样——工整里带着点“轴”，就像她这个人：从江南小城到硅谷赛场，从改代码的姑娘到40亿独角兽的掌舵者，变的是舞台大小，不变的是那份“把复杂问题做简单”的初心。

在AI创业的热潮里，有人追风口，有人造泡沫，而乔琳用Fireworks AI证明：真正的独角兽，从来不是估值堆出来的，是像打磨FireAttention引擎那样，在技术与市场的缝隙里，把每个“痛点”磨成“亮点”，慢慢长出来的。

Reference

[1] 搜狐｜复旦才女创业AI推理，估值超5亿美元

[2]36氪｜288亿，复旦女学霸3年干出一个独角兽

[3]Google PyTorch

https://www.google.com.hk/search?q=pytorch&rlz=1C9BKJA_enHK1179HK1179&hl=zh-CN&sourceid=chrome-mobile&ie=UTF-8

[4]Google Fireworks

https://fireworks.ai/

[5]DeepTech深科技｜一年飙升7倍，复旦校友、前PyTorch负责人创办的AI云服务初创估值冲刺40亿美元

[7]头条｜当华人女性按下AI加速键：Fireworks AI与她的“独角兽”征程

Meta 推理 PyTorch 技术乔琳校友模型独角兽服务 Waves 复旦英伟达

上一篇：重磅！DeepSeek再开源：视觉即压缩，100个token干翻7000个

下一篇：原创李梓萌式AI技术伪造“行骗”早该打击！

Z Waves｜3年干出280亿估值AI独角兽，前PyTorch负责人、复旦校友乔琳证明：技术务实是AI创业的最佳路径

相关内容

热门资讯