这是AIE加速工业进化【AI+CAD的现状和未来】系列的第8篇,主要分析下比较核心的AI如何理解CAD模型的问题
过去两年,尽管很多Text2CAD类似的产品功能已经被推出,AI+CAD也在持续发展,但技术路线更多是让AI去操作CAD软件,这对于简单零件级模型的生成尚可,面对复杂模型时就面临了巨大的挑战。毕竟AI并没有像理解自然语言一样,真正理解CAD模型。
要实现生成式建模(不是一个零件,而是一个产品),可能基础是让AI真正理解CAD模型(当然并不是唯一路线,但是是看起来最有前景的路线),但这个过程远比想象的困难。如今大名鼎鼎的AI编程工具Cursor团队,创始人Michael Tun 和他的团队最初就是搞AI机械CAD的,但后来因为难度大才转向了AI编程。
本文主要来简单分析下为什么这么难。本文部分内容参考了CSDN博主“三条猫”的相关博文内容。
AI理解CAD模型,首先面对的问题是,CAD文件并不是开放的
不同于自然语言可以直接输入AI模型进行训练和理解,不同CAD软件有自己的文件格式,如SolidWorks的SLDPRT,CATIA的CATPart,NX的PRT,Creo的PRT等,虽然能通过一些通用格式转换,且对外部来说,其文件里的核心数据结构并不开放,对模型来说,这就是个黑盒。
当然,这不是很大的问题,通过一些技术或商业手段,还是可以拆解CAD文件的数据结构的并正确识别的,比如Tech Soft 3D推出的Hoops AI工具集。
但第二个问题紧跟着就来了,CAD文件的内容比文本、图像复杂的多。
以图像为例,本质是一块“2D 像素矩阵”。一张 1080p 图片,就是 1920×1080 的像素点,每个点的颜色可以用四个数字(ARGB)进行表示。AI 看图,就是在分析这些点的模式。
但CAD模型包含的内容就多了:
一个小小的机械零件,可能包含:
这是一个 数学+拓扑+语义 组成的“多维对象”。如果把图像比作一本涂色书,那么 CAD 模型就是一本工程教材,包含的信息复杂度大大提升。
这些信息不仅量大复杂,而且是离散的:
这意味着:模型不能像处理文字和图像那样简单的通过概率推理出下一个可能性。
这还没完。即便梳理和识别了这些内容让AI学习,也只是识别出了模型包含的显性信息,还有很多隐形信息没有体现。
一个是设计意图:
这些信息背后体现的是机械设计的一些经验、标准、强度要求等,这些隐形知识CAD文件本身并不包含,很多也不能通过大量的学习模糊推测出来,他们需要模型理解背后的:
另一个隐形的则是几何层面的相似性特征和作为一个产品本身的产品特征。
几何层面的特征如两个结构不同的梯子,我们能一眼看出来都是梯子,但在CAD文件里他们截然不同。
又如一个装配体,我们一看就知道它是泵,知道它的用途,它由哪些零部件构成,可能的一些技术要求是什么,甚至哪家供应商的产品跟这个类似,这些信息很多也隐含了一些设计要求,但CAD模型文件中也不会包含这些信息。
这就导致即便AI能正确读取CAD模型格式,也很难理解其背后对应的产品设计理念,即为什么这么画。而且这个过程很难通过大量数据集让AI隐形学会,因为要明确用哪些参数作为输入来训练模型都不容易。
此外,CAD的准确性要求也是文字、图像无法比拟的。
图像一只猫是圆一点还是长一点,AI 还能认,一些像素的变化也不影响对整个物品的识别。 但 CAD 模型小到 0.1mm 的尺寸差,就可能是完全不同的零件。一个 10mm 孔和一个 12mm 孔,在图像里几乎一样,在 CAD 里是两个完全不同的对象。
所以,要走向生成式设计,让AI彻底理解CAD模型,就得让模型理解:
.....
以上种种,难度可想而知。更别说,从实际角度,收集大规模设计模型文件本身就已经很困难。
所以在真正的生成式建模的道路看起来不复杂,实际上却是很多厂商放在最远期的计划。当然,很多机构也在探索各种绕开这个问题的方案,让我们期待相关的技术发展。
延伸阅读:
本文是【穿透工业软件云智化迷雾】专题中的小系列:【AI+CAD】系列的第8篇,本系列将通过以下9篇文章,梳理分析AI究竟给CAD带来哪些变化,未来将如何发展?
系列的目录如下,后续将每周持续更新,除以下9篇文章之外,还会有几篇3大国外厂商产品线盘点作为前置信息提供。