克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
央企通信巨头,牵头搞起了一个开源社区?
而且模型、数据等各种资源应有尽有,还有学习资料和交流空间。
这个社区,就是由中国电信天翼云牵头发起的魔乐社区(Modelers.cn)。
魔乐社区不只有在线平台,还在线下正式成立了理事会,对社区进行管理建设。
而且理事会刚成立就目标宏大,不仅要提供开源资源,更要覆盖串联起AI的全产业链。
央企牵头,魔乐社区理事会正式成立
魔乐社区是一个人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台,能够帮助每一位开发者学习获取领先的AI技术。
理事会是魔乐社区的管理机构,由全产业链共同建设、共同运营、共同享有,负责把控社区的发展方向、制定长期规划,并对具体业务提供指导。
首批理事会成员涵盖AI芯片企业、模型、数据和工具企业、科研机构及生态组织等,共计14家单位。
在遴选过程中,发起者将整个AI产业分为不同环节后,在每一环节中选择具有代表性且认可社区愿景、使命和目标,并愿意向社区持续贡献的机构协商,然后敲定名单。
最终确定的首批成员如下(按全称拼音排序):
这些单位不仅覆盖了AI产业链上的不同环节,也包括了企业、科研单位等不同类型的机构,这些机构将共同参与社区治理,让社区能够全面考量来自各个方面的关切。
未来,魔乐社区还将通过理事会深化与高校、科研机构及企业的合作,吸引更多成员加入,并深度整合技术、人才与产业资源。
魔乐社区理事会,具体由治理、建设、运营三个委员会,以及秘书处四个部分组成。
其中,治理委员会负责战略及各类裁决,建设委员会聚焦技术标准与社区网站建设,运营委员会负责各类运营活动,秘书处提供各类协调和支持。
另外理事会还设立了特别兴趣小组(SIG)机制。
两名及以上有共同兴趣和目标的社区用户,可向相关委员会提案成立SIG,针对具体问题进行专项攻关。
另外理事会还通过治理架构和章程,设置淘汰机制,督促理事会成员积极参与社区事务,避免出现“聚而不合”的问题。
当然,魔乐社区理事会也会尽力保证参与者在社区中的获得感,从而提高成员的行动意愿,确保社区的长期运行。
总之,理事会的成立,将为魔乐社区未来的发展提供更加坚实的组织保障。
算力、模型、数据,应有尽有
那么,魔乐社区到底能够提供什么样的资源呢?
首先,是各种模型、数据集、模型工具等AI开发者常用的资源。
以模型为例,魔乐社区当中包含了文本、图像、音频等各种模态(包括多模态)的模型,并且还有针对不同算力设施和模型工具的优化版本。
像DeepSeek、Qwen,还有智谱等等知名开源模型,都被收录在列,关键是这些模型还都 完成了国产化硬件适配。
还有开源数据,也涵盖了多种模态和任务类型。
甚至,魔乐社区还和算力行业成员一起,为用户提供了公益性的免费的国产化算力资源。
直接体现就是社区中的在线体验空间,可以通过主流开源SDK快速创建属于自己的AI应用,并且支持分享,让非开发者也能在线试玩。
此外还联合社区成员,在线上和线下举办学习交流活动,让社区不只作AI资源的交换站,更要成为人与人之间的协作平台。
举个例子,上海AI实验室是学术界的一个重要代表,拥有大量的研究成果,但同样面临着学术成果难以转化落地的窘境。
这和学术界更多关注理论研究的模式不无关联,但更重要的原因是缺乏实践的土壤,成果难以被产业界关注认可。
不过有了社区的帮助,学术成果就可以通过demo的形式更加直观地被展现,让不懂AI的人都能够看到成果的价值,从而让成果更迅速地被认识、认可。
所以,上海AI实验室积极与魔乐社区合作,贡献了大量的模型和数据资源,同时其下属的OpenDataLab也以理事会成员的身份加入了社区,积极投身到了社区建设中。
与此同时,从魔乐社区中受益的不仅是学术界,还有中小企业。
硅基智能是一家AI创新企业,目前的主攻方向是AI数字人。
其生态合作部门负责人介绍,硅基智能在数字人技术本身已经拥有了优秀的成果,但在此之外,负责为其数字人提供语言内容的大模型,却并非其强项。
而开源社区中的语言模型,就可以很好地弥补这一不足,帮助其完善整个产品链条。
享受开源模型带来的便利的同时,硅基智能也将其拥有的数字人技术贡献出来,供其他开发者使用,同时获得使用者的反馈意见,形成正向循环。
从这两个例子当中,可以看到魔乐社区确实在产学研之间架起了桥梁,起到了带动整个产业协同发展的关键作用。
未来,魔乐社区还将考虑与高校进行联合人才培养,让开源社区的版图进一步扩大。
为什么要有魔乐,GitHub不香吗?
那么,在国内外都已经不缺开源社区的情况下,为什么依然需要一个魔乐呢?
第一个原因,是现有开源社区——特别是AI开源社区——开放性依然存在不足。
众所周知,GitHub是全球最大的开源代码仓库。
但在大模型时代,GitHub未能及时有效地提供模型权重和数据集的开源土壤,于是诞生出了Hugging Face这一模型平台。
Hugging Face虽然是模型开发者的不二之选,但到了实际应用环节,依然有一部分需求无法通过Hugging Face得到解决。
基础模型在实际应用之前,需要和模型工具进行适配,实际场景中的模型工具多种多样,但Hugging Face目前主要支持的还是自己的工具。
这一现象,也引起了部分开发者对其开放性产生了怀疑。
另一方面,开源模型、数据、工具未形成良性协同,比如开源模型的作者,更关注如何训练出模型,而不会去考虑适配不同的异构化算力和模型工具。
这种局面的直接原因是不同领域之间的开源主体缺乏有效协同,往往是自扫门前雪。
但并非所有开源主体都有雄厚实力,能够将成果开源已经是值得鼓励的事,不能也不应该对开发者在适配工作中出现的不足进行苛责。
当然,问题也客观存在,因此需要想其他办法去解决这个问题,就需要有人在中间环节当中承担统筹调度的职责。
第三,随着人类在开源道路上的脚步不断前进,一些具体的问题也开始逐渐显现。
以数据为例,目前数据的版权、所有权、传播权等均存在争议,且数据开源与商业化之间存在博弈,无法通过现有开源协议得到完全解决。
除了正向的训练数据之外,大模型安全还需要一些敏感数据,但这些数据又不宜公开传播,因此成为了开源面临的一个新困境。
而魔乐社区的出现,正是力求解决这些困境。
首先在开放性上,魔乐社区坚持中立和公益的原则,对所有类型的算力、模型、工具和数据都敞开怀抱,而不是做成云服务商的附属。
另外还可以组织不同环节上的开发者共同对项目进行完善建设,用社区的力量解决单个开发者无力完成的协调适配工作。
开发者在开源工作中面临的现实问题,也可以通过社区进行整理汇总,形成更高屋建瓴的行业洞察,再通过社区力量,与整个社会更好地协调、解决问题。
所以,在已经有了GitHub、Hugging Face,以及国内开源平台的情况下,依然需要一个魔乐这样能够串联协调整个产业链的强有力组织者。
未来的魔乐社区,将持续汇聚人工智能全产业链力量,构建开放、协同、包容的AI生态,加速国产人工智能技术的创新与落地。
魔乐社区地址:
https://modelers.cn/