丨 2026年1月14日 星期三 丨
NO.1DeepSeek发布梁文锋署名新论文
1月12日晚,DeepSeek发布新论文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》,该论文由北京大学与DeepSeek团队共同完成,作者署名中有DeepSeek创始人梁文锋。同日,DeepSeek开源相关记忆模块Engram。
点评:DeepSeek发布的新论文和开源的Engram模块,不仅解决了现有架构中的关键问题,还通过开源的方式为整个行业提供了新的工具和思路。在DeepSeek等创新力量的推动下,大模型技术有望不断突破边界,为人类社会带来更多的便利和进步。
NO.2百川智能开源医疗大模型Baichuan-M3
1月13日,百川智能宣布正式开源新一代医疗大模型Baichuan-M3(以下简称“M3”),其在全球权威医疗AI(人工智能)评测HealthBench中以65.1分的综合成绩位列全球第一;在专门考验复杂决策能力的HealthBench Hard上,也以44.4分的成绩夺冠。此外,M3还首次具备了原生的“端到端”严肃问诊能力。它能像医生一样主动追问、逐层逼近,把关键病史和风险信号问出来,进而在完整的信息上进行深度医学推理。
点评:百川开源的M3模型在技术上取得了显著进步,为AI医疗领域带来了新的希望和可能性。然而,患者和医疗从业者对其信任的建立依旧需要时间。AI医疗模型的决策过程相对复杂,如何让人类用户理解并信任其建议是一个重要问题。
NO.3Meta拟裁减至少10%的虚拟现实研发部门Reality实验室员工
近日,Meta正持续将资源转向人工智能技术研发,为此计划裁减至少10%的虚拟现实研发部门Reality实验室员工。Reality实验室目前约有1.5万名员工,裁员计划最快或于周二对外公布。此次裁员消息传出之际,正值这家脸书母公司在硅谷人工智能竞赛中急于巩固自身地位的关键阶段。
点评:Meta裁员虚拟现实部门、全力布局AI,是其在科技浪潮中做出的一次重要战略调整。在科技行业快速发展的今天,企业需要在不断变化的市场环境中做出灵活的决策,但同时也要兼顾员工利益、行业发展和社会责任。
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
每日经济新闻