COPU会议纪要丨2025.04.08
4月8日,陆主席主持召开COPU例会。
COPU即将发布《人工智能文集》第二十五集,在本次会议上将对在第二十五集的论文作简要评说,供大家在阅读讨论中参考:
在“评DeepSeek”一文中,该文的主要观点是:
一、DeepSeek获得最大的成功是研发出一条“低投资、低成本、有限资源,高效率,高性价比(产出)”发展人工智能的新路径。
二、DeepSeek堪称为当前中国人工智能的代表作,正在改变世界人工智能的发展格局,DeepSeek也引发了当前在全球人工智能白热化的竞赛。
三、DeepSeek坚持开源创新,开源主要有助于AI的迭代创新、维稳升级(Fix bug,Patch)、开拓生态和推广应用。
DeepSeek将大模型to C端全开源(对个体和中小企业用户开源免费)和to B端建立开源商业模式(对大企业按开源商业模式收费)结成一体,这也是DeepSeek发展开源的一大创造。
四、按现行产出产品排行榜,有人以此打压DeepSeek,其实DeepSeek与其他语言大模型的产出性能处于对等状态,不存在过分夸张的你高我低情况,如以更科学的性价比作对比,DeepSeek无疑是天下第一。
五、目前DeepSeek的主要技术没有多少秘密可言,国内外一些生成式语言大模型基本上也将DeepSeek的主要技术学到了手,在开展新一轮AI竞赛时,可以说大家处于同一起跑线上。
六、目前DeepSeek大模型像其他大模型一样都是一种生成式自回归语言大模型,DeepSeek也不可避免存在语言大模型那些局限性和负面缺陷,影响到DeepSeek在发展中要克服局限、根治缺陷,大幅度提升智能、节能增效、扩大应用。
七、对生成式语言大模型而言,由于语言不能取代世界,因而它缺乏世界知识或者不能产生新知,无法真正理解物理世界,加上语言不等于思维,它在运行时也限制了思维深度,最终限制了其产出的智能水平;语言大模型训练架构的基于Token的自回归机制也是产生幻觉的根源。
八、DeepSeek像其他标准的、普惠的基座模型一样,难以直接转变为企业、行业的优质生产力,尚需提升其暂时缺失的商业价值,需要进行应用补缺。
九、建议DeepSeek发展的重要任务应解决其发展AI纠偏转轨问题。DeepSeek纠偏转轨的目标是研发真实的、先进的AI—通用人工智能(AGI)。在到达AGI之前还需要进行2~3项重大创新,先要研发过渡阶段AI任务(如多模态、具身、agent和世界模型等)。
十、AGI是一个具有自主系统的AI,AGI正处于AI的智能是否超越人类的十字路口,这关系到是否影响人类的安全,甚至影响到人类生存极端严重的问题,在研发AGI以保障人类安全的预防措施时,要留全球不要缺口的技术、组织统一行动。
在《人工智能文集》第二十五集中发表了杨立昆(YannLeCun)大师在GTC 2025会议上的演讲。杨立昆是Meta的首席科学家、图灵奖获得者,他在这个会议上演讲的题目是:AI发展的现状与未来的方向。
他深入分析当前AI技术,特别是自回归生成式大语言模型存在的根本局限(关键是语言不能代表世界),他指出LLM是产生幻觉问题的根源,他还指出LLM必将走向淘汰,应该另辟创新路径。
在本AI文集上发表了李开复大师的文章,他指出DeepSeek AI-First B端、C端应用都将迎来爆发,各地政府也在积极探索如何将DeepSeek AI应用到当地优势的传统产业中去,用产业大模型打造“新质生产力”, 促进实体经济增长。 他说,DeepSeek是一款非常优秀的大模型,取得了创新的突破,但它像其他标准的、普惠的基座模型一样,尚得提升其暂时缺失的商业价值,它们对企业、行业尚缺乏深度理解,为此必须把企业、行业的数据抓起来进行应用补缺。零一万物洞察到基础模型与市场需求之间存在的缺位,由于缺少连接企业知识库、搭建应用的中间件,DeepSeek优质基座模型难以直接转变为企业生产力。李开复博士在回答彭博社专访中谈到零一万物于本周发布的产品—万智企业大模型一站式平台有意支持 DeepSeeR目前还无法直接深入到企业级的应用中去。
在本AI文集上转载了浙江大学朱强教授的文章,谈到对DeepSeek技术溯源及前沿探索。本AI文集还发表了阿里云通义千问大模型文章,通义千问大模型的发展(近来发布的旗舰模型Qwen 2.5-Max,已超过DeepSeek V3、OpenAI o1-mini,比肩DeepSeek R1、OpenAI o1,受到国际、国内广泛的好评)。在本文集上还发表了陈伟摘录对DeepSeek拆解分析后的评论和提问(包括他个人修改后的意见)的文章。
本次会议又一次讨论了定于今年6月13~14日在北京召开的2025《第20届开源中国开源世界高峰论坛》与《圆桌会议》的筹备工作。
一、成立筹备工作组 (和顾问组)
前期会议已宣布成立筹备组正在开展工作。现在从检查来看,筹备组工作分工要明确,工作要抓紧,顾问组要启动。
二、本届会议主题
开源创新,数字化转型、智能化重构
推进基于开源的中国AI的代表作(DeepSeek)的发展
(1)推进人工智能时代的开源 开源创新,推动数字化转型与智能化重构
(2)解决“缺芯少魂”短板
①半导体芯片:
*解决成熟工艺领域(>14~28纳米制程)良品率问题
*解决高端工艺领域(制程7~3纳米制程)研发问题
②开发EDA全程软件
③开发手机、汽车等产品的先进操作系统,开拓生态系统
(3)开发开源的RISC-V 并组织投产
(4)开发基于开源的深度信息技术并形成新兴产业或应用场景
基于开源的云原生(+Kubernetes)、区块链、人工智能等的开发、推广、应用
(5)开发、应变、完善供应链及其安全保障
(以国内大循环为主,交流经验)
(6)健全合规制度
(7)算力建设
(8)组织自动驾驶、无人驾驶研发、测试、运行
(9)推进DeepSeek大模型发展
(10)创新、发展开源的商业模式,为发展开源的新兴产业服务
三、落实本届会议参会者,重点落实邀请参会的国内外嘉宾(拟)
国外: Jim Zemlin、Yann LeCun、李飞飞、Hugging Face、GitHub
国内:(一)姚期智、沈向洋、李开复、杨植麟(月之暗面)、朱强(浙大)
(二)倪光南、高文、王怀民、黄铁军等
四、落实本届会议发言程序,重点落实主要发言
联通(算力)、华为、腾讯、阿里、小米、中兴、Kimi等
五、宣传工作
六、会场、食宿交通安排等
七、筹资
八、同传翻译
参会人员:陆首群、宋可为、陈道清、靳虹博、王珊、郭洪韬、张侃、陈道新、袁怿、章文嵩、安泱、刘夏、鞠东颖、陈伟(线上)、李弘博(线上)、宁固(线上)、韩宪平(线上)、孟迎霞(线上)、陈钟(线上)、刘明(线上)、胡宇(线上)、Anna.AI(线上)。