COPU会议纪要丨2025.04.22
4月22日,陆主席主持召开COPU例会。
本次会议先宣布一条信息:
在工信部促合下,小米宣布要和华为合作,小米“全家桶”将适配鸿蒙OS-5系统,华为终端客服确认此事,并表示小米与华为团队已启动适配工作了。预计在6月底前,所有小米设备都将接入鸿蒙OS-5系统,这是华为头一回把鸿蒙分布式架构开放给小米,这次合作意味着小米所有设备都可和华为手机联动,实现多种跨品牌智能场景,极大丰富了用户使用体验。
会上下面讨论了DeepSeek的核心技术(目前还是猜测性的)
一、讨论DeepSeek的核心技术
这是基于猜测性的,不一定信以为真!大家都在猜测,我不过公开罢了,如果DeepSeek不承认猜中了它的核心技术,那也无妨,其他大模型也可采纳!
有人问,DeepSeek相对于OpenAI的GPT系列或其他生成式语言大模型的竞争优势在哪里?
也有人问,为什么国内“AI六小虎”被DeepSeek逼得了聊无生计?
我想,DeepSeek的核心技术(或者说集开源创新、高超算法、突出的工程能力于一体的核心技术)可能更胜一筹。
奥特曼、黄仁勋等孜孜以求的似乎也想找梁文锋了解产生如此大影响的DeepSeek的核心技术是什么?
我认为,OpenAI的GPT系列和其他的生成式语言大模型的核心技术是采用辛顿大师(Geoffrey Hinton)首创并不断宣扬的基于深度学习的数字式人工神经网络(Artificia Neural Network,ANN)。ANN是深度学习代表性算法之一。
我认为,DeepSeek大模型的核心技术似乎是引进神经拟态计算系统(类脑计算机)的模拟式稀疏脉冲生物神经网络(Spiking Neural Network,SNN)。SNN模拟式异步脉冲稀疏神经网络是神经拟态计算系统的超级算法,今天似乎也成为DeepSeek的超级算法。
DeepSeek的核心技术是集开源迭代创新、高超算法、突出的工程能力于一体的。
其中开源的作用,并不像有人所说仅限于开源推广的价值,应该包括开源迭代创新、维稳升级 Fixbug, Patch、开拓生态,以及将全开源与建立开源的商业模式并铸成一体的(至今国内外不少人缺乏开源清晰的概念,他们始终未能处理好全开源与开源商业模式如何铸成一体各负其责的构思)。
在核心技术中,SNN作为超级算法,我在前面已经讲过。
如何理解在运用核心技术中的突出的工程能力?我想工程能力的突破表现在Infra解决SNN如何与大模型(如DeepSeek)或与神经拟态计算系统结合的问题,以及SNN如何与开源结合的问题,以便迅速、充分调用资源增强核心技术的作用。
附件一:COPU开源联盟2025年4月19日发表的DeepSeek与其他各种生成式语言大模型对比资料:
DeepSeek与其他各种生成式语言大模型对比,其显著优势是:只用大约1/20的训练成本便能产出与后者大模型对等的性能(智能水平),其核心技术是什么?
有人问陆主席,陆答:说不准!他接着说:
近来我接触到国内外几位专家,他们公开猜测DeepSeek这方面的核心技术,我有同感!
(我要声明的是我并未与梁的团队有什么交流)
OpenAI GPT系列和其他生成式大模型的核心技术是采用由Geoffrey Hinton首创的基于深度学习的数字式人工神经网络(Artificial Neural Network,ANN)。
ANN是深度学习代表算法之一,最初目标是以人脑类似的方式解决问题,后来导致与生物学背离,如今ANN仅用于特定任务,如计算机视觉、语音识别、机器翻译、医疗诊断等。
SNN(Spiking Neural Network)是一种生物神经系统、类脑的神经拟态计算系统,通常称为第三代神经网络,它是基于脉冲信号处理(瞬间编码机制)的稀疏和时间的动态特性,其优点是功耗低、突出神经元的智能性和自主性,用以解决多模态及非结构化信息的感知和推理,引领人工智能的主流计算模式。
关于SNN,2017年Intel在研发神经拟态计算系统(类脑计算机)时采用SNN,2018年曼彻斯特等大学在研发神经拟态计算系统时采用SNN,2020年浙江大学是国内首家研发神经拟态计算系统的,也采用SNN,COPU从2017年起便介绍上述三家研发的神经拟态计算系统、研制的类脑计算机及采用SNN的情况,并与其核心研发团队时有讨论。
DeepSeek从浙江大学研发神经拟态计算系统和SNN稀疏脉冲神经系统中获得启示是很自然的。
附件二:议论国内“AI六小虎”的发展前景
议论国内“AI六小虎”是否被DeepSeek逼得聊无生计?
所谓“AI六小虎”即:
①零一万物 ②百川智能 ③智谱(北京) ④阶跃星辰(上海) ⑤MiniMax ⑥月之暗面
几宗议论:
①六小虎被DeepSeek逼得聊无生计 ②现在的LLM应该只剩下阿里和智谱了 ③零一万物现在也转业搞应用了 ④月之暗面受DeepSeek冲击较为明显 ⑤我印象中的豆包的用户体验最好 ⑥阿里和豆包可算是财大气粗的,不能列入AI小企业中
陆主席答:除国内AI六小虎外,国内还有一些大模型正在成功发展中。
对于零一万物放弃了建设生成式语言大模型转入了实用服务一说,此问有所误解,今举出李开复于3月20日接受美国彭博社的专访的例子,李谈到DeepSeek像其他标准的普惠的基础大模型一样,尚得提升其暂时缺失的商业价值,它们对产业、行业的应用场景是缺乏深度理解的,要真正把企业行业的应用抓起来,首先要抓企业行业的数据,搭建连基座模型的企业产业的知识库及应用中间中,进行应用补缺。
彭博社记者当即转问,零一万物于本周发布的产品——万智企业大模型一站式平台是否专门为DeepSeek大模型补缺主用服务的?李开复作答:我们看好DeepSeek惊艳业界的技术创新,其开源模式更是压倒性优势,我们愿为其补缺企业、行业的应用出力,我们推出的万智企业大模型一站式平台,不仅提供安全模型部署方案、模型微调方案,还封装了网络搜索、知识库RAG、Agent搭建工具,助力DeepSeek以优质基础模型赋能企业应用场景。
陆主席接着说,谁说月之暗面的Kimi K1.5大模型受DeepSeek冲击最明显?!Kimi K1.5推理大模型是在今年1月20日与DeepSeek-R1几乎同时发布的,原本是闭源的,近来其CEO杨植麟公开宣布开源,似乎他对Kimi K1.5大模型发展还是有信心的。
MiniMax是工具性质的大模型,最近刚生成电影级别的视频软件(号称超绝软件?!),向市场推广的反应如何,尚待评说。
陆主席说,对研发生成式语言大模型的中小企业来说,优胜劣汰是很正常的事,不要一个极端(说是“群魔乱舞”)走向另一个极端,也不要把一些企业的失败都与DeepSeek挂钩,一惊一乍!
本次会议讨论了于6月13-14日召开的第20届开源中国开源世界大会的筹备工作,谭中意汇报了目前工作进展。
上海开源信息技术协会创始人张国锋教授介绍了上海开源产业开源服务业发展现状。
参会人员:陆首群、张国锋、章文嵩、荆琦、陈道清、张侃、靳虹博、孟伟、谭中意、袁怿、安泱、武力、刘夏、鞠东颖、刘澎(线上)、陈钟(线上)、陈绪(线上)、陈伟(线上)、刘明(线上)、李弘博(线上)、隆云滔(线上)、韩宪平(线上)、胡宇(线上)、Anna.AI(线上)、程海旭(线上)。