开源通讯

简 讯

2025-04-20 15:14:51 18
DeepSeek与其他各种生成式语言大模型对比,其显著优势是:只用大约1/20的训练成本便能产出与后者大模型对等的性能(智能水平),其核心技术是什么?

有人问陆主席,陆答:说不准!他接着说:
近来我接触到国内外几位专家,他们公开猜测DeepSeek这方面的核心技术,我有同感!

(我要声明的是我并未与梁的团队有什么交流)

OpenAI GPT系列和其他生成式大模型的核心技术是采用由Geoffrey Hinton首创的基于深度学习的数字式人工神经网络(Artificial Neural Network,ANN)。

ANN是深度学习代表算法之一,最初目标是以人脑类似的方式解决问题,后来导致与生物学背离,如今ANN仅用于特定任务,如计算机视觉、语音识别、机器翻译、医疗诊断等。

SNN是一种生物神经系统、类脑的神经拟态计算系统,通常称为第三代神经网络,它是基于脉冲信号处理(瞬间编码机制)的稀疏和时间的动态特性,其优点是功耗低、突出神经元的智能性和自主性,用以解决多模态及非结构化信息的感知和推理,引领人工智能的主流计算模式。

关于SNN,2017年Intel在研发神经拟态计算系统(类脑计算机)时采用SNN,2018年曼彻斯特等大学在研发神经拟态计算系统时采用SNN,2020年浙江大学是国内首家研发神经拟态计算系统的,也采用SNN,COPU从2017年起便介绍上述三家研发的神经拟态计算系统、研制的类脑计算机及采用SNN的情况,并与其核心研发团队时有讨论。

DeepSeek从浙江大学研发神经拟态计算系统和SNN稀疏脉冲神经系统中获得启示是很自然的。

图片关键词


首页
秘书处
开源通讯
开源活动