开源通讯

COPU会议纪要2023.11.14

2023-11-14 15:00:04 56

图片关键词

11月14日陆主席主持召开COPU例会。


会议首先讨论目前国内外基于开源的人工智能的发展情况:

目前全球人工智能还处于以机器学习/深度学习的弱人工智能发展阶段,但已开始了几路向强人工智能突破的新阶段,COPU即将出版《评人工智能如何走向新阶段?》文集(第十五集),在该文集中开辟一个讨论人工智能的自由论坛(国内外人工智能以跟帖方式在其上留言,留言已达1279条,从中可看到全球人工智能的发展全貌)。

以机器学习/深度学习为主的人工智能的主要表现为:计算机视觉、棋类智力游戏、算法算力、人脸识别、语言识别、图像识别、机器人、机械手、无人机、自动驾驶和无人驾驶、自然语言处理、机器翻译、物联网(IoT、AIoT、IIoT)、预测、训练蛋白质三维结构(生命科学)、基因医疗诊断、新药物(包括新一代抗生素)、新材料等,2019年英国研制吸气式高超音速“暴风雨”原型战斗机(夸口全球首家六代机)自称是基于机器学习的科技成果。

人工智能开始走向新阶段的有:

①打破机器学习的黑盒子研发可解释性的人工智能,

②研发基于异步脉冲神经网络的神经拟态计算系统,

③从知识工程出发,依托大规模语义网络(知识图谱),探索认知智能解决方案,

④在大模型MPT的研发中,随着资料库中参数量的增加(到1000-2000亿以上),突破“推理”和“生成”环节,通向通用人工智能/AGI,⑤脑机接口的理论和实践。今年10月底,中国宣布研制成功六代机。

对待开源的态度,微软前CEO Steve Ballmer说:Linux是毒瘤,现在CEO Satya Nadella说:微软爱开源。

本次会议发表微软Rabellino的一篇文章:

《设想一个没有开源的世界》

微软开放技术开源社区资深总监Gianugo Rabellino(2015.1.2)

没有开源的世界那将是一个不连通、多样化但乏味的世界。

如果没有诸如Linux、HTML、PHP或Hadoop这类创造出我们今天司空见惯的网络技术,我们的日常生活也将大不相同。

当前运行的绝大部分软件是基于现有(往往是开源)技术的。没有人再从零开始开发软件了。新技术往往是现有技术基础上的创新组合。

Linus Torvalds正是基于开源编译器、工具链、调试器以及现已开源的Minix中获得的灵感创造出Linux。

道格·卡丁基于其在Lucene和Nutch中的经验开发了Hadoop。

PHP的成功在很大程度上源于其与Linux、Apache和MySQL一起并入了LAMP堆栈。

众多开源工具有力地推动着计算模式的发展。

开源软件的发展真正为创新者带来了福音,让他们轻松获得和使用技术,创造出往往令人意想不到的新发明。开源软件将开发的门槛几乎降为零,允许开发者访问昂贵的有近乎无限种组合方式的网络“基因库”、工具和框架资源。

Apache HTTP服务器最初作为一系列软件补丁开发的,如今已成为广泛采用的开源Web服务器。

事实上,如果没有开放标准和开源社区就不会有万维网。

开源软件开放的不只是原始代码。拟在免费下载开源软件后,即获得了通往社区的后台通行证。

社区将有共同兴趣并希望解决类似问题的人聚集在一起。

社区提供深入见解和指导信息,接受积极贡献,并借此修改软件以满足新的需要,同时社区还参与技术的新发展与新组合。

我们生活在相互链接的系统中。开源已无处不在。

没有开源的世界:我们生态系统的各个部分相互隔离,各自勉强运转,很少交流,那将是一个不连通、多样化但乏味的世界。

本次会议邀请中国科学院计算所张云泉研究员讨论算法算力问题。

图片关键词 

现摘录COPU人工智能文集582条(2020,12),

中美算力算法研究优势对比:

1)算力,美国占优势;2)算法,中美成均势;3)大数据,中国占优势;4)应用场景,中国占优势;

大模型数据训练与推理都需要算力支撑,中国2022年算力总规模为180Eflops(1.8X10^20次/秒),低于2021年美国的200Eflops(2X10^20次/秒);其中智能算力2022年中国为41Eflops(4.1X10^19次/秒),不及2021年美国的65Eflops(6.5X10^19次/秒)。这反映了我国在大模型的数据训练和推理算力上的差距。

算力分为通用能力、智能算力和超算算力

通用算力服务于信息化,智能算力服务于人工智能、国民经济、生产要素的变化,超算算力服务于科学计算,通用计算适于处理政务、事务、智慧城市和智能客服等数据/计算密集的事务性任务。

通用算力以CPU为主,智能算力以GPU为主,超算算力也使用GPU。智能算力适于人工智能,做大模型的训练,注意到在数据训练时还需算法工程师介入微调。

关于内存与算力的比例,合理的比例GB/Gflops=1,据华为/罗兰贝格报告:2020年,美国为1:0.9,中国为1:2.4。


参会人员:

前排左起:张侃、张云泉、陆首群、梁志辉、鞠东颖

后排左起:邓广兴、安泱、谭中意、孟迎霞、宋可为、陈伟(线上)


首页
秘书处
开源通讯
开源活动