开源通讯

COPU会议纪要丨2024.10.14

2024-10-16 10:48:17 85

图片关键词

1015日陆主席主持召开COPU例会。

本次会议发布一则信息,据《今日头条》1014日报导:国产芯片实现5^nm芯片突破。

通富微电公司不但掌握6^nm芯片技术,而且在短期内实现了5^nm芯片商业化应用。美国芯片巨头AMD已将订单给到2026年。

本次会议发表一篇基于开源的人工智能(即开源AI”)的的文章如下:

坚持发展基于开源的人工智能(即开源AI”

陆首群

2024.10.15

在人工智能发展中,人们对于采用“开源AI”还是“闭源AI”是有争议的。

自2015年以来,COPU首先提出并一直支持发展基于开源的人工智能(即“开源AI”),在国内首先赞成COPU提出“开源AI”意见的是高文院士(可查阅他的演讲),目前国内外众多开源的和AI的大师也赞成发展“开源AI”。

2024年7月25日,Open AI公司CEO萨姆·奥特曼(Sam Altman);在其研发语言大模型(LLMs)生成式人工智能中,违背早期开源的初心,转而执行闭源策略。国内外也有一些人(包括某些高知人士在内)由于对开源内涵认识不足,或受奥特曼“闭源AI”的影响,也倾向于发展“闭源AI”。

2015年,美国人工智能四大重镇:谷歌、微软、脸谱(即现在的 Meta)、IBM为克服人工智能发展瓶颈,在当年将他们研发的人工智能框架、平台、引擎、工具、算法、源代码、项目等全部开源。以谷歌为例,实行开源的有200多个项目2000万行代码,包括:TensorFlow框架, Android操作系统,中间件和一些重要应用, Angular:JavaScript和Web应用程序框架等,BoZel:可再生代码的工具, Brotli:压缩算法, Chromium:浏览器引擎, Go:一种编译并发型、垃圾回收功能的编辑语言。

谷歌高级副总裁、人工智能首席科学家Jeff Dean 于2016年7月20日在回答《福布斯》杂志记者提问时

记者问:谷歌为什么要开源?为什么要把自己最先进的技术开源?Jeff Dean答:常规科学发展缓慢,阻碍公司创新,开源能加快技术发展进程,打通发展瓶颈,加强维稳,有利于与外界实时交流协作,有利于建立、吸引志愿开发者和维护者。

众多开源和人工智能大师,明确支持“开源AI”:

Meta CEO 扎克伯格( Mark Zuckerberg)在其演讲中谈到: Meta致力于“开源AI”,Meta 开发的 Llama 模型就是AI界的 Linux,“开源AI”是AI前进的道路,可建立最强大的模型。

在OpenAI发布闭源的GPT-4o时, Meta 坚持发布开源的 Llama 3.1(405版本),当时便超越GPT-4o,谷歌坚持发布开源的 Gemini 在多模态领域引发震撼;并推出内置AI core的 Android15 OS,由图灵奖得主、AI大师Yann LeCun支持的一家法国初创公司 Kyutai,开发开源的 Moshi模型,挑战闭源的GPT-4o,仅用6个月开发时间便超越了GPT-4o。

奥特曼最近在《华盛顿邮报》上发表一篇专栏文章,充满极端的意识形态色彩,他在文中谈到“谁将掌控AI的未来?”是我们时代的紧迫问题,他特别仇视中国。联系到OpenAI实行闭源策略,早些时候宣告向中国(及俄罗斯、伊朗、朝鲜)关停GPT-4的API,这是有深刻背景的。

Meta、谷歌抨击OpenAI的“关停”声明,称这是奥特曼下的一盘臭棋:OpenAI一声吆喝,惊起了中国伙伴一摊鸥鹭,一夜之间,中国一批优秀的大模型企业完全可以对标、平替GPT-4的API。

2024年5月2日MIT校长莎莉·科恩布鲁斯(Sally Kornbluth)在与奥特曼对话时,曾质疑他为何执行闭源决策?奥特曼当时答非所问搪塞过去,他说我们已提供免费的AI工具(在GPT-3.5中)。

谷歌前CEO埃里克·施密特( Eric Schmidt)在斯坦福大学计算机学院演讲中回答学生关于AI开源与闭源争论的提问:“你个人或你所在的企业是赞成哪个?”埃里克回答:在我们行业中关于开源AI“与“闭源AI”的争论非常激烈”,我的个人职业生涯都是基于人们愿意共享开源,我的一切都与开源有关,我过去工作所在的企业谷歌,许多基础设施都是开源的;发展人工智能,可能因为投资成本如此巨大,软件开发工作量如此巨大,采用开源确是一个非常适合AI解决问题。

深度人工智能的研发需要巨额资金(主要用于预训练→后训练)。

最近埃隆·马斯克( Elon Musk)在谈到OpenAI时说:我与奥特曼都是OpenAI的创始人,这家公司(具有开源性质)的名字还是我起的,后来奥特曼采用闭源策略,改变了OpenAI的性质。至今奥特曼特有股票只有100万美元,是一个“小指头”。他与微软合作,OpenAI只能成为微软下属的分公司(编者按:可能还未达成合作协议,这样说来, OpenAI尚未与金主:马斯克或微软达成资金合作协议)。

据埃里克谈,他问奥特曼需要多少资金?他说需要3000多亿美元(编者按:估计用于GPT-5的后训练),据韩宪平老师提供的信息OpenAI最近获得资助66亿美元(编者按:66亿美元仅占其所需投资3000多亿美元的2.2%,杯水车薪!如此说来,OpenAI筹集巨额投资之路还很艰巨)。

奥特曼所谓OpenAI研发的通用人工智能(AGI)或超级人工智能(ASI)“快要来了”,过于夸张

①从完成研发程序上看还差得很远语言大模型→多模态大模型→具身大模型→世界模型→通用人工智能,而超级人工智能更在通用人工智能之后

②辛顿(Hinton)、马斯克(Musk)对奥特曼不重视AI安全表示不信任,需要补课③遇到“后训练”挑战时,资金、能源均是问题有待解决

④全球性人工智能的研发工作进入到深度模型(如AGI、ASI)时,是否由OpenAI一家采用闭源技术来独立完成任务可能行不通!

号称Keras(深度框架)之父、谷歌AI研究员 Francois Chollet 评论奥特曼的闭源策略,仅凭一己之力,改变游戏规则,导致语言大模型前沿研究全面封闭,是非常可悲的!以前是所有最新研究成果都是共享的,现在前沿研究不再被公开发表,变得全面封闭了,奥特曼的如此做法,使通用人工智能的研究进展延后倒退了几年,可能是倒退五年至十年。奥特曼现在的做法更像是走在通往通用人工智能的一条岔道上。

开源大师、Linux基金会执行董事 Jim Zemlin认为,语言大模型LLM(人工智能)应该表现得更公正、更安全,就要对LLM(人工智能)及其每个环节实行开源透明。开源大师、Apache软件基金会创始人 Brian Behlendorf说:“全球很多人士,包括开发者和政界人士都对AI未来表现关切和担忧,也有许多关于人工智能潜力和风险的讨论,人们担心黑客可能会利用AI的技术造成更多的伤害,尽管这些技术也带来很多好处。我相信,在全球范围内,只有依靠我们开源社区许多合作伙伴的共同努力,可以应对潜在的伤害,才能获得妥善解决人工智能可能发生的安全问题”。

有人担心开源会泄漏原创技术,也不利于创建规模化的新兴产业,这是他们对开源缺乏理解而产生的误解,需要明白:开源免费的社区发行版与开源收费的商业发行版(+商业模式)之间的融合与区别。有人非要用闭源来捆绑AI,势将束缚AI的发展,而开源将使AI以更大潜力来提升其创造力和协同能力,至于对AI发展尤为关键的、涉及人类的安全,更是离不开开源。

由21位全球人工智能大师和专家联名签署了《北京AI国际安全共识》。加州大学伯克利分校 Stuart Russell教授认为。“在共识的基础上,特别在具有自主系统的通用人工智能的发展超越人类之前,人类应制定限制其摆脱人类控制的红线。”COPU的观点是:“人们要进一步研究开源在制定这条红线时的作用如何?研究适用人工智能是否应做到安全第一,安全为先?全球同步?技治并举?”

早在奥特曼于2023年3月实行闭源策略时,COPU就敏感地觉得“四大”(即大参数、大算力、大能耗、大投资)可能会对人工智能的发展构成巨大的挑战,而推行“开源AI”还是“闭源AI”,谁将更易过关?!我们经过思考和计算后认为,鉴于开源具有开放、共享、协同的特征,将有更大的韧性通关。

参会人员:陆首群、刘澎、章文嵩、宋可为、安泱、张侃、鞠东颖、陈伟(线上)、陈道清(线上)、Anna.AI(线上)、韩宪平(线上)。

 


首页
秘书处
开源通讯
开源活动