开源通讯

COPU会议纪要丨2024.08.27

2024-08-27 16:55:07 72

图片关键词

827日陆主席召开COPU例会。

本次会议再次讨论开源创新问题,现发表两篇文章如下,供大家讨论。

  

开源创新——开源赋能引领数智新时代 

陆首群 2024827


人们常常提问,在人工智能发展中是采用开源还是闭源,哪个更为有利?我曾回答:COPU坚持发展基于开源的人工智能”,我也曾引用Meta的马克·扎克伯格的回答:“开源是人工智能最强大的模型”。我们曾指出:“有人非要用闭源来捆绑AI,势将束缚AI的发展,而开源将使AI具有更大努力来提升其创造力和协调能力”。我曾写过评论奥特曼实行闭源策略的文章,奥特曼曾说:“研发AI,采用开源不是最佳选择”。我认为奥特曼的“闭源AI”模型,很难通过“安全关”(在为AI模型设置安全红线时);面临未来巨大能耗、巨大投资的挑战,也是“未定之天”。

开源锻造现代创新引擎:“互联网+基于知识社会的创新2.0

为了提升传统业态的创新效果,不求00“八宝粥”式的变化模式,而要追求01爆发性的变化模式,这时就有求于开源的现代创新引擎实现跨时代创新,即在数智新时代,开源创新引领传统业态的数字化转型或智能化重构。

其设计布局如下:在几乎占有无限空间的工业社会中,划出一个用于考察试验现实的物理空间(physical space),在其中配置有待考察、试验的传统业态(有生产的、技术的、经济的、社会的,也可扩充为其他的等等),同时我们构建一个更高维度的、虚拟的数字空间(Cyber Space),在其中配置供试验用的高维阶网络、资源、动能,等等,以数空中动能作用于物空中的业态,促使其产生01爆发性变化,体现开源创新:使新业态实现数字化转型或智能化重构。

开源打通人工智能发展瓶颈

我们经常举的一个实例是:2015年美国人工智能四大重镇——谷歌、微软、脸谱(即现在的Meta)、IBM,为克服人工智能发展瓶颈,在当年将他们研发的人工智能框架、平台、引擎、工具、算法、源代码、项目等全部开源。

以谷歌为例,实行开源的有900多个项目2000万行代码,包括:TensorFlow框架;Android移动平台完整堆栈:操作系统、中间件和一些重要应用;AugularJavaScriptWeb应用程序框架;BoZel:可再生代码的工具;Brotli:压缩算法;ChromiumChrome浏览器背后的引擎;Go:一种编译型并发型、垃圾回收功能的编辑语言。

开源可加快技术发展进程

2016720日《福布斯》杂志记者向谷歌高级副总裁、人工智能首席科学家Jeff Dean提问;

记者问:谷歌为什么要开源?为什么要开源自己最先进的技术?

Jeff Dean答:常规科学发展缓慢,阻碍公司创新;开源能加快技术发展进程,有利于外界实时交流协作,包括建立、吸引志愿开发者和维护者团队的支持。

Jeff Dean还答:过去企业取得成功的做法是把自己的“使用价值链”级别最优,以提高企业在客户中的信誉、地位,提高企业的竞争优势,现在企业最成功的做法是提高“产业价值的生态系统”,并使企业的人才融入更大的科技圈中,以扩大企业的影响力。

近期有人问:谷歌为什么将很多大数据项目开源了,贡献给公众?

谷歌的回答:这些软件规模非常大,靠一家公司独立去维护、运营,成本非常高,开源后变成公共财产,很多公司和志愿者共同参与,大公司不需要投入太大力量,小公司也可解决成本问题,形成我为人人,人人为我的开源文化。

开源是推动深度信息技术(包括大数据、云原生、区块链、人工智能等)发展的基础和动力。

我们在早先《发展基于开源的人工智能》的一篇文章中是如此谈论开源的:依靠开源不但可以加快AI的开发速度,提高开发质量,打通发展瓶颈,扩大生态,加强运维,反对垄断。

Linux基金会2016年的调查统计,全球500强企业中IT跨国公司头部企业已改变企业内的设计方式,变为企业内外的设计方式,以利用企业外的开源资源为主设计(85%)、企业内部为辅助设计(15%)的方式。

我们还指出,在某些信息技术(包括人工智能)的应用场景中绝对离不开开源,如解决AI安全问题时离不开开源,全球全程及时发现供应链漏洞时(如阿里达摩院的开源志愿者首先发现在万里之外美国供应链上出现的Apache Log4j严重的漏洞)也离不开开源。

有人担心开源会泄漏原创技术,造成企业亏损或产业萎缩,这是他们对开源缺乏理解而产生的误解,需要明白:开源免费的社区发行版与开源收费的商业发行版之间的融合与区别。

有人认为开源与闭源是不离不弃的左右手,其实他们并不充分了解开源软件或闭源软件目前谁是主流?谁代表发展趋势?

早在2015-2016年, 国际著名的调查分析公司Gratner就宣布开源是软件发展的主流,也代表发展趋势。他们的调查数据如下:

2015年, 85%的全球商业软件使用开源软件,2016年,95%的主流企业(组织)直接(或间接)在期关键任务系统“(Mission Critical Sqstem)”中使用开源软件。

如此看来,开源与闭源在主流或趋势发展上已是不平衡、不对称的,用左右手平衡的观点来形容它们,似不恰当!

也有人认为开源的创新为其次,开源的普及(或推广)应为主。我们认为,不要把开源的主次颠倒了!

开源有力支持互联网发展中数字主权建设

2021128日互联网治理论坛(IGF)邀请中国开源软件推进联盟(COPU)参加在波兰召开的《互联网治理座谈会》,COPU在会上作了“开源协同,有力支持互联网数字主权建设”的报告,指出:中国开源运动发展的一个重要体验是,开源协同有力支持了互联网数字主权建设(由梁志辉、鞠东颖作为COPU代表的发言稿刊载于最新出版的《开源创新,数字化转型与智能化重构》一书P11)。

 

基于开源的人工智能

 

(评全球对AI异议及COPU观点)

 

--摘自《19届开源中国开源世界大会》开幕词兼主题报告

 

陆首群,2024.8.19

 

有人非要用闭源来捆绑AI,势将束缚AI的发展,而开源将使AI以更大潜力来提升其创造力和协同能力,至于对AI发展尤其关键的安全更离不开开源。

2015年以来,COPU一直致力于发展基于开源的深度信息技术(包括大数据、云原生、区块链、人工智能等)。

OpenAICEO萨姆·奥特曼(Sam Altman)违背他研究“开源AI”的初心,转而推行闭源策略。MetaCEO马克·扎克伯格(Mark Zukerberg)坚持“开源AI”路线,认为“开源AI”是最强大的模型。COPU观点:“开源AI”彰显开源创新,数字化转型与智能化重构,作为AI发展前沿的“AI安全”是离不开开源的。

目前在全球火热的是语言大模型(LLM)生成式AI,在肯定其取得巨大进步的同时,也要看到其存在的局限性,其中突出的是产生“幻觉”。

人工智能专家OpenAI前首席科学家Ilya Sutskever在肯定语言大模型LLM取得进步时,坦言它仍存在局限性如“幻觉“问题,原因是缺乏对推理的理解,在应用实际问题时推理能力丧失或不足。图灵奖获得者、Meta首席科学家人工智能大师杨立昆(Yann LeCun)认为,仅靠语言模型无法实现真正的智能,因为语言模型缺失对世界底层模型(物理空间)的理解。

Ilya Sutskever预测,奥特曼在研发GPT-5之后,AGI即将降临,所以他认为LLM是通往AGI的途径。Yann LeCun认为,自回归语言模型并不是通往AGI的充分途径,因为它缺乏智能生物的基本能力,缺乏对物理世界的基本理解,削弱了推理能力。早先陆首群在研究数字化、智能化时对现实世界的“物理空间”有所阐述,2016年陆首群提出现代创新引擎“互联网+基于知识社会的创新2.0”:建立相互连系、兼容的高维度的虚拟社会数字空间(Cyber Space)与低维度的现实社会物理空间(Physical Space),并将数字空间中的动能作用于物理空间中的业态,促使其产生从01爆发性变化,即“开源创新,数字化转型与智能化重构”。

有人认为,现时人们集中于发展生成式的语言AI大模型,更应关注发展依托于实体经济的“工业互联AI大模型”。COPU认为,我们在2010年就曾提出依托实体经济的AI研究方向。

现在看来,人们把通用人工智能(AGI)看成AI的发展前沿,已经取得了共识。COPU同意这种共识,但认为这里存在讨论的空间:如更现实的发展做法是,可首先发展服务于各行各业的专用人工智能,并由“专”达“通”,由“简”及“全”。

21位人工智能大师和专家联名签署《北京AI国际安全共识》时,加州大学伯克利分校Stuart Russel教授认为,应在具有自主系统的通用人工智能的发展超越人类之前,人类应制定限制其摆脱人类控制的红线。COPU的观点是,人们要进一步研究并讨论:开源在制定这条红线时的作用如何?研究通用人工智能是否应做到安全第一、安全为先?全球同步?技治并举?

奥特曼于20233月实行闭源策略,当时COPU就敏锐地感觉到“四大”(即大参数、大算力、大能耗、大投资)可能会对人工智能未来的发展构成巨大的挑战,而推行“开源AI”还是“闭源AI”,谁将更易过关?我们经过思考和计算后认为,鉴于开源具有开放、共享、协同的特性,将具有更大韧性通关,而对奥氏的闭源策略来说,过关难度要更大,COPU认为它能否通关尚是未定之天!

参会人员:陆首群,谭中意,宋可为,张侃,安泱,陈道清,何苗。

图片关键词


首页
秘书处
开源通讯
开源活动