开源通讯

COPU会议纪要丨2024.11.19

2024-11-19 16:40:14 164

 图片关键词

1119日,陆主席主持召开COPU例会。

在本次会议上 首先传达一则信息: 

OSI发布在AI 时代Open Source (开源) 的定义与IT时代的定义,有所变化。 

AI时代对Open Source (开源) 定义的要求: 

提供训练数据详细信息,完整构建和运行AI的代码,以及训练时的设置和权重。 

在网上,把 Meta、谷歌开发的 LlamaGemini 所谓开源大模型进行打假(“假开源”),颇为耸人听闻!但事实上这些开源大模型遵循的开源定义已经落后了,没有完整地开放源代码和数据集。我们现在实行的开源也都是IT时代的开源定义,今天我们再次讨论“AIOS”,也要采用AI时代的开源新定义。 

要求COPU秘书处,联系OSI,获取AI时代 Open Source (开源)的新定义及有关说明,随后知悉COPU成员单位和相关联系单位。 

几个月前在COPU例会上,我们响应荷兰学者提问时指出,进入AI时代,开源的开放程度将进一步扩大(OSI也正在修改开源的定义),以增加利益相关的人们的知情度。今天 OSI颁布AI时代开源的新定义,证实了这一点!至于在AI时代的闭源是不开放的,它无法为人们提供知情度,闭源如此能发展下去吗?!  

本次会议我们将再次讨论研制人工智能操作验(AIOS)问题。 

三个月来COPU曾多次组织业内企业讨论AIOS,大家提出了两种研制模式:一是以应用入手,形成AI应用+AI 框架+传统OS (OS for AI),或是在现有的OS中加入智能模块( OS for LM),也可称之为AI-Powered OS模式;二是以改造OS的框架或内核入手,把AI模型引入或融合到OS(AI for OS),也可称之为AI-Refactored OS模式。绝大多数企业正在研制前一种模式;由陈渝教授介绍,我也曾推荐后一种模式(可查阅 COPU《人工智能文集》第十九集 P70),在今天会上我再作简要介绍:主要推荐一种语言大模型智能代理操作系统(我们叫LLM Agent OS),其主要特点是将大模型嵌入到操作系统中,作为操作系统的“大脑”,以实现一个“有灵魂”的操作系统,该操作系统的主要职能有:①优化运行在LLM上的资源分配,②促进各集成智能代理之间上下文转换,③实行各智能代理并发执行,④维护各智能代理之间的访问控制,而该OS的主要职能有:①内存管理,②存储管理,③驱动管理,④访问管理等。我认为前一种模式,只具有局部智能OS的特点,可能是一个过度性产品,为了扩大大家的思维,在必要研制后一种模式。 

今天邀请红帽大中华区首席架构师张家驹来介绍他们研制的AIOS

 图片关键词

红帽大中华区首席架构师张家驹在会上介绍了AI时代红帽的开源价值观。首先提到AI带来巨大潜力的同时也带来了在安全性、透明度和道德治理方面的挑战,红帽拥抱100%开源的价值观,并提出在AI时代开源的概念要与时俱进,不仅是代码开源、权重开源,同时还涉及到训练数据开源、训练方法开源,等等。基于此理念,红帽发起了InstructLab-一个旨在让任何人都有机会参与大模型开发的社区项目。同时,红帽还在众多的开源AI项目中积极投入和贡献,秉承着一贯的“上游优先”(upstream first)的原则, 在下游开发了“开放混合AI”的产品组合,包括RHEL AIOpenShift AI等,满足企业用户的需求。最后,总结了AI时代红帽的开源价值观:让AI成为一个普惠大众的技术,让任何人都有机会参与开发、贡献、反馈,并从中受益。 

最近COPU收集了阿里云通义千问Qwen2.5大模型在国外测试和人们的反应: 

COPU讯:最近,阿里云的通义千问Qwen2.5大模型在几个知名的基准测试平台: Chatbot ArenaOpen Compass的测试中取得了好成绩,,跻身于全球先进的大模型之列。在基准测试平台Chatbot Arena 公布的盲测榜单上, Qwen2.5闯入全球10,在权威基准Open Compass,得分追平GPT-4 Turbo,该基准首次录得国产大模型取得如此出色的成绩。 

通义千问Qwen2.5大模型在国外获得了广泛的好评:一位外国工程师点赞Qwen2.5,直言相比 Mistral-Small-Instruct-2409,通义大模型在函数调用评估中有更好的表现;在日本也有不少开发者追捧Qwen2.5,表示实测好用;还有一位美国开发者,认为中国大模型真厉害,他们拿Qwen2.5GPT-4oClaude3.5做对比,发现通义千问Qwen2.5的性能,介于二者之间,进步太疯狂了!据说目前通义开源模型累计访问下载量已突破4000万,再次证明千问很受开发者欢迎。 

当下全球开源大模型产品各有特色,都很好用,而千问Qwen大模型真不比美国先进的大模型差。 

还有一事也应提出:2024625日,OpenAI邮件通知,以极端的意识形态划线,自7月起终止向中国提供语言大模型LLMAPI服务(即封杀中国等四国),立即遭到了谷歌、Meta的抨击,说这是一个愚蠢的举措:他们指出,OpenAI 一声吆喝,惊起了一滩鸥鹭,一夜之间,一批中国优秀的大模型企业(包括阿里云在内)通过自主开发的大模型(包括通义千问Qwen2.5在内)接替因 Open AI关停API接口完成对标和平替。  

最近顶级AI 公司Deep Mind开发了基于AI用于自动化设计芯片布局方法Alpha Chip,英伟达(NVIDIA)黄仁勋作了介绍,如下: 

黄仁勋介绍:由顶级AI公司Deep Mind 开发的Alpha Chip是一种超出人类设计水平、用来进行芯片设计的一种方法。能实现芯片设计全流程自动化,通过互搏可产生人类还没有的棋类数据,可用于自动进行算力优化,用于自动训练大模型、自动生成合成数据,还能在通用人工智能(AGI)研发成功后再经几个小时便能完成其智能超越人类智力水平一万倍的超级人工智能(ASI)最强的芯片布局,还可用于科研(包括AI科研)。目前谷歌已用于设计TPU,联发科已用于加速芯片开发,优化芯片的性能、能耗和面积,Deep Mind正在用 Alpha Chip致力于AI开始自我进化。

Alpha Chip发表在《NatureVol 5942021.6.10,P207-P212, 附录发表在《NatureVol 634.2024.10.17 

我们还邀请北京大学的师生翻译Alpha Chip(待发表),今天由李智宇前来介绍(在本次会议上只能提纲挈领谈一下),如下:

图片关键词

 

李智宇简要介绍Alpha Chip论文的摘要,如下: 

芯片平面规划是设计计算机芯片物理布局的工程任务。尽管经过了五十年的研究,芯片平面规划一直难以实现自动化,需要物理设计工程师付出数月的紧张努力才能制造出可生产的布局。在这里,我们提出了一种深度强化学习方法来处理芯片平面规划问题,即Alpha Chip。在不到六小时的时间内,我们的方法可以自动生成在所有关键指标上优于或与人类产生的相当的芯片平面图,包括功耗、性能和芯片面积。为了实现这一点,我们将芯片平面规划视为一个强化学习问题,并开发了一种基于边缘的图卷积神经网络架构,能够学习到芯片的丰富和可转移的表示。因此,我们的方法利用过去的经验,变得更好、更快地解决新的问题实例,允许由比任何人类设计师都更有经验的人工代理来执行芯片设计。我们的方法已经被用来设计下一代谷歌人工智能(AI)加速器,并且有潜力为每一代新产品节省数千小时的人力。最后,我们相信,更强大的AI设计硬件将推动AI的进步,创造出两个领域之间的共生关系。 

 

参会人员:陆首群、刘澎、吴胜武、王东临、张家驹、安泱、陈道清、顾雨婷、李智宇、孟迎霞、谭中意、王珊、张侃、鞠东颖、胡宇、Anna.AI(线上)、韩宪平(线上)。

图片关键词



首页
秘书处
开源通讯
开源活动