COPU会议纪要丨2025.05.13
5月13日,陆主席主持召开COPU例会。
一、本次会议据豆包给出的手机企业2024年分别在全球和国内市场上销售的排行榜:
据豆包给出的手机企业2024年分别在全球和国内市场上销售的排行榜:
2024年全球市场手机企业销售量排名榜
1,苹果 出货量2,259亿部(下降1%)
2,三星 出货量2,229亿部(下降1%)
3,小米 出货量1,686亿部(增长15%)
4,传音 出货量1,067亿部(增长15%)
5,OPPO 出货量1,036亿部(增长3%)
2024年国内市场手机企业销售量排行榜
1,vivo 占17.2%份额(增长10.3%)
2,华为 占16.6%份额(增长50.1%)
3,苹果 占15.6%份额(下滑5.4%)
4,荣耀 占14.9%份额(下滑8.1%)
5,OPPO 占14.8%份额(下滑6.4%)
二、本次会议听取了中兴通讯关于研发基准测试超级智能体Super agent-Co-Sight的汇报。
中兴通讯开源Co-Sight智能体项目荣登GAIA基准测试榜首!
近日,在权威GAIA 基准测试中,开放智算产业联盟理事单位、LF AI & Data董事会成员中兴通讯开源了Co-Sight超级智能体,以72.72 的平均分荣登开源框架榜首。该项目也即将被开放智算产业联盟收录,携手推进开源智能体生态。
Co-Sight超级智能体简介
在大语言模型(LLM)与智能体技术飞速发展的今天,AI 已经从概念走向实践,成为驱动数字化变革的关键力量。无论是企业的业务创新,还是个人的智能助力,如何将 AI 深度融入流程、工作和生活,打造高效、灵活且可持续的智能体,正成为赢得未来的关键。为此,中兴通讯开源了Co-Sight超级智能体,让AI成为探索智能世界的强大引擎。凭借LLM推理、多智能体协作与DAG(有向无环图)任务调度等核心能力,Co-Sight成为人人可得的智能自动化底座,助力个人与企业释放人效潜能,激发无限创新力。
多智能体架构,构建“数字团队”的协同体系告别传统AI 工具的“单打独斗”,Co-Sight超级智能体采用领先的多智能体(Multi-Agent)架构,构建起高效的“数字团队”协同体系。主管智能体统筹调度多个执行智能体,各司其职,协同完成复杂任务。这种“数字团队”式的设计,使系统具备出色的任务拆解与流程协同能力。更重要的是,系统具备动态重规划与自适应容错能力,可在任务执行过程中自动应对突发情况,灵活调整策略,确保流程连续稳定,真正实现“高效且有韧性”的智能自动化。
DAG任务引擎驱动,自动化执行更加高效
在任务规划层面,Co-Sight超级智能体引入DAG机制,智能识别任务中的并发节点,配合多智能体并发执行,显著缩短整体流程周期。
执行层面,Co-Sight超级智能体提供了丰富的工具组件,涵盖:多种搜索引擎工具浏览器工具语音、图像、视频识别与理解工具文档阅读、理解、处理、生成工具命令行工具生成与执行代码工具生成分析报告工具从财务报表生成、数据采集到跨平台系统操作,Co-Sight超级智能体都能一站式完成,真正做到了从规划到执行一气呵成智能总结与反思,实现系统自我进化Co-Sight超级智能体不仅是一位高效的工作者,更是一位善于学习的“智者”。基于执行过程记录与模型推理,Co-Sight超级智能体能够自动进行复盘,生成智能总结报告,内容包括:成功关键点复盘失败原因定位优化建议反馈这一“智能反思机制”形成了持续自我进化闭环,帮助个人持续提升工作策略,助力企业不断优化流程与决策,实现从“人辅助系统”到“系统赋能人”的跨越式提升。
多重安全防护,打造稳健可信的自动化底座
在数据安全与执行稳定性方面,Co-Sight超级智能体坚持“安全优先”原则:所有操作在受控沙箱环境中进行,防止数据越界或泄露;系统日志实时记录,操作路径全程可追溯;支持权限管控与合规审计,保障企业运营安全无忧。无论是个人敏感数据处理,还是企业关键业务支撑,Co-Sight都为用户构筑稳健、可信赖的智能防线。
真实业务场景落地,价值触手可及
Co-Sight超级智能体已经广泛应用于多个真实场景,覆盖个人效率提升与企业流程创新。
行业研究报告:自动采集行业产量、营收、利润率等关键指标;对行业政策、竞争对手动态、市场需求进行深度分析;自动生成可视化图表(趋势折线图、结构饼图、SWOT 矩阵等)和结构化文字报告,将传统数天的撰写工作压缩至数十分钟内完成。
新闻热点分析:构建覆盖多新闻媒体,以及社交媒体多源实时信息通道,自动生成结构化报告与可视化简报,为决策者提供洞察全球舆情脉络的高端智库级分析。
旅行计划:集成航班、火车、酒店和景区门票等多源API,自动抓取最优价格与时刻表;基于用户偏好与历史出行行为,进行行程路径优化;动态获取目的地天气、交通状况与当地活动推荐;一键生成包含每日行程、地图标注、预算清单的详尽行程单,轻松完成从策划到预订的一站式服务。
综述论文:对接arxiv学术平台,自动检索并下载主题相关文献元数据;利用引用网络分析与主题建模,筛选高影响力论文并梳理研究脉络;结合模板化写作引擎,快速输出包含摘要、关键词、研究现状、未来展望的规范化综述稿,将人工数周的文献整理工作压缩至半小时完成。
未来展望
开放智算产业联盟将携手中兴通讯在内的成员单位,持续推动智能体生态建设,深化开源开放合作,让每一位用户——无论是个人探索者,还是行业领航者——都能借助如Co-Sight一样的开源项目,激发潜能、共创更加高效、智能、可持续的数字新时代。
Github链接:
https://github.com/ZTE-AICloud/Co-Sight
三、本次会议发表COPU在IBM程海旭博士、Deepseek(机器)协助下提出的点评中兴通讯关于研发、基准测试超级智能体Co-Sight的报告。
点评开源Co-Sight超级智能体在与世界强手博弈中荣登GAIA基准测试榜首
COPU
2025.05.13
中兴通讯研发的Co-Sight超级智能体,在与世界强手博弈中,力压谷歌Deep Mind的Langfun Agent、微软(+OpenAI)的AWorld、MIT OWL-Workforce、Meta Infant Agent等超级智能体,荣登GAIA权威基准测试榜首,掀起AI下一个浪潮!
(一)经GAIA(General AI Agent Benchmark)基准测试后的排行榜如下:
(1)中兴通讯
Co-Sight超级智能体,得分72.72
(2)谷歌DeepMind
Langfun Agent超级智能体,得分71.52
(3)微软 (基于GPT-4开发的)
Aworld超级智能体,得分69.70
(4)麻省理工学院(MIT)
OWL-Workforce超级智能体,得分69.09
(5)Meta
Infant Agent超级智能体,得分56.97
(二)下面我们介绍GAlA基准测试机构是否具备权威性?
GAlA即General AI Agent Benchmark,是近年来在AI领域领颇受关注的综合评估基准,由法国AI研究机构Huggingface联合多家高校于2023年提出的。
该基准聚焦于:
①多模态任务处理能力(文本/图像/代码)
②复杂问题分解能力
③多智能体协作效率
④长期记忆与知识更新机制
⑤其测试集还包含2000+涵盖金融、医疗、制造等领域的真实场景任务,已成为评估工业级智能体权威的参考标准。
(三)下面介绍各对比智能体的技术背景
1)中兴通讯(ZTE)的Co-Sight超级智能体是一个智能体自动化底座或主管智能体,将统筹调度并采用LLM推理引擎、DAG执行技术等核心协作机制,使多个执行智能体各司其职,协同完成复杂任务。
2) Langfun Agent,谷歌DeepMind开源框架,Langchain的增强版本,2023年由斯坦福HAI研究所扩展了动态策略网络模块。
3) AWorld,微软研究院基于GPT-4架构开发的认知架构系统,突出特点是具备自解释的推理链(Chain of Thought)。
4)OWL-Work force,MIT CSAIL实验室研发的符号-神经网络混合架构,采用OWL本体语言进行知识表示。
5)Infant Agent, Meta FAIR实验室的分布式协作框架,核心是其专利的意图传播算法。
(四)介绍核心协作机制解析:
1) LLM推理引擎
采用混合推理架构(Hybrid Reasoning Architecture):
—符号推理层:基于Datalog的规则引擎处理结构化知识
—神经推理层:微调的LLM(参数规模175B,处理非结构化数据
—两者通过Attention based Fusion Module进行交互
—创新性引入“推理凭证”(Inference Credential)机制,通过贝叶斯置信网络动态评估各子智能体的推理可信度
2) DAG协作机制
—基于改进的Airflow框架构建动态DAG:
l节点:智能体封装为Docker化的微服务
l边:通过gRPC-streaming实现低延迟通信
—动态特性:
l实时拓朴重构(响应时间<50ms)
l带约束的资源调度(使用NSGA-11多目标优化算法)
l容错机制:采用区块链式状态同步(每5秒生成状态默克尔树)
—关键技术指标:
l最大并发子任务数:1024
l上下文切换开销:<3%
CPU利用率
l异常恢复时间:平均200ms(基于CR14检查点技术)
中兴Co-Sight的创新点在于其“三层注意力”机制:
在传统 Transformer架构基础上增加了①任务间注意力矩阵,②资源依赖图注意力,③历史轨迹注意力,这使得其在GAIA基准的“跨域任务迁移”测试项中获得92.7%的准确率(第二名OWL-Workforce为83.1%)。
注:中兴通讯这篇Co-Sight超级智能体基准测试,将在NeurIPS2024上发布完整的技术白皮书。
四、本次会议决定发行COPU《人工智能文集》第二十六集
五、本次会议讨论召开《第20届开源中国开源世界大会》筹备工作。
参会人员:陆首群、宋可为、章文嵩、陈越、安泱、袁怿、谭中意、孟迎霞、张侃、王珊、程海旭、鞠东颖、陈绪(线上)、陈钟(线上)、陈伟(线上)、陈道清(线上)、靳虹博(线上)、韩宪平(线上)、胡宇(线上)、Anna.AI(线上)。