COPU会议纪要2024.02.20
2月20日(周二)陆主席主持COPU例会。
他在会上首先通报OpenAI于2月15日发布首个视频生成模型Sora。Sora由文本生成视频,或根据静态图片生成动态视频,并能生成长达1分钟的高质量视频;而引起人们高度重视的是Sora初步理解客观世界发展规律,在一定程度上能预判视频下一步动作,也能迎接周边环境的挑战:例如,在视频中表现一位妇女走路时,Sora可显示其衣裙随风飘动,其影子跟随她移动;又如,在视频中表现自动驾驶和无人驾驶时,它能预测到车辆在高速行驶中遭遇隐藏在可见障碍物之后的不可见障碍物时,要在0.5秒之内作出反应规避碰撞(Sora或许可成为谷歌旗下Waymo或百度推动自动驾驶和无人驾驶研发的解决方案)。
Sora视频包含高度细致的背景、复杂的多维度镜头、富有情感的多个角色,还能预判制作视频的动感;将其感知能力提升到认知能力(Sora可能为IBM Watson Health研发医疗人工智能无法将感知智能提升到认知智能提供解决方案)。
Sora也还存在很多缺点,还不能很好契合真实世界的物理特性。
Sora刷屏比早些时候横空出世的大模型ChatGPT(一款生成式聊天机器人程序)更令人震惊,Sora也是大模型研发进入通用人工智能(AGI)的标志。
在本次会议上,陆主席发表一篇“谈人工智能”的文章;供诸位评议和参考:
他在文中谈到人工智能发展现状,目前全球人工智能基本还处于机器学习/深度学习为主的弱人工智能发展阶段,并正在探索向强人工智能的发展路径。
一、异步脉冲神经网络+神经拟态计算系统(即类脑计算机)是一条探索的路径
在全球,英特尔、曼彻斯特大学、浙江大学的研究团队分别于2017、2018、2019年研发了类脑计算机,打破传统计算机冯•诺伊曼计算架构并于2018、2019、2020年相继制成类脑原型机。
以英特尔为例,原型机制成迄今已5年了,因何原因还推迟其科技成果上市?究其原因:
1、与传统计算机相比,改善的性能尚不够突出神经拟态计算系统运算速度达10的14次方/秒(浮点运算),比传统计算机快1000倍,仍落后于当前E级超级计算机的运算速度百亿亿次(10的18次方/秒)落后10的4次方/秒,即1万倍,比我国最近研制成功的量子计算机(10的21次方/秒)更落后1千万倍。只是其能耗比传统计算机省10000倍,这个性能比较突出。
2、正在探索中的应用特点还不突出,探索未来的应用前景为:
① 超算(存在多路径搞超算)
② 用于非结构数据实时应用场景,
③ 多模态实时场景(如机器人、无人机需持续学习,自适应的场景)英特尔于2020年3月成立神经拟态研究社区(InRC)以开拓应用场景(IBM、HP、MIT、斯坦福大学、普渡大学等参加社区开发应用)
二、可解释性机器学习也是一条探索的路径
机器学习/深度学习是一种强大的数据分析工具,它属于弱人工智能范畴,但机器学习/深度学习是有缺陷的,它本质上是黑盒子技术,其模型是不可理解、不可解释的,只有打破黑盒子实现可解释性的机器学习,才能使之转化为强人工智能。
IBM AI研究所于2019年在全球发表首例可解释性机器学习的研发成果,随后在COPU与IBM的不断讨论中认为还需要改善可解释性的机器学习;即改善可解释性的运算程序多少是有不确定性因素(不鲁棒),以及在作评估时也对于粗略,期望改善可解释性机器学习的鲁棒性和评估的精确度。
希望进一步分析COPU迄今收到的全球数百例可解释性机器学习的案例,以及进一步讨论IBM的解决方案。
三、关于大模型的路径问题
1、讨论有人提出大模型是否存在不鲁棒、不可信、不可控的三个天花板?
2、讨论在谈人工智能文章中找出的COPU对大模型的见解
3、讨论2024年1月15日OpenAI发表的Sora问题特别是Sora初步理解客观世界发展规律,能预测视频下一步运作,对其发展通用人工智能(AGI)的意义。
四、关于与Daniel Povey讨论kaldi语言识别的进展问题
COPU曾约定Daniel进行第三次讨论
陆主席曾向Daniel Povey建议参照大模型产生的“推理-生成”机制解决下一代kaldi发展问题(有待了解其进展)。
五、关于新知识工程、脑机接口,以及探索下一代通用人工智能(及机制主义人工智能)问题,在本次会议上略。
六、本次会议还听取英特尔人工智能大模型布道者邓伟所作的国外大模型发展综述的报告。
七、最后,陆主席谈到最近在网上任意将开源变成闭源的争论问题:
近来,涉及将开源软件构成闭源是否违法的争论在网上又起,其实这是如何对开源软件的概念深刻理解问题,这又是一起老生常谈!我们在历史上的会议纪要中曾与自由软件基金会的首席律师Eben Moglen(GPL等开源许可证起草者)讨论这个问题(希望COPU成员查阅COPU历史的会议纪要)。
在这里,我先谈几点意见吧!
我同意宋可为在讨论中谈到的:
不遵循开源协议的维权是难以成功的,不应存在侥幸心理。
把开源软件构成闭源居然不承担法律责任是不可行的。
我与Eben Moglen谈到,制定开源许可证的目的一是作为开源软件开发、修改、发行的遵循,二是保护原著作者的权益(两者不要对立起来)。
参会人员:陆首群、周楠、陈伟、孟迎霞、田忠、丁蔚、梁志辉、章文嵩、安泱、宋可为、刘巍巍、鞠东颖、邓伟(线上)、耿航(线上)、隆云滔(线上)、张路(线上)、陈越(线上)。