陶大程院士:大模型的上空漂浮着一朵“乌云”

昨天,中国信息通信研究院承办的WAIC 2024“迈向AGI:大模型焕新与产业赋能”论坛,于上海徐汇西岸拉开帷幕!本次论坛深度聚焦大模型产业应用落地、端侧智能、大模型安全与治理等前沿热点话题,携手全球AI领域顶级学者、行业领袖展开顶尖思维碰撞,共探大模型驱动新质生产力发展的新潜能,为行业呈现一场精彩纷呈的科技盛宴。

澳大利亚科学院院士、南洋理工大学杰出教授陶大程院士应邀作了题为“大模型的道术”的主旨演讲。

陶大程表示,从ChatGPT成功以来,大模型发展十分迅速,一定程度上可以看作是人和自然的博弈。随着超级大模型的诞生,人工智能的发展已经进入了平台期,走在十字路口的中央,产业界更应该思考大模型的道和术。“何为道?就是大模型的工作机制,何为术?就是大模型的实现和实践的具体路径。理解道,我们将会清楚大模型的工作机制和工作边界。在理解道的基础上,我们才有机会能够更好发挥术。正所谓,有道无术,术上可求,有术无道,止于术。”

陶大程指出,历经了80年的实践,神经网络终于在大模型时代证明了自己。在他看来,神经网络的发展动力主要来自于算力和数据的不断增长,特别是最近10来年,深度学习充分展示了它在发展进程中的实际价值,目前深度学习的发展已经进入了由大模型所驱动的超级深度学习时代。

陶大程认为,大模型的激动时刻莫过于它的涌现能力,但我们对什么是涌现能力还不够清晰。“一定程度上,当前大模型已经可以对产生的结果,做出相对比较合理的解释,只是我们还不能够完全信任这些解释。因为我们对大模型的基本工作原理还不够清晰,而这正是大模型的道。幻象总是在发生,但我们不知道什么时候发生,也不知道为什么发生。今天,大模型的上空也漂浮着一朵乌云,这朵乌云实际上让我们惴惴不安。”

陶大程指出,大模型的研究工程化和使用目前都面临诸多的挑战。比如,我们尚不清楚大模型是不是真的会思考?比如在大语言模型方面,复杂表述的困境,跨语言的幻觉甚至是翻译的误差;比如在文生图方面,视觉文本的错误对齐、畸形的手和脚以及多模态混合生成的具像错误等等。同时,我们还面临众多人工智能安全的问题,内生安全包括鲁棒性、隐私保护、公平性以及透明性,衍生安全方面包括了可靠性、偏见、笃性。

陶大程强调,虽然面临诸多挑战,但我们依然要向前,道虽不清,术上还要全力以赴。“大模型作为效率工具,我认为它是一个非常好的选择,可以广泛应用于娱乐、电商、搜索的业务之上,大模型将会对未来的人机交互产生划时代意义的变化和影响,人机交互将有机会实现全感知、沉浸式、无边界以及无障碍。”

本文转载自C114通信网,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请联系C114通信网通知我方删除,我方将在收到通知后第一时间删除内容!本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

Copyright © DoNews 2000-2024 All Rights Reserved
蜀ICP备2024059877号-1     京ICP证151088号
京网文【2018】2361-237号