当前位置:首页 > 上海 > 教育资讯

香港科技大学首席副校长郭毅可 : 如果大模型是答案, 那么什么是问题

在近日举行的解放日报第79届文化讲坛上,香港科技大学首席副校长郭毅可做了主题演讲。他在现场提出了一个有趣的问题——“如果大模型是答案,什么是问题”。他分析了当前大模型发展面临的技术挑战、未来大模型发展的必然趋势,分享了香港打造人工智能生态系统的经验,并对上海的人工智能发展提出了建议。以下是演讲主要内容。

英国皇家工程院院士、欧洲科学院院士、IEEE(美国电气电子工程师学会)会士,香港科技大学首席副校长。作为国际知名的计算机科学家,他的主要研究领域为机器学习与数据挖掘,在机器学习算法及医学大数据分析系统、人工智能艺术等领域作出了重要贡献。

大家好!我还是讲普通话,讲上海闲话交关人听不懂(上海话)。非常有幸,能够在家乡上海的舞台上演讲。我小时候家里订的报纸就是《解放日报》,所以今天《解放日报》向我发出邀请,我肯定会来(台下发出笑声)。

人工智能已经深入人心。我也没有想到,我原来以为这个世界上有男人和女人就够了,现在还要加上机器人。我今天演讲的主题是:如果大模型是答案,那么什么是问题。我来讲一讲,人工智能的飞跃现在刚刚开始,它未来会怎么发展。

『人工智能可以做什么』

首先,人工智能得以发展,是因为有了一项伟大的技术,叫作神经元网络。人工智能主要是通过神经元网络来模拟人脑。

1942年,奥地利心理学家赫布发表了一篇重要的文章,其中讲了大脑神经元的连接原理。当大脑受到刺激以后,大脑中的一些神经元就会发生连接,如果不断刺激它的话,这些连接会越来越强。神经元的连接实际上是刺激的结果,如果把学习看作一种刺激,那么神经元之间的连接就是学习的表现。神经元网络就是一种模仿大脑神经元之间连接的计算模型。我们不断地给它输入数据,为的是构造不同神经元网络的连接。神经元网络的连接由代表连接的强度的参数来表达,在学习的过程中,我们不断去改变连接的强度,从而使模型的输出能够满足我们的要求。总而言之,这是一种用神经元网络来模仿大脑学习过程的机制。

那么,人工智能可以做什么事情呢?简单来说可以做两类事情。

第一类是判别。判别就是区分不同,区分不同是预测的基础。要知道数据是属于哪一类,先进行数据标注,用标注好的数据来训练模型。有了模型,输入一个不知类别的数据后,模型可以根据特征判定它属于哪一类,这叫判别。比如,图象识别就是一种典型的判别。人脸识别,模型看了很多人的脸以后,这个人是男的还是女的、年轻的还是年老的,根据特征就可以进行判别。

另一类是生成。生成的顺序和判别正好相反。不需要数据标注,我们把所有的数据都输入计算机,它自己来总结数据的特征,再把这个数据进行聚类,有了类别以后,我们就可以要求计算机生成某一种类别的东西。比如,我要计算机生成一棵树,因为模型知道树的特征,它就可以生成一棵它没有见过的树,这就是生成式的人工智能。生成式的人工智能是如今人工智能的主流。以前我们为什么做不到呢?因为以前我们没有这么大的计算机,那么多的数据,也没有这么好的算法。今天我们有了这么大的计算机,有了这么多的数据,我们可以把全世界所有的文字输入计算机,它就会总结出语言的特征,并根据语言的特征生成文字。

有了这个生成式的大模型,人工智能被改变了。原来的人工智能都是解决具体问题的。比如要下围棋,就做一个下围棋的模型。比如要研究蛋白质折叠的问题,就做一个相关的模型。而现在,我们做的是一个基础模型。把所有在互联网上可以获得的文字数据、图象数据、声音数据都输入计算机,让它自己学习这些数据,学完以后,就可以生成各种图片和语言,这就是一个基础模型。在这个模型的基础上,可以形成各种各样的垂直应用。比如,要生成一幅国画,要生成中文,要生成一部医学文献,要生成一个戏剧剧本,都可以通过输入特别的样本,对基础模型进行微调,来形成相关的应用。

所以,大模型的发展在ChatGPT诞生以后呈现出指数级的上升。国内也产生了很多的大模型,几乎每天诞生一个,出现了爆发式增长。

『为什么语言模型如此重要』

有人说,ChatGPT不就是一个人工智能的语言对话系统嘛,为什么它如此重要?谈到它的重要性,要从两篇文章讲起。

第一篇文章是《计算机械与智能》,其作者是大名鼎鼎的英国计算机科学家、被誉为“人工智能之父”的图灵。还有一篇是“控制论之父”、美国数学家维纳发表的文章《人有人的用处——控制论与社会》。这两篇文章都是1950年发表的,可以说,它们开启了人工智能的研究之路。

图灵说:机器有没有智能?怎么界定机器的智能呢?一个比较好的界定方法就是,当一个机器跟人对话的时候,你不能分辨对话者是机器还是人,这就表明机器有了智能。这个测试方法被称为“图灵测试”。所以,语言是界定人工智能是否具有智能的一个重要标准。

维纳在文章中提出了两个问题。首先,他认为机器一定会具有智能,当机器具有智能以后,人和机器在社会中共存的一个重要形式就是人机互相交流、互相对话。其次,这样的机器是怎么产生的?维纳第一次提出,当复杂度达到一定程度时,机器会“涌现”出这样的智能。

为什么图灵会用语言来界定机器是否具有智能呢?奥地利哲学家维特根斯坦有一句名言:“我语言的边界,就是我世界的边界。”语言不仅是交流的工具,更重要的是,语言是思想的体现。语言是我们对世界的“表达模型”,语言是对客观世界的主观编码。从这个意义上来讲,语言的重要性非同寻常,计算机能够讲人类的语言,就意味着它有了和我们相似的智能。

此外,语言还决定了思维方式。如果语言不同的话,我们的思维方式也会不一样。有一部著名的科幻电影叫作《降临》,是根据美国华裔科幻作家姜峰楠的小说改编的。电影讲了一个道理,那就是语言对思维具有非常重要的作用。一群外星人乘坐飞船来到地球,跟我们交流,但我们不懂他们的语言。后来有一位语言学家通过学习对方的文字,终于理解了他们。原来,他们的语言是非线性的,因此他们的思维也是非线性的,可以超越时空的限制。所以说,语言非常重要,如果机器学会了人类的语言,也就学会了人类的思维。

还有更重要的一点,人类的语言不仅仅是思维的编码,人类的语言还有感情,还有能量。比如,我现在跟大家讲话,其中就充满了能量,我想表达我的理念,也希望你们能够接受我的理念,因此就有一种能量的传播。人类语言的精髓在于,语言的内涵是信息,语言的外延是能量。

以上就是人工智能的语言模型如此重要的原因。

『大模型未来的发展趋势』

大模型到底是什么?语言大模型是互联网的信息压缩和提炼。它是所有互联网信息的一个压缩、一个编码,通过这个编码,可以生成语言、文本、图片等。

随着大模型的进一步发展,它现在可以做什么呢?我们把各种各样不同的信息——语言、图像、文本进行输入,通过编码对齐,可以得到多模态的结果。比如,我们给ChatGPT看一张图,然后问它可以用图片上的这些原料做什么。它通过判别,发现图片中有鸡蛋、牛奶、面粉等,然后它会告诉你,用这些原料可以做煎饼、吐司、蛋糕、面包、饼干等等。这是一个典型的例子,现在的大模型越来越倾向于多模态,由多种数据协同推理。

未来,大模型的发展趋势是什么?在我看来,大模型发展的必然趋势是拟人化,越来越像人。从输入来说,它不仅会听,还能看;从模型来讲,现在它会理解,慢慢地它还会思辨。思辨和理解是不一样的,思辨需要有价值观,它会跟你辩论,它知道什么是对的、什么是错的,而且会向你证明。不像现在的ChatGPT,你问问题,机器回答你而已,未来发展更重要的一步是,它可以问你问题,甚至反驳你的问题,也就是说它有自己的价值观,自由意志;从输出方面来说,它不仅会表达,未来还会有行动。这就是具身智能,它可以行动,比如看见东西要掉下去了,机器知道怎样把它接住。未来,计算机科学会变成机器行为学,这是我们需要研究的一个重要方向。总而言之,人工智能会越来越融入我们的生活。

那么,现在的人工智能已经发展到了什么样的水平?2013年的时候有一部非常有名的电影叫作《她》,讲述了人与人工智能相爱的科幻故事。电影中的人工智能不仅能对话,而且还有感情,使得男主角爱上了她。现实和电影的距离正在拉近。2024年5月14日,OpenAI公司发布了GPT-4o,现在的GPT已经有了情绪对话的能力,它甚至可以打断你,虽然它还没有跟人辩论的能力,但它已经能够打断你了。它可以在短至232毫秒、平均320毫秒的时间内对音频输入做出反应,这几乎已经跟人一样了。

『我们现在应该做什么』

我们在香港进行生成式人工智能的研究,但我们的做法跟国内不太一样。在香港,我们不是做很多模型,我们只做一个基础模型,主要是为香港的人工智能企业和香港社会服务,各种研究机构、企业、创新公司都可以到这个平台上进行开发、应用。这个基础模型叫“香港仔(HKGAI)”。它有语言系统,可以对话;也可以写作,学生、政府官员都可以用它来进行写作;还可以做一些多模态的工作,比如用一个人的图片生成动画。

最后,我来讲讲人工智能的技术挑战。技术挑战包括三个方面,一个是算法,一个是数据,一个是算力。

从数据来讲,最大的问题是我们几乎已经穷尽了数据,我们把世界上几乎所有的数据都拿来训练大模型了,数据总是有限的,但我们需要更多的数据、更多的信息来训练大模型。

从算力来讲,有一个叫作扩展律的概念,就是说能力越大,效能越好,但是算力总是有限的,而且我们目前还受到芯片的制约。

从算法来讲,主要有三个问题。首先,我们需要研究怎样避免重复的学习,怎样保证大模型对新的数据不进行重复训练。其次,数据不是没有了,而是被压缩了,既然模型是数据的完美压缩,那么高阶的学习将是在模型上的学习。最后,机器智能和人类智能的培养实际上具有两极性,也就是机器智能和人类智能的培养、训练方法是相反的。人是怎么培养的呢?我们小时候培养的是童心、好奇心,然后培养价值观,了解什么是好的、什么是坏的、什么事情是有价值的、什么事情是不能做的。再后来学习书本知识,最后是积累社会经验。而人工智能是反过来的,一开始,不管三七二十一把所有的数据都给它,训练一个通用大模型,然后进一步垂直化,微调一个个系统,完了之后发现所有的东西都没有价值观,没有思考的能力,所以再开始学习价值观,而最难的是把所有的东西抽象成一个个常识和概念。所以,未来算法最具有挑战性的是,怎样让机器学会价值观,怎样让机器学会常识,并且,怎样让机器记得住、用得上这些常识。

最后,我想对上海人工智能的发展提几点建议。我认为,大模型是一个基础设施,就像地铁,它是一个公共开发的平台,只做一个基础大模型就好,做很多的话会重复。因此,要建设一个上海基础大模型,形成产业生态,可以在这个公共平台上开发各种不同的垂直应用和社会服务,在教育、政务、医学、金融、文创等领域做出世界水平的应用实例。更重要的是,以上海丰富的学术资源为基础,进一步加强基础研究,研究新的算法。最后,千万不要忘了,人工智能的治理非常重要,上海作为国际化大都市,应当建立一个开放性的人工智能治理研究机构,以上海的人工智能应用为背景,做出人工智能治理的国际典范。

今天,我们越来越把机器做成人的样子,未来,我们的社会将会由三种人构成,那就是男人+女人+机器人,而我们的社会还没有为此做好准备。我想,做好人工智能治理的研究工作,把人工智能融入我们的社会、融入我们的生活,这将是我们为人类所做的很大的贡献。谢谢!(全场掌声)

本文来自网络,不代表教育资讯立场,转载请注明出处。