本篇文章4266字,读完约11分钟

2020年是不寻常的一年,全球卫生、贸易、经济、文化、政治和科技领域发生了深刻变化。作者的科学技术领域也恰逢现代人工智能(ai)发展十周年。在最初的10年里,人工智能技术取得了巨大的进步,但仍有许多问题有待解决。那么,人工智能技术在未来将如何发展?本文结合学术界和工业界的研究成果,以及作者个人的研究观点,从计算能力、数据、算法和工程四个维度,与读者一起探讨和展望人工智能的未来发展。

苏宁金融研究院:如何看待人工智能未来十年的发展?

一个

我们首先分析数据发展的趋势。人工智能的数据就像美味菜肴的配料。在过去的10年里,获得的数据的数量、质量和类型都有了显著的增长,支持了人工智能技术的发展。未来,数据发展的趋势是什么?让我们看一组分析数据。

首先,世界互联网用户数量已经达到十亿左右。随着物联网和5g技术的进一步发展,更多的数据源和传输能力将得到提高。因此,可以预见,数据总量将继续快速发展,增速将会加快。根据idc的数据报告(图1),数据总量预计将从2018年的33zb(1zb=106gb)增加到2025年的175zb。

其次,行业预测数据的存储位置仍将是集中式存储,使用公共云存储的数据比例将逐年增加,如图2和图3所示。

上述未来数据趋势可以概括如下:数量持续增长;云中的集中式存储;公共云的渗透率持续上升。从人工智能技术的角度来看,可以预期数据的持续供应是有保证的。

另一方面,人工智能技术不仅需要原始数据,还需要标记数据。标注数据可以分为三类:自动标注、半自动标注和手工标注。

那么,数据标注的未来趋势是什么?

我们可以看到标注数据工具市场的趋势,如图4所示。可以看出,在未来5-10年内,人工标注数据仍将是标注数据的主要来源,概率很高,占75%以上。

通过对上述数据维度的分析和预测,我们可以得出这样的判断:数据量本身并不会限制人工智能技术,但是人工标注的成本和规模很可能会成为限制人工智能技术发展的因素,这将迫使人工智能技术从算法和技术本身上有所突破,有效解决对数据的依赖,尤其是人工标注数据。

第二计算能力

让我们再来看看计算能力。计算能力本质上是对人工智能技术的一种基础设施支持,就像厨灶是为美味的食物准备的一样。

计算能力是指实现人工智能系统所需的硬件计算能力。半导体计算芯片的发展是人工智能计算能力的根本驱动力。好消息是,虽然半导体行业的发展有起有落,总是伴随着对可持续性的质疑,但半导体行业著名的“摩尔定律”已经经受了120年的考验(图5),相信在未来5-10年内仍将稳步发展。

然而,值得注意的是,摩尔定律在计算芯片领域仍然得以维持,这在很大程度上是由于图形处理器(gpu)的快速发展,这弥补了通用处理器(cpu)的发展缓慢。如图6所示,从图中可以看出,gpu的晶体管数量比cpu的增加更多,cpu的晶体管已经开始落后于摩尔定律。

当然,半导体晶体管的数量可以反映整体趋势,但它还不足以准确反映计算能力的发展。对于人工智能系统,浮点运算和内存是更直接的计算能力指标。让我们详细比较gpu和cpu的性能,如图7所示。可以看出,近10年来,gpu在计算能力和内存访问速度上远远超过了cpu,填补了cpu性能发展的瓶颈。

另一方面,根据未来产业研究所梳理的数据,就2019年的人工智能芯片收入规模而言,gpu芯片约占27%,而cpu芯片仅占17%。由此可见,在以深度学习技术为代表的人工智能领域,gpu已经成为硬件计算的标准配置,其形成的原因也很简单。现有的人工智能算法,尤其是在模型训练阶段,对计算能力的要求不断提高,而gpu的计算能力只是远远强于cpu,是一种与人工智能算法模型本身耦合度较低的通用计算设备。

苏宁金融研究院:如何看待人工智能未来十年的发展?

除了图形处理器和中央处理器,其他计算设备,如专用集成电路,fgpa和其他新兴的人工智能芯片,也在发展,这值得业界的关注。鉴于数据在未来仍将很有可能存储在云中,这些芯片能否在确保通用性的同时提高性能和效率,能否被云供应商大规模部署并得到软件生态的支持,还有待观察。

三种算法

现在我们来分析一下算法。人工智能算法是厨师和美食之间的关系。在过去的10年里,人工智能的发展、数据和计算能力都起到了很好的支撑作用,但不可否认的是,深度学习算法及其应用相结合所取得的性能突破是人工智能技术在2020年达到里程碑式发展阶段的重要原因。

那么,人工智能算法的未来发展趋势是什么?这个问题是学术界和工业界讨论的核心问题之一。人们普遍认为,人工智能技术在过去10年的发展得益于深入的学习,但这一发展道路带来的计算能力问题难以持续。让我们看一张图片和一组数据:

1.根据openai的最新计算,自2012年以来,训练大型ai模型的计算能力增加了30万倍,即平均年增长率为11.5倍,而计算能力的硬件增长率,即摩尔定律,仅达到平均年增长率1.4倍;另一方面,算法效率的提高平均每年节省约1.7倍的计算能力。这意味着,随着我们继续追求算法性能的不断提高,平均每年的计算能力不足约为8.5倍,这令人担忧。一个实际的例子是gpt-3,这是今年发布的最新的自然语义预训练模型。仅培训费用就达到了1300万美元。这种方式是否可持续值得我们考虑。

苏宁金融研究院:如何看待人工智能未来十年的发展?

2.麻省理工学院的最新研究表明,过度参数化的人工智能模型(即参数比训练数据样本多)满足一个理论上限公式:

上述公式表明,在理想条件下,其计算能力需求大于或等于性能需求的4次幂,并在imagenet数据集上对2012年至今的模型进行了分析。现实是它在第九功率级上下波动,这意味着现有的算法研究和实现方法在效率空.方面得到了极大的优化

3.根据以上数据,估计当imagenet中的错误率达到1%时,人工智能算法将花费1亿万亿美元(10到20次方),其成本是无法承受的。

结合上述对数据和计算能力的分析,我相信读者会发现,未来标注数据和计算能力的高成本意味着数据红利和计算能力红利正在逐渐消退,未来人工智能技术发展的核心驱动力将主要依靠算法层面的突破和创新。根据最新的学术和工业研究成果,作者认为人工智能算法的未来发展可能具有以下特点:

shachihoko

(1)先验知识表示和深度学习的结合

纵观人工智能70多年的发展历史,象征主义、联结主义和行为主义是人工智能早期发展中形成的三大学术流派。如今,以深度学习为代表的联结主义已成为过去10年发展的主流,而行为主义在强化学习领域取得了重大突破,Go brain alphago的成就已家喻户晓。

值得注意的是,最初独立开发的三所学校开始以深度学习为主线整合技术。例如,2013年,dqn网络在强化学习领域被发明,其中采用了神经网络,这开辟了一个新的研究领域,称为深度强化学习。

那么,象征主义算法也会与深度学习相结合吗?一个热门的候选是图形网络技术,它与深度学习技术相融合,形成了深度图形网络的研究领域。图网络的数据结构易于表达人类的先验知识,是一种更具一般性和推理能力(也称归纳偏差)的信息表达方法,这可能是解决深度学习模型中数据饥饿、推理能力不足和输出结果缺乏可解释性问题的关键。

苏宁金融研究院:如何看待人工智能未来十年的发展?

(2)模型结构借鉴了生物科学

深度学习模型的模型结构由前馈和反向传播组成。与生物神经网络相比,模型结构过于简单。深层学习模型结构能否从生物科学和生物神经科学的进步和发现中得到启发,从而找到更好的模型是一个值得关注的领域。另一方面,如何在深度学习模型中加入不确定参数建模,使其更好地处理随机不确定性也是一个可能的突破领域。

苏宁金融研究院:如何看待人工智能未来十年的发展?

(3)数据生成

人工智能模型的训练依赖于数据,这在目前不是问题,但是人工智能模型的训练依赖于人工标注数据,这是一个令人头痛的问题。利用算法有效地解决或大大减少模型训练对人工标注数据的依赖是一个热门的研究领域。事实上,美国国防部高级研究计划局(darpa)已经把这个领域作为其ai3.0发展计划的目标之一,显示了它的重要性,该局已经在人工智能技术的发展中隐约可见。

苏宁金融研究院:如何看待人工智能未来十年的发展?

(4)模型自我评价

现有的人工智能算法,无论是机器学习算法还是深度学习算法,本质上都是通过闭环训练和开环推理发展起来的。通过设计模型的自我评价,开环系统能否演化为闭环系统,也是一个值得研究的领域。通信领域、控制领域等行业的大量算法实践表明,闭环算法系统在性能和输出可预测性方面普遍优于开环系统,闭环系统可以大大降低性能衰减的可能性。闭环系统的这些特性为提高人工智能系统的鲁棒性和对抗性提供了一种思路和方法。

苏宁金融研究院:如何看待人工智能未来十年的发展?

4.工程

以上对人工智能的数据、计算能力和算法进行了梳理和分析。最后,让我们看看工程学。人工智能工程,就像烹饪美味食物的厨房用具一样,是一种结合了数据、计算能力和算法的媒介。

工程的本质功能是提高效率,即最大限度地利用资源,最小化信息之间的转换损失。用一个简单的比喻来说,要做出美味的食物,所有的配料、灶具和厨师都有,但是没有合适的厨具,厨师就不能烹饪(算法)、处理配料(数据)和使用灶具的水和电(计算功率)。因此,可以预测,工程的未来发展是从当前的9次幂到理论上限4次幂来处理上述计算能力和算法性能之间的关系的重要手段之一。

苏宁金融研究院:如何看待人工智能未来十年的发展?

在过去的10年里,人工智能的工程化发展已经形成了一个清晰的工具链系统,并在不久的将来伴随着一些显著的变化。作者总结了一些明显的趋势如下:

总而言之,人工智能工程正在形成一套完整的工具链,从用户终端到云,使用python作为编程语言。它的三个重要特性是:远程编程和调试,gpu加速支持深度学习和机器学习,以及模型训练和推理工具链的解耦。同时,产业链上游厂商的大量投资将为产业链中下游的企业和个人带来技术红利,降低他们的研发门槛和成本。作者认为,主要由微软、脸书和英伟达推广的开源工具链值得特别关注。

苏宁金融研究院:如何看待人工智能未来十年的发展?

五.结论

一些人将人工智能技术在过去10年的成就归功于数据,而另一些人将其归功于计算能力。在人工智能技术的未来发展中,作者大胆预测算法将是核心驱动力。同时,算法开发的实际效率不仅取决于算法结构本身,还取决于设计者对高级工具链的掌握程度。

在接下来的10年里,科技界能以更少的数据和更经济的计算能力获得真正的通用智能吗?我们将拭目以待。

本文转载自《苏宁财富信息》。本文由平台/作者授权的金融网站发布。请不要擅自转载。如果你对干货有意见或文章,你愿意为投资者提供最权威和专业的参考意见。无论你是权威专家、金融评论家还是智囊团,我们都欢迎你积极投稿,进入金融网站的著名栏目。
电子邮件地址:mingjia @ jrj,电话号码:010-83363000-3477。期待您的加入!

标题:苏宁金融研究院:如何看待人工智能未来十年的发展?

地址:http://www.hhhtmd.com/hqzx/5461.html