作者|西施
编辑|陈彩县
刚才斯坦福大学发表了著名的《2022年人工智能报告》(Artificial Intelligence Index Report 2021,以下简称“报告”),在人工智能领域迅速传阅。
报告链接:
从2017年开始,斯坦福大学的AI Index每年都发表报告。由于数据详细信息、调查来源明确性、观点充实性等优点,在总结过去一年AI发展方面有比较权威的声音,引起了读者的关注。到今年为止,李飞飞领导的HAI实验室领导已经是第五版了。
除了以前的技术趋势分析外,今年该报告还增加了对全球机器人的调查以及对25个国家和地区(中国除外,所以这里不讨论)的AI层面的立法活动。
更值得注意的是,今年斯坦福的AI指数报告首次广泛讨论了人工智能在经济发展中的作用,以及人工智能在现实生活中的落地问题,包括AI在落地推进过程中可能产生的潜在伦理问题。
报告一方面指出,外部投资在AI领域的比例正在上升。与2020年(460亿美元)相比,2021年AI投资资金增加了103%(965亿美元)。另一方面,AI表现出“更漂亮、更便宜”的特点。例如,自2018年以来,教育图像分类系统的费用减少了63.6%,但培训效率减少了94.4%。
但是另一方面,AI在现实中的渗透也加剧了社会伦理危机。因此,我们可以看到对AI的讨论不再是模型和算法的创新,连接主义和符号主义哪个更好。人工智能时代正式开始之前,我们应该准备什么样的“基础水平”?(阿尔伯特爱因斯坦,美国作家)。
由于报告内容达200多页,AI技术评论仅从中美对比的角度整理了报告。
1
中美研究比较
报告显示,据研究机构称,全球高校对AI研究刊物的贡献比例最高,为59.58%,而公司仅为5.21%。
仅在这一水平上,美国的AI出版物中,高校比例在2021年为57.63%,企业为9.76%。
中国的AI出版物中,高校比例上升到60.24%,企业比重也持续上升,但2021年只有3.93%。
尽管中美关系紧张,但从2010年到2021年,中美合作的AI论文数量在跨国合作论文数量排名中排名第一,是第二位(中英合作)的2.7倍。
报告还比较了与中国、欧盟英国和美国过去12年AI出版物的比重。其中,中国人数为31.04%,其次是欧盟和英国(19.05%),美国以13.67%保持第一位。
/T0gCPES7M7LryO?_iz=31825&from=ar;x-expires=1707061087&x-signature=GlIHDqY19Ihln5hp1VF8rmNgNCc%3D&index=5" width="640" height="340"/>在 AI 期刊论文的引用数上,中国的占比逐渐上升,2021年排名第一(27.84%),美国的被引用数则为 17.45%:
在 AI 会议上,中国的论文发表数量也是排名全球第一,占比 27.6%,而美国为 16.9%,位居第三:
尽管出版数量上中国占优势,但报告发现,美国在 AI 会议上的论文被引数最高,占比29.52%,中国则只有15.32%:
在AI存储库(如arXiv)出版物上,美国自2011年以来一直保持领先地位,2021年占比 32.52%,但中国也不甘落后,比例一直上升,2021年占比16.6%:
在AI存储库出版物的引用数上,美国在2021年也是位居第一,引用率高达 38.6%,而中国为 16.4%:
在人工智能专利的申请上,2021年中国申请了全球一半以上的人工智能专利(51.69%),美国则为 16.92%:
2
中美 AI 市场对比
首先,在人才招聘一块,报告显示,中国香港在 AI 人才的招聘增长速度上位于全球第二,较 2016 年增长了 1.56 倍:
通过计算 2015 年至 2021 年期间 LinkedIn 用户在给定领域的自我添加技能的频率,报告发现,在AI 技能的渗透率上,印度的平均渗透率最高,其次是美国(2.24),而中国为 1.56,排名全球第四:
此外,在 AI 产业的投资上,美国的 AI 公司在获得总体私人投资上位居世界第一,约为 529 亿美元,而中国位居第二,为 172 亿美元,美国是中国的三倍:
而在2013年至2021年的私人投资总额上,美国投资总额为 1490 亿美元,中国投资总额为 619 亿美元:
值得注意的是,从 2013 年到 2021 年,美国对人工智能公司的私人投资是中国的两倍多,而中国本身是同期英国总投资的六倍左右。按地理区域划分,如图 4.2.6 所示,2020 年至 2021 年美国、中国和欧盟的投资均有所增长,其中美国分别领先中国和欧盟的 3.1 倍和 8.2 倍:
从 AI 公司的数量上看,2021 年,美国以 299 家公司领先,其次是中国,有 119 家:
在 AI 的采用率上,2021年采用率最高的是高科技/电信的产品和/或服务开发(45%),其次是金融服务的服务运营(40%), 高科技/电信(34%)和金融服务的风险职能(32%):
而采用的 AI 能力类型上,2021 年,嵌入率最高的是高科技/电信行业的自然语言文本理解(34%),其次是金融服务和汽车和装配行业的机器人流程自动化(33%)和金融服务的自然语言文本理解(32%):
那么,采用人工智能的风险可能有哪些?
报告称,55% 的受访者认为 2021 年最突出的 AI 应用风险是网络安全,其次是监管合规性(48%)、可解释性(41%)和个人隐私(41%):
3
最后,谈谈 AI 伦理
报告还称,「尽管人工智能在全球范围内部署,许多研究人工智能伦理的论文还是集中在英语模型与数据集上」。
由于 AI 系统已被部署到世界各地,研究人员开始加大对 AI 与现实交互的关注度,尤其是 AI 落地可能带来的危害,例如带有种族歧视的人脸识别系统、带有性别歧视的简历筛选系统,以及经济收入歧视的 AI 临床工具等。
AI 模型在落地过程中展示出来的社会偏见,使研究者们增加了对研究 AI 伦理、公平与偏见的兴趣,并驱使相关从业者积极寻找解救措施。
如前所述,该报告还增加了对 AI 伦理的探讨。报告发现:
语言模型所展现出的「偏见」问题最明显,且新数据表明:语言模型的规模越大,在训练数据中反映出来的偏见也越普遍。比如,一个2021年开发的 2800 亿参数模型比 2018 年 1.17 亿参数的模型的毒性增加了 29%
自 2014 年以来,针对 AI 公平性与透明性的研究呈爆炸式增长,相关出版物增加了五倍,算法公平与偏见的研究逐渐成为主流研究课题,而且工业界在该方向的研究工作发表同比增加了 71%
多模态模型也呈现出多种多样的、创纪录的「偏见」,例如,关于 CLIP 的实验表明,黑人图像被错误分类为非人类的比率是其他种族的两倍以上
此外,报告指出,虽然全球范围内的研究者都对 AI 公平性、问责性与透明性的研究越发感兴趣,但在相关会议 FAccT 上,大多数的论文都由美国的研究人员撰写。从2020年到2021年,来自北美机构的论文比例从70.2%上升到75.4%:
与其他语言的事实检验数据集相比,英语数据集的比例最高,有 142 个,而非英语数据集只有35个(其中中文数据集只有5个):
这一点间接地讽刺了人工智能领域的中文研究者缺少对 AI 伦理的论文发表。换言之:较少中国研究者从事 AI 伦理层面的科研工作。那么,报告的观点是否有失偏颇呢?也许只能评论区见分晓。
在 AI 的落地研究上,如何缩小中美差距?谈谈你的看法。
参考链接:
雷峰网