a彩娱乐国际平台,斯坦福2018全球AI报告,七大维度数据公开

2020-01-04 10:03:54
浏览:1407

a彩娱乐国际平台,斯坦福2018全球AI报告,七大维度数据公开

a彩娱乐国际平台,智东西(公众号: zhidxcom)编 | 智东西内参

斯坦福全球 ai 报告从去年开始发布,该报告由斯坦福大学主导,专家组包括来自sri公司、麻省理工学院、openai、麦肯锡、哈佛等机构的多位专家,旨在通过具体数据全面追踪人工智能的最新进展。

本期的智能内参,我们推荐来自斯坦福大学的报告《2018全球ai年度报告 》,从学术研究、产业、软件开源、公共利益等方面介绍2018年ai的发展,并记录计算机视觉、自然语言理解等领域的技术进展。如果想收藏本文的报告全文(斯坦福:2018全球ai年度报告),可以在智东西头条号回复关键词“nc309”获取。

以下为智能内参整理呈现的干货:

1、按学科分类

下图显示了学术论文的年度出版率相对于1996年的比率的增长。该图比较了所有科研领域、计算机科学(cs)和人工智能(ai)的论文增长。

从从1996年到2017年,每年发表的ai论文的增长率都超过了cs领域,这表明ai论文的增长不仅仅是出于人们对计算机科学的兴趣增加。

▲1996-2017论文按学科分类发表增速

2、按地区分类

下图显示了按地区分类发表的ai论文数量。欧洲一直是ai论文的最大生产地 – 2017年scopus的ai论文中有28%来自欧洲。与此同时,尽管2008年左右中国论文数量出现波动,2007年至2017年在中国发表的论文数量增加了150%。

▲1998-2017论文按地区分类发表增速

3、细分领域分类

下图按子类别展示了scopus上的ai论文数量。类别不是互斥的。 2017年发表的ai论文中,有56%来自机器学习与概率推理(machine learning and probabilistic reasoning)这一研究方向,而2010年只有28%。图中展示的大多数2014 – 2017年期间的论文发表速度都比2010 – 2014年期间快。最突出的是神经网络( neural networks )方向,2010 – 2014年复合年增长率(cagr)只有3%,而2014 – 2017年的复合年增长率达到37%。

▲1998-2017 scopus子类别的ai论文数量

4、 arxiv 上的ai论文

arxiv 是一个收集物理学、数学、计算机科学、生物学与数理经济学的论文预印本的网站。下图显示了arxiv上的ai论文数量。右轴是指arxiv上所有ai论文的总和(由灰色虚线表示)。

arxiv上的ai论文数量一直在增加。这些论文无论是经过同行评议还是已被ai会议接受,都表明ai作者倾向于传播他们的研究,这也表明了该领域的竞争性。自2014年以来,计算机视觉(cv)和模式识别是arxiv上最大的ai子类别。这除了表现出人们对计算机视觉的兴趣日益增长之外,这也表明其他ai应用领域的增长。

▲arxiv上按子类别划分的ai论文数量(2010-2017)

5、按地区活动关注度分类

下图显示了美国,欧洲和中国的相对活动指数(rai)。 rai通过将其与ai中的全球研究活动进行比较来近似区域的专业化程度。 rai被定义为一个国家的ai出版物产出相对于ai出版物全球份额的份额。1.0表示一个国家在ai中的研究活动与ai中的全球活动完全一致。高于1.0的值意味着更重视,而低于1.0的值意味着较少重视。中国的ai论文更侧重于工程技术和农业科学,而美国和欧洲的ai论文则倾向于关注人文科学和医学与健康科学。与2000年的数据相比,2017年的数据显示,这三个地区的专业化程度提高,而中国则转向农业。这符合我们的预期,因为中国是最大的食品生产国,并且倾向于将其研究重点放在应用ai上。

▲各区域ai研究关注重点(2000年)

▲各区域ai研究关注重点(2017年)

6、按机构关注度分类

下图展示了与政府,企业和医疗机构有关的scopus论文数量。 2017年,中国政府发表的ai论文数量几乎是中国企业的4倍。自2007年以来,中国的政府发表ai论文数量增加了400%,而同期企业ai论文仅增加了73%。在美国,相对较大比例的ai论文是由公司发表。 2017年,美国企业ai论文的比例比中国企业ai论文的比例高6.6倍,比欧洲高4.1倍。

▲中国按机构分类的ai论文(1998-2017)

▲美国按机构分类的ai论文(1998-2017)

▲欧洲按机构分类的ai论文(1998-2017)

▲各地区企业发表ai论文的增长(2009-2017)

▲各地区政府发表ai论文的增长(2009-2017)

7、ai论文引用概况

下图显示了地区划分ai作者的平均加权引用。加权引用(fwci)是ai作者在该地区接收的平均引用次数除以所有ai作者的平均引用次数。fwci显示了学者引用书相对于世界平均水平。fwci为0.85表明论文的引用率比世界平均水平低15%。虽然欧洲每年发布的ai论文数量最多,但欧洲的fwci仍保持相对平稳,与世界平均水平相当。相比之下,中国已大幅增加其fwci。 2016年,中国的ai作者被引用率比2000年高出44%。尽管如此,美国的总引用率仍高于其他地区,比全球平均水平高出83%。

▲ai作者的地域加权引用(1998-2016)

8、各国aaai论文

下图显示了按国家分列的2018年人工智能促进协会(aaai)会议提交和接受的论文数量。 2018年aaai会议于2018年2月在路易斯安那州新奥尔良举行。aaai 提交论文,中美占70%,中选论文,中美占67%。中国的论文提交数高出美国约1/3,但二者中选论文数相差无几,中国入选265篇,美国入选268篇。

▲aaai会议提交和中选论文

1、学生人数

下图显示了入读ai和机器学习(ml)课程的本科学生的百分比。虽然选择ai课程的本科生比例往往略高于ml课程(人工智能平均为5.2%,ml为4.4%),入读ml课程的本科生人数增长速度更快。这显示了机器学习作为ai子领域日益增长的重要性。

▲在ai入门课程中注册的本科生比例

▲ml专业(2010-2017)在校大学生比例

2、美国ai课程

下图显示了美国几所领先的计算机科学大学的ai和ml课程注册的增长情况。 2017年入门ai入学人数比2012年增加了3.4倍,而2017年ml课程入学人数比2012年增加了5倍。加州大学伯克利分校2017年入门ml课程的学生人数是2012年的6.8倍。

▲ai课程入学人数增长情况(2012-2017)

▲ml课程入学人数增长情况(2012-2017)

3、国际ai课程

下图和下一页的图表显示了美国以外几所领先的计算机科学大学的ai和ml课程注册。2017年,清华大学的ai + ml课程入学人数比2010年增加了16倍,是非美国院校外增长率最高的高校,几乎是第二名多伦多大学的2倍。

▲美国外人工智能+ml课程注册人数增长情况。(2010 – 2017)

1、大型学术会议

下图显示了大型ai会议的出席人数以及相对于2012年的大型会议出席人数的增长。大型ai会议是2017年有超过两千名与会者参加的会议。在大型会议中,neurips (曾用名nips) 、cvpr和icml,是参与人数最多的三大ai会议。自2012年以来,论参与人数的增长率,这三者也领先于其他会议。neurips和icml参与人数增长最快:2018年与2012年相比,neurips增长3.8倍 ,icml增长5.8倍 。

▲大型ai学术会议参会情况

▲大型学术会议参与率

2、小型学术会议

下图显示了小型ai会议的出席人数以及相对于2012年小型ai会议出席人数的增长情况。小型人工智能会议是2017年参会人数不足两千人的会议。iclr 2018年的出席人数比2012年增加了20倍。这种增长很可能今天人工智能内部更加注重深度和增强学习的结果。

▲小型ai学术会议参会情况(1995-2018)

▲小型学术会议参与率

1、ai创业公司

下图显示了某一年度活跃的风险投资支持的美国私营初创公司的数量。蓝线(左轴)仅显示ai初创公司,而灰线(右轴)显示所有风险投资支持的初创公司,包括ai初创公司。该图表显示了每年1月份的初创公司总数。从2015年1月到2018年1月,活跃的ai创业公司增加了2.1倍,而所有活跃的创业公司增加了1.3倍。在大多数情况下,所有活跃初创公司的增长保持相对稳定,而ai创业公司的数量呈指数级增长。

▲美国ai创业公司(1995年1月 – 2018年1月)

2、风险投资

下图显示了风险投资公司(vc)在所有融资阶段向活跃的美国创业公司提供的年度资金数额。蓝线(左轴)仅显示ai初创公司的资金,而灰线(右轴)显示所有风险投资支持的初创公司(包括ai初创公司)的资金。从2013年到2017年,ai vc融资增加了4.5倍,而所有风险投资资金增加了2.08倍。 1997 – 2000年所有风险投资基金的繁荣可以用互联网泡沫来解释。 2014年和2015年较小的繁荣反映了经济增长。

▲美国ai创业公司的年度风险投资资金(1995年 – 2017年)

1、人才需求

下图显示了所需的ai技能每年的职位空缺数量,以及所需的ai技能的职位空缺的相对增长。虽然ml是最重要的技能要求,但深度学习(dl)正在以最快的速度增长 – 从2015年到2017年,需要dl的职位空缺数量增加了35倍。

▲ai职位空缺(2015 – 2017)

▲按所需ai增加职位空缺(2015 – 2017)

2、专利

下图显示了发明人地区划分的ai专利数量和增长情况。 ai专利使用ipc代码进行汇总,这些代码属于认知和意义理解以及人机界面技术领域。 2014年,大约30%的ai专利来自美国,其次是韩国和日本,每个专利持有16%的ai专利。在顶级发明地区中,韩国和台湾取得了最大的增长率,2014年ai专利数量几乎是2004年的5倍。

▲按发明人地区划分的ai专利(2004-2014)

▲按发明人地区划分的人工智能ai专利增长概况(2004-2014)

六、企业和政府关注度

1、财报电话会议中提及ai和ml的次数

下图显示了按行业划分的公司盈利电话中的人工智能(ai)和机器学习(ml)关键词次数。第一张图表仅显示了科技公司,因为该行业拥有更大规模的ai和ml提及。第二张图显示了it以外的行业提到的ai次数,。 2015年提到ai和ml的it公司持续增加。对于大多数其他行业而言,这一增长始于2016年。在财报电话会议中,除了科技行业之外,提及ai次数最多的公司,基本上分布在消费、金融和医疗保健行业。

▲科技公司财报电话会议提到ai次数(2007-2017)

▲其他公司财报电话会议提到ai次数(2007-2017)

2、政府关注度

下图显示了美国国会记录中的人工智能和机器学习以及加拿大和英国议会的诉讼记录(称为hansards)。在这三个政府中,这些术语的提及自2016年以来出现飙升。此外,在这三个国家中,机器学习在2016年之前很少被提及,并且相对于人工智能而言仍然只占总提及的一小部分。

▲美国国会提到ai和ml次数(1995-2018)

▲英国议会提到ai和ml次数(1980-2018)

▲加拿大议会提到ai和ml次数(2002-2018)

1、图像识别: imagenet

下图显示了随时间变化的imagenet准确度分数。2017年是imagenet比赛的最后一届,2018年这项比赛就不再进行了。不过,验证集依然有人在用。图中,蓝色的线条为imagenet挑战赛历年的成绩变化,由于每年比赛所用的数据不同,旁边多了一条黄色线条,是以imagenet 2012验证集为评价标准绘制的。可以看出,到2015年,机器在图像分类任务上的能力已经明显超越了人眼,而即使比赛不再继续,学术研究者依然在认真推进该任务的表现。这也侧面说明,如果一项工作有了明确的评价标准和固定的挑战内容,研究者们围绕此竞争,更容易让技术在该领域取得突破。

▲imagenet (2010 —2018)

下图显示了训练网络以高精度从imagenet语料库(图像数据库)对图片进行分类所需的时间。该度量标准代表了ai领域中资源良好的参与者为了训练大型网络执行ai任务(例如图像分类)所花费的时间。由于图像分类是一种相对通用的监督学习任务,因此该指标的进展也与其他ai应用程序的更快训练时间相关。在一年半的时间里,培训网络所需的时间从大约一小时减少到大约4分钟。

▲imagenet训练时间(2017年6月 – 2018年11月)

2、实例分割: coco

imagenet挑战赛结束以后之后,cv领域把重点放在了微软的coco,挑战语义分割和实例分割。四年来,coco数据集上图像分割挑战的精确度已经提升了0.2,2018年的成绩比2015提升了72%。不过,目前还没有超过0.5,这一项还有充足的进步空间。

▲coco实例分割挑战(2015-2018)

3、语义分析

下图显示了ai系统在确定句子句法结构的任务上的表现。解析度量是在某些任务中理解自然语言的第一步,例如问答。最初使用类似于解析编程语言的算法完成,现在几乎普遍使用深度学习。自2003年以来,所有句子的f1得分都提高了9个百分点。

▲选区解析 – penn treebank(1995-2018)

4、机器翻译

下图显示了ai系统在将新闻从英语翻译成德语,德语翻译成英语的任务中的表现。从英语到德语的bleu分数今天比2008年高出3.5倍。从德语到英语的翻译在同一时间段内翻了2.5倍。因为每年使用不同的测试集,所以不同年份的得分不完全可比。然而,bleu分数表明了机器翻译的进展。

▲新闻翻译- wmt挑战(2008-2018)

5、问题解答:arc

下图显示了ai2推理挑战(arc)随时间性能进展。 arc数据集包含7,787个真正的小学水平(美国3 – 9年级),多选科学问题,以鼓励高级问答的研究。问题分为挑战集(2,590个问题)和简易集(5,197个问题)。挑战集仅包含基于检索的算法和单词共现算法错误地回答的问题。问题是纯文字,英语考试问题,涵盖文件中指出的几个年级。每个问题都有多项选择结构(通常有4个答案选项)。这些问题伴随着arc语料库,这是一套14m无序的科学相关句子,包括与arc相关的知识。无法保证可以在语料库中找到问题的答案。 arc基准测试于2018年4月发布.2018年的性能在easy set上从63%上升到69%,在challenge set上从27%上升到42%。

▲arc排行榜(2018年4月- 2018年11月)

6、问题解答:glue

下图显示了glue基准测试排行榜的结果。通用语言理解评估(glue)是一个新的基准,旨在测试自然语言理解(nlu)系统的一系列任务,并鼓励开发不适合特定任务的系统。它由九个子任务组成 – 两个单句(测量语言可接受性和情感),三个关于相似性和释义,四个关于自然语言推理,包括winograd模式挑战。语料库大小从不到1,000到超过400,000。指标包括准确度/ f1和马修斯相关系数。尽管基准测试仅在2018年5月发布,但性能已经提高,大约是第一个公布基线与估计的非专家人员水平约90%之间的差距的一半。

▲glue基准排行榜(2018年5月至2018年10月)

智东西认为,中国在人工智能领域的技术发展和市场应用方面已经进入了国际上的前沿发展国家群体,呈现出中美双雄共同领跑的局面。从科技产出等方面来看,中国人工智能发展的总体水平和美国相比仍有差距,但已经超过大部分国家。在论文和专利等指标上,中国已经有了一定的领先优势。总体来看,在ai这个风口上,中国已经占据了较高的起点。


凤凰全讯


上一篇:俄罗斯11月原油和凝析油产量高于欧佩克+目标

下一篇:白银税务再升级征管流程 企业跨区迁移告别“来回跑”

相关推荐

  • LOL:VG失误颇多不断暴露问题,BLG轻松拿下比赛
    LOL:VG失误颇多不断暴露问题,BLG轻松拿下比赛

    vg在面对blg时,他们需要保证中下路在前期拿到优势,尤其jay需要能够抽身支援边路,让puff顺利发育起来。而blg则是会继续贯彻他们的兵线和视野控制,抓住对手失误的机会来取胜。随后blg三人抓中,猪妹及时赶到反打,反而击杀blg辅野,vg打出0换2。[23:40] blg拿下第二条火龙。[31:20] blg卡住时间视野差,接连拿下小龙和大龙。[36:10] blg五人集结推下,赵信选择强开,

  • 走上社区文化舞台“力量之声”在上海宝山大场举办公益音乐会
    走上社区文化舞台“力量之声”在上海宝山大场举办公益音乐会

    中新网上海12月13日电 12月12日晚,vocal force力量之声工作室在上海宝山大场文化中心举办“我的祖国”——庆祝中华人民共和国成立70周年专场音乐会。作为国内首个流行美声组合,“力量之声”希望能够通过这场演唱会,满足大场镇人民群众音乐上的精神需求,丰富社区居民文化生活,以文惠民服务社区。这是“力量之声”三位年轻艺术家的心声心愿。今年以来,“力量之声”举办音乐沙龙,与镇里30余名“粉丝”

  • 大连运至济南,山航助黑猩猩“巧克力”顺利回家
    大连运至济南,山航助黑猩猩“巧克力”顺利回家

    半岛记者 栾英杰 通讯员 郭怀洁近日,山航货运部市场营销单元分管大连货运的市场经理的李增荣经理接到大连森林动物园的电话,恳请协助承运一只黑猩猩由大连运至济南。在山航的协助下,黑猩猩“巧克力”顺利由大连运至济南。最终李增荣通过视频监控,从装机到交付对全流程进行了协调及跟踪,这只名为“巧克力”的黑猩猩于10月18日sc8792航班顺利由大连运至济南。

  • 娄底:非公企业党员深情告白迎国庆
    娄底:非公企业党员深情告白迎国庆

    此次比赛,歌颂了伟大祖国的光辉历程,展示了娄底市非公经济组织党员爱岗敬业、无怨无悔的奉献精神,进一步激发广大非公经济组织员工的爱国之情,市市场监管局局长邓志洪、市委“不忘初心、牢记使命”主题教育第十指导组组长康建和等领导到会观看,来自市委两新工委、市演讲艺术家协会的专家老师评审指导,活动取得圆满成功。

  • 简单又可爱宝宝斗篷编织,附详细编织教程
    简单又可爱宝宝斗篷编织,附详细编织教程

    斗篷的款式很简单,颜色也很温和,宝宝穿起来更显得宝宝的娇嫩可爱。用线:精装亲肤型童装绒线,6团,不到半斤。中间有一针不并,这样就等于加了一针,成为106针。斗篷织好尺寸:最宽处140cm;高37cm;带长88cm;帽顶抽出钩的辫子,两片合拢收针。

  • 她曾说不嫁中国男人,3任丈夫都是外籍,如今却回国捞金?
    她曾说不嫁中国男人,3任丈夫都是外籍,如今却回国捞金?

    众所周知,李勤勤曾经公开表示不会嫁中国男人,因为“中国男人不浪漫,毫无安全感,嫁给中国男人不会有幸福。”李勤勤有三段婚姻,而且每一任丈夫都是外籍的。更有传闻说这段婚姻之所以失败是在于男方总爱在外面拈花惹草,李勤勤受不了最终选择了离婚。如今李勤勤年纪越来越大了,她又回到了中国继续捞金,不过对比了她3任外籍丈夫真的是一任比一任强。

  • 蒋介石策划参与的两次绑票案
    蒋介石策划参与的两次绑票案

    蒋介石“绑票”,浙江奉化称之为“请财神”,这是黑社会惯用的一种勒索手段。据英国政府保存的上海公共租界巡捕所记录,绑架案与这位蒋某人有关的,就有两次。失败后,蒋介石遭到通缉,在上海无法立足,只好逃回浙江奉化避难。蒋介石第二次绑票发生在1916年左右。那时,蒋介石在上海活动,因无正当的职业收入,全靠借贷度日,加上他挥霍无度,经济更为拮据。经上述事情后,蒋介石和竺鸣涛关系更为密切。

  • 魅族和谷歌联合推新机 系统竟不是Flyme
    魅族和谷歌联合推新机 系统竟不是Flyme

    为了获取更多的用户,谷歌在2017年5月的Google I/O大会上正式推出Android Go计划。现在,魅族也将加入其中!此前我们曾报道,魅族全球营销负责人Ard Boudeling在推特上公开透露,魅族将和谷歌合作推出旗下首款Android Go智能手机。外媒Android Headlines日前报道,一款型号为M810L的魅族新机已通过FCC认证。该机很有可能就是魅族联合谷歌打造的低端产品

  • 287家公司研发占比超高新技术企业门槛 机构调研30股
    287家公司研发占比超高新技术企业门槛 机构调研30股

    与此同时,截至目前,已有32家公司披露了2019年一季报业绩预告,业绩预喜公司家数共有24家,占比75%。30家公司近期接待10家及以上机构调研进一步梳理发现,上述63只个股中,有30只个股近1个月内参与调研的机构家数均达到10家及以上。

  • 当索尼手机失去信仰,仅凭“黑科技”如何活下去?
    当索尼手机失去信仰,仅凭“黑科技”如何活下去?

    然而,尽管每次索尼手机新品发布,“黑科技”的赞誉声都不绝于耳,但索尼手机在市场上的表现可谓毫无建树。索尼财报显示,索尼的移动通信业务营收,从2015年的11400亿日元降至2017年的7591亿日元。除此之外,索尼所独有的“黑科技”虽然在行业内赢来了赞誉,却并未形成独特的卖点。索尼大法好,成为了一小群人共同的信仰。