NeurIPS2021|一文洞悉因果机器学习前沿进展
微软中国MSDN 点击上方 蓝字关注我们
(转载自微软研究院AI头条)
编者按:近年来,因果机器学习在人工智能和诸多交叉领域产生了卓越的影响,得到了越来越多的关注。借助因果关系推理,机器学习的鲁棒性、泛化能力、可解释性等方面都将得到有效提升。今天我们精选了三篇微软亚洲研究院关于因果机器学习的 NeurIPS 2021 论文,为大家介绍该领域的最新科研进展。论文内容涵盖:在单源域泛化预测、多源域泛化预测,以及模仿学习三类任务中学习因果关系的方法和理论,并展示了利用因果关系提高模型在环境和分布发生变化时的稳健性。未来,微软亚洲研究院将进一步推进机器学习方法在更多更严苛的现实任务上的应用。
近年来,随着机器学习模型性能的不断提高,人们逐渐不再满足于它们在标准数据集上的表现,而是还希望它们能在真实的应用场景中同样具有稳定可靠的表现。但实现此目的的一个重要挑战是,真实场景中的环境情况通常与干净的标准训练数据集不同,会有数据分布的变化从而会遇到分布外样例,而模型不一定会在新环境中给出合理的结果。
这为机器学习模型带来了新的要求,即 模型需要学到做出预测或判断的本质原因和规律,而非依赖于表面“看上去”的关联关系,因为后者可能只是在特定环境下的表象,只有前者决定着环境变化之后的规律,可对分布外样例给出合理的结果。这便引出了因果机器学习这一新的研究方向。在 NeurIPS 2021 上,微软亚洲研究院的研究员们发表了一系列因果机器学习领域的研究成果。
学习用于分布外预测的因果语义表示

- 论文链接: https://arxiv.org/pdf/2011.01681
- 代码链接: https://github.com/changliu00/causal-semantic-generative-model
人们已经发现标准的有监督学习方法,特别是深度学习方法对分布外样例的预测表现欠佳。例如图1中的例子[Ribeiro’16],若训练集中大部分“哈士奇”的图片都是暗背景而大部分“狼”的图片都是雪地背景,那对于处在雪地中的“哈士奇”的测试样例,模型会预测为“狼”。若对模型进行可视化可发现模型更关注于背景,因为在这样的数据集上,背景与前景物体具有很强的关联性,并且背景是一个比前景物体更有区分度的特征,但只有前景物体决定图片的标注。
图1:分布外预测任务的挑战
基于这个因果角度的考虑,研究员们提出了 “因果语义生成模型”(Causal Semantic Generative model, CSG),如图2(a)所示(注意基于前面的考虑,图中去掉了v→y)。此外,根据上面的例子,s和v在特定环境中常会相关,例如“哈士奇”/“狼”常与暗背景/雪地背景一起出现,但此相关性并非因为两者间有因果关系,比如把“哈士奇”放到雪地中不会让它变成“狼”,也不会把背景变暗。因此研究员们使用了一个无向边来连接它们。这不同于大部分已有工作,那些工作认为各隐因子间都是独立的。
相关文章
-
华为手机的新闻头条怎么关
-
永州时代高性能锂电池技术联合实验室正式揭牌
-
继放弃中国国内电商业务后,亚马逊中国区总裁将离职
-
苹果iPhone手机安装台服英雄联盟手游及台服lol苹果ios手机怎么下载安装?
-
BAT三季度财报PK:流量思维已过时,产业互联网成新爱好
-
特斯拉与天津力神就电池供应签订初步协议
-
谷歌应用商店出现恶意App:窃取用户加密货币
-
程序员是否应该创造面向 IDE 而非人类的编程语言?
-
ipad应用商店无法连接怎么办
-
PC安全警告:注意电脑里的老版本软件风险
-
我为什么赞成停更“双微一抖”?
-
uBarforMac(Win式任务栏工具)
-
【PW早报】苹果将于6月22日在线举办WWDC
-
从印度、非洲到欧洲,华为、阿里巴巴们一路向西的扩张运动
-
今日头条小程序被微信下架
-
为了寻求增长十岁的阿里云决定“后退一步”
-
输了官司丢了颜面,ofo须向天津飞鸽支付8000万
-
全球首富手机被黑,这到底是如何发生的?
-
京东数科正式进入智能养牛领域实现精准饲喂、疾病监测等环节
-
“你闻闻看,这是知识的芳香” ——阿里巴巴发布2018年国人读书报告
-
Android权限管理将有重大变化:闲置应用无法获取任何隐私信息
-
智慧农贸现代化有哪些特点?
-
罗永浩内测社交软件,ofo回应海外部门解散|天下网事1.10.
-
【钛晨报】ofo回应破产传闻:消息严重不实,运营正常;阿里妈妈内容营销团队并入优酷
-
学艺三年只做臭鳜鱼,他是如何将传统手艺做到年销过亿元?
-
电话外呼防封系统可以解决电销手机封卡严重吗?
-
cad怎么把图片嵌入
-
红包、支付之后,微信的下一张王牌就是它,没跑了
-
Google将于6月起禁止通过嵌入式浏览器框架的登录