IJCAI2022《对抗序列决策》教程

共 564字，需浏览 2分钟

·

2022-07-30 16:44

来源：专知
本文为教程，建议阅读5分钟
本教程将概述在序列决策设置中的对抗性学习的最新研究。

本教程将概述在序列决策设置中的对抗性学习的最新研究。特别地，本教程将侧重于基于多臂赌博机、强化学习和多智能体交互的对抗性攻击和防御机制。本教程将暂时涵盖以下列出的内容。

https://adversarial-rl.org/ijcai2022/index.html

介绍

序列决策入门: 多臂赌博机，强化学习，多智能体交互，和博弈。
对抗性序列决策如何不同于对抗性监督学习的高级概述。
攻击策略和防御机制的高级概述。

多臂赌博机

不同反馈破坏模型和目标下的最优攻击策略。
最近在设计鲁棒算法、关键挑战和开放问题方面的工作。

强化学习

讨论不同的学习范式(例如，模仿学习、离线学习和在线学习)，以及它们在对抗性攻击中是如何区别的。
测试时间、训练时间和后门攻击的最优攻击策略。
不同数据破坏模型和攻击目标下的最优攻击策略。
最近在设计鲁棒算法、关键挑战和开放问题方面的工作。

多智能体相互作用和博弈论考虑

多智能体系统中通过控制其他智能体的攻击和非健忘攻击。
利用博弈论工具防御攻击。

实际考虑和讨论

针对学习代理的安全威胁案例研究。
在对抗性序列决策中开发基准工具和数据集。
与观众公开讨论，促进跨社区合作。

浏览 32

点赞

收藏

分享

举报

评论

图片

表情

替代离线RL？Transformer进军决策领域，「序列建模」成关键

GAN，没错，生成对抗网络也可以被用于时间序列预测

程序员大白

保姆级教程：使用 LSTM 进行多变量时间序列预测

Python学习与数据挖掘

【时间序列】使用 Auto-TS 自动化时间序列预测

机器学习初学者

红蓝对抗服务

天融信红蓝对抗服务通过多种攻击手段的实战,来检测客户业务系统的安全状态与整体安全防御能力,有效的发现客户的互联网及内网的安全问题,从而帮助客户更好的完善安全防护体系,有助于各领域管理和技术人员发现网络安全威胁,了解网络攻击带来的巨大危害,增强对网络风险认知的直观性和紧迫性.

临床决策支持系统(CDSS)

使用 LSTM 进行多变量时间序列预测的保姆级教程

Python大数据分析

GNUmed医疗决策支持系统

GNUmed是一个综合性的重点电子医疗行为的可扩展的软件解决方案，易于使用、注重隐私保护，安全记录，以病人为中心的支持决策等特性。其目的是要成为一个成熟的医疗决策支持系统，提高医疗质量。

GNUmed医疗决策支持系统

GNUmed 是一个综合性的重点电子医疗行为的可扩展的软件解决方案，易于使用、注重隐私保护，安全记录

点赞

收藏

分享

举报