optimization
Optimization for Nondifferentiable Problem
上篇调研总结了双层优化问题的解决范式,并梳理了双层优化应用在Sim2real的domain randomization(DR)问题上时的难点在于
- 如何解不可微的外层优化问题
- 如何转换不可微的外层优化问题为smooth的
本文将对其中 “不可微问题的求解” 进行调研。
此外本文也将简要介绍一下关于超参优化(hyperparameter optimization,HO)的内容,调研HO问题的原因是:domain randomization与HO问题具有相似的formulation,但二者又存在区别(最重要的区别在于一般的HO问题是differetiable的,DR问题在没有转换为smooth问题之前是不可微的),因此阅读了一些文献并做了简要总结。
Paradigm of Bi-level Optimization
本文调研了双层优化问题的解决范式,对两种popular的基于梯度的方法——AID、ITD作出介绍与总结。最后,本文对如何利用bilevel optimization解决sim2real问题难点作出梳理。
本调研的motivation来自于sim2real问题——借助少量的仿真数据,如何找到一组仿真器参数$\phi$,在该组参数下的仿真数据上训练一个异常检测模型,将会在现实数据中有较好的效果——这可以类比于一个超参数调优问题。
Sim2Real and Domain Randomization
本文首先对Sim2real问题作出了简要介绍,并简单对其方法作出分类。接着,对于其中的domain randomization方法给出bilevel optimization的形式,最后调研了基于上述优化形式(或类似形式)下的优化问题求解方案。
此外 Lilian Weng (Open AI) 的博客 对 DR 问题做了深入探讨,极具价值。