- 追加された行はこの色です。
- 削除された行はこの色です。
- SIG-FIN-008-07 へ行く。
- SIG-FIN-008-07 の差分を削除
[[第8回研究会]] *オンライン勾配法による投資比率最適化付き複利型強化学習 [#ncdba87c] **著者 [#gbc25116] >松井藤五郎(中部大学),後藤卓(三菱東京UFJ銀行),和泉潔,陳ユ(東京大学) **概要 [#p8a495f6] >本論文では,複利型強化学習において,オンライン勾配法を用いて投資比率を最適化する方法を提案する.従来の複利型強化学習では,投資比率を固定としていたため,投資比率をどのように決めるかが問題となっていた.提案手法では,投資比率をオンライン勾配法によって最適化することによって,この問題を解決する.また,オンライン勾配法による投資比率最適化付きQ学習を3本腕バンディット問題に適用し,投資比率固定の複利型Q学習およびQ学習と比較し,その有効性を示す. **論文 [#wd2712df] #ref(SIG-FIN-008-07.pdf)