025-16 の履歴の現在との差分(No.0)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
[[第25回研究会>025]]

* 多変量時系列データを用いた分散型強化学習による低リスク行動の学習 [#n9eb47b1]
** 著者 [#ie44a8f0]
佐藤葉介,張建偉 (岩手大学)

**概要 [#j2322268]
近年、深層学習を用いた金融市場における投資行動の学習に関する研究が盛んに行われている。低リスクであり利潤を増加させる投資行動の獲得が課題であり、モデルの構築において結果的にリスク評価値が少なくなっている研究が多い。一方、強化学習における行動価値関数を離散分布に拡張した分散型強化学習は、リスクコントロール可能な応用がされているが、投資行動の学習については研究されていない。本研究では分散型強化学習を用いて低リスクな金融商品の取引モデルを製作した。日経225に含まれる銘柄に対してバックテストを行い、Deep Q Networkと比較しシャープレシオによるリスク指標と利潤について評価を行った。

**キーワード [#i2b40aa0]
取引戦略, 深層強化学習, 分散型強化学習, テクニカル分析

**論文 [#m1e1bbb4]

//(10月7日以降に公表いたします)
&ref(16_SIG-FIN-25.pdf);

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS