024-32 のバックアップ(No.2)


第24回研究会

トピック埋め込み回帰モデルを用いた株価予測

著者

許蔚然(神戸大学), 江口浩二(広島大学)

概要

本稿では,金融記事のテキストデータを分析し,株価を予測する課題に取り組む.テキストデータの潜在特徴を抽出する手段として,トピック埋め込みモデルTopicVecに着目する.トピック埋め込みモデルは単語埋め込み空間上でトピックモデルを実現するものである.ここで,単語埋め込みは注目する単語とその単語の文脈にある単語との共起パターンを用いて,その注目単語を低次元連続的埋め込み空間に写像する.一方でトピックモデルは文書を低次元トピック空間に写像する.この2つの方法を結合することで,文書のトピックを単語と同じ埋め込み空間に写像することができる. トピック埋め込みモデルを利用して金融記事のテキストデータから株価を予測する研究は我々の知る限り未だ行われていない.そこで,本稿では,テキストデータとそれに対応する連続値ラベルとの関係をモデル化する回帰機能を付与したトピック埋め込みモデルとしてTopicVec-Regを提案する.さらに,ある企業に関する金融記事をテキストデータ,その企業に対応する株価リターン率を連続値ラベルと見なすことで,金融記事から株価リターン率を予測する. 本稿の提案手法TopicVec-Regについて,トムソン・ロイター社が発信した記事と東京証券取引所の株価データを用いて評価実験を行った.各記事が発信された前後の株価リターン率を予測するクローズドテストにおいて,提案手法により予測性能の有意な改善を得た.

キーワード

単語埋め込み, トピックモデル, トピック埋め込み, 回帰分析, 金融テキスト解析

論文

(3月11日以降に公表いたします)

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS