個人投資家向け株式分析 と予測システム A1グループ 劉 チュン
1.研究背景 長引く低金利を背景に、個人の株式投資が増加している 個人の金融資産が、株式で運用される比率は益々高まると予想される 株式市場の動向を正確に予測できる人工知能の開発が可能であると期待されている
研究目的 個人投資家(初心者、経験者 )向けて、簡 単な操作で自動的に株価の変動を言語の 予測してくれるシステムを開発する
2.金融相場の予測手法 ファンダメンタルズ分析 テクニカル分析 クウォンツ分析
ファンダメンタルズ分析 経済の動きや企業業績など、相場の外部から相場を動かすメカニズムを調べることによって相場の動きを分析する方法 例えば: 配当割引モデル、PBR(株価純資産倍率)、 PER(株価収益率)
テクニカル分析 相場の動きそのものによって相場の動きを分析する方法 過去の値動きから将来の値動きを予測する方法で、チャート分析とも呼ばれる 例えば: 一日(あるいは一週間・一ヶ月等)の間の始値・高値・安値・終値
クウォンツ分析 計量分析・数理数量分析と呼ばれる手法 例えば: 相関、分散、非線型モデル 、時系列データの回帰モデル、重回帰モデル、自己回帰モデル 本研究は、時系列など回帰モデルで株式予測システムを開発する
3.株式分析と予測システムの構造
ステップ (1)株式情報に関するデータの入手 (2)データクレンジング (Data Cleaning) (3)データウェアハウス(Data Warehouse) (4)データマイニング(Data Mining) (5)株式予測に関するパターンの生成 (6)理解、評価(Interpretation, Evaluation) (7)株式予測に関する単語の対応 (8)自然言語処理 (9)予測結果に関する句及び文の生成 (10)個人投資家に予測情報を提供する
4.事 例 1、日次データ 6947 図 研 年 月 日 終値 前日比 出来高 前日比(高) 1998 12 25 866 16 4.事 例 年 月 日 終値 前日比 出来高 前日比(高) 1998 12 25 866 16 17,100 3,500 28 880 14 12,200 4,900 29 883 3 15,500 3,300 30 888 5 5,400 10,100 1999 1 4 860 3,000 2,400 851 9 12,800 9,800 6 8,400 4,400 7 859 9,400 1,000 8 830 8,800 600 11 831 5,300 826 13,100 9,600 13 827 829 2 300 18 31 2,900 100 19 20 4,800 1,900 915 35 111,300 106,500 21 976 61 138,600 27,300 22 1,049 73 297,600 159,000 1,005 44 80,400 217,200 1、日次データ 6947 図 研
2、回帰分析 回帰分析では、R-2 乗値を使って、観測値のデータが最適な直線に当てはめられる。このツールを使って、複数の独立変数が 1 つの従属変数に与える影響を分析することができる。 回帰統計 重相関 R 0.82586123 重決定 R2 0.682046771 補正 R2 0.66334364 標準誤差 36.29816574 観測数 19 分散分析表 自由度 変動 分散 観測された分散比 有意 F 回帰 1 48047.32 36.46698 1.33E-05 残差 17 22398.47 1317.557 合計 18 70445.79
回帰式はこの「係数」によって求める。 終値=0.000843605*前日比+857.275773 係数 標準誤差 t P-値 切片 係数 標準誤差 t P-値 切片 857.275773 9.345751 91.72894 2.34E-24 前日比(高) 0.000843605 0.00014 6.03879 1.33E-05 回帰式はこの「係数」によって求める。 終値=0.000843605*前日比+857.275773
3、評価 1999年1月26日 6947 図 研 年 月 日 終値 前日比 出来高 前日比(高) 1999 1 26 ? 294,300 1999年1月26日 6947 図 研 年 月 日 終値 前日比 出来高 前日比(高) 1999 1 26 ? 294,300 213,900
終値=0.000843605*213,900+857.275773=1037.7228825
4、言語生成
5.現システムにおける問題点 データベースが大規模である場合、計算量が膨大となり数週間の解析でも結果が得られないことが多い。 質の悪いデータ(データ形式の不統一、量的データや質的データの混在)では解析結果が不正確になり利用できない。
まとめ システム改善するために、以下のような予定がある 1.市場予測に関する手法の再検討 2.データマイニングツールの選択 1.市場予測に関する手法の再検討 2.データマイニングツールの選択 3.株式予測の結果に関する単語の対応