Download presentation
Presentation is loading. Please wait.
1
平成14年度第1回統数研/総研大「経済学」研究会 プログラム 日時:2002年7月19日1:00‐2:00
ティックデータのフィルターリングとクリーニング 森谷博之 オックスフォードファイナンシャルエデュケーション http// 平成14年度第1回統数研/総研大「経済学」研究会 プログラム 日時:2002年7月19日1:00‐2:00
2
ティックデータとは一般的には呼び値のことである。 単一の価格 買値と売値 買値または売値 買値、売値、取引価格 中値
3
ティックデータの用途 トレーディング トレーディングシミュレーション 学術研究 リスクマネージメント
4
Berkeley Options Database
ティックデータ 入手先 Olsen Data AG :高頻度データ提供会社 CQG : チャート・グラフィクス提供会社 GTIS Berkeley Options Database
5
データエラー 人為的なエラー 故意のエラー 故意ではないエラー システムエラー
ティックデータ データエラー 人為的なエラー 故意のエラー 故意ではないエラー システムエラー
6
ティックデータ Decimal Errors Test Quotes Repeated Quotes Quote Copying
Scaling Problem
7
フィルター・クリーニングの必要性 エラーの存在 さまざまな分布形状 データの出所の違いと信頼性 時間間隔の複雑性 建値情報の意味の違い
ティックデータ フィルター・クリーニングの必要性 エラーの存在 さまざまな分布形状 データの出所の違いと信頼性 時間間隔の複雑性 建値情報の意味の違い
8
フィルター・クリーニングの役割 悪いデータを除く 悪いデータを訂正する データのクオリティーを判断する
ティックデータ フィルター・クリーニングの役割 悪いデータを除く 悪いデータを訂正する データのクオリティーを判断する
9
ティックデータ 学術研究 : データのクオリティー リスクマネージメント : データの定常性 トレーディング
学術研究 : データのクオリティー トレーディング シミュレーション : データの取引可能性 ・トレーディング リスクマネージメント : データの定常性
10
手法1 目視によるチェック システムと目視によるチェック システムだけによるチェック
ティックデータ 手法1 目視によるチェック システムと目視によるチェック システムだけによるチェック
11
手法2 単一の市場のデータ 単一のデータ 複数のデータ 複数の市場データ
ティックデータ 手法2 単一の市場のデータ 単一のデータ 複数のデータ 複数の市場データ
12
HFDF-1993 Data Set Description
ティックデータ HFDF-1993 Data Set Description CCYY-MM-DD (GMT) bid ask country/city bank filter 23:59: 23:59: 23:59: 23:59: 23:59:
13
ティックデータ http://www.cqg.com CQG
Contract Date Session Time Price (T) (M) (C) JY1995U A N N JY1995U B N N ... JY1995U B N N JY1995U A N N JY1995U T N N JY1995U T N N
14
為替のティックデータの例 ドル円 頻度分布(価格の差)
為替のティックデータの例 ドル円 頻度分布(価格の差)
15
為替のティックデータの例 ドル円 頻度分布%(価格の差)
為替のティックデータの例 ドル円 頻度分布%(価格の差)
16
為替のティックデータの例 ドル円 頻度分布(価格の差)
為替のティックデータの例 ドル円 頻度分布(価格の差)
17
為替のティックデータの例 ドル円 頻度分布(スプレッド)
為替のティックデータの例 ドル円 頻度分布(スプレッド)
18
為替のティックデータの例 ドル円 頻度分布%(スプレッド)
為替のティックデータの例 ドル円 頻度分布%(スプレッド)
19
為替のティックデータの例 銀行ではアシスタントディーラーがデータインプット それぞれのベンダーに対して異なる人がインプット
ブローカーのボイスをそのままリピートすることもある インプットする人のポジションが故意に価格に影響する 1993年以前は大台もインプット、現在は大台は自動的に入る ブローカーにおいてもほぼ同じことが言える。
20
生データー>第1フィルター ー>計算ー>第2フィルター ー>クリーンデータ
21
特徴 Trust Capitalの導入 指数移動平均 時間の重視 ボラティリティ-の予測 ファットテイル 時間枠 データの訂正
olsendata 特徴 Trust Capitalの導入 指数移動平均 時間の重視 ボラティリティ-の予測 ファットテイル 時間枠 データの訂正
22
olsendata 生データ 計算 最も単純な チェック Scalar filtering window の決定 EMAの計算期間が決まる
Expected Volatiltiyの計算期間が決まる 新しいデータが計算期間に加わるかどうかは Level filterとpair filtering により決まる。 古いデータは300日後には自動的に排除 P>0 BidOfferSpread>0 質のよいデータであれば期間は短い このWindowに含まれ るデータの信頼性 は新しいQuoteが来るたびに変わる 外されたデータの信頼性は固定される
23
olsendata 生データ 計算 Full Quote Filter 変形の理由 分布を単純にする 定常性を確保する 最も単純な チェック
データを買値・売値・ 売値買値のペアー 価格を必要に応じて変形する Log(P) Log(P-Pmin) など P>0 BidOfferSpread>0 変形の理由 分布を単純にする 定常性を確保する
24
olsendata 生データ 計算 Full Quote Filter Univariate Filter 最も単純な チェック
Decimal Error Scaling Error Special Filter C=min(Cbid,Cask,Cspread)
25
olsendata 生データ 計算 Full Quote Filter Univariate Filter Multivariate
最も単純な チェック 計算 Full Quote Filter Univariate Filter Multivariate Filter Decimal Error Scaling Error Special Filter C=min(Cbid,Cask,Cspread)
26
olsendata Ctotal C1= 0 0.25 0.5 0.75 1 C2=1 (0.5) 1 0.75 0.75 0.878
Ctotal=C[t(C1)+t(C2)],C(T)= T/Sqrt(1+T2)、T(C)=(C-0.5)/Sqrt(C(1-C)) Ctotal C1= 0 0.25 0.5 0.75 1 C2=1 (0.5) 1 0.75 0.75 0.878 0.50 0.5 0.25 0.122 0.5 0.00
27
Level Filter 為替の場合スプレッドに用いる
olsendata Level Filter 為替の場合スプレッドに用いる
28
olsendata Pair Filter
29
olsendata 結果 期間 データ数 Reject USDJPY Jan89-Dec89 683,555 0.49%
30
簡単フィルター 為替レートドル円の例 1)最大値・最小値でのフィルターリング 2)ペアーになっていないデータははじく
3)スプレッドが0.15以上のものははじく 4)現在の買値が前の買値より±0.5以上であれば現在のデータはUnqualified になる。 5)現在の売値が前の売値より±0.5以上であれば現在のデータはUnqualified になる。 6)すべての計算が終了した後にUnqualifedが含まれているペアーを除く。
31
簡単フィルター 為替レートドル円の例
32
簡単フィルター 為替レートドル円の例
33
簡単フィルター 為替レートドル円の例
34
簡単フィルター 為替レートドル円の例
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.