Presentation is loading. Please wait.

Presentation is loading. Please wait.

平成14年度第1回統数研/総研大「経済学」研究会 プログラム 日時:2002年7月19日1:00‐2:00

Similar presentations


Presentation on theme: "平成14年度第1回統数研/総研大「経済学」研究会 プログラム 日時:2002年7月19日1:00‐2:00"— Presentation transcript:

1 平成14年度第1回統数研/総研大「経済学」研究会 プログラム 日時:2002年7月19日1:00‐2:00
ティックデータのフィルターリングとクリーニング 森谷博之 オックスフォードファイナンシャルエデュケーション http// 平成14年度第1回統数研/総研大「経済学」研究会 プログラム 日時:2002年7月19日1:00‐2:00 

2 ティックデータとは一般的には呼び値のことである。 単一の価格 買値と売値 買値または売値 買値、売値、取引価格 中値

3 ティックデータの用途 トレーディング トレーディングシミュレーション 学術研究 リスクマネージメント

4 Berkeley Options Database
ティックデータ 入手先 Olsen Data AG :高頻度データ提供会社 CQG : チャート・グラフィクス提供会社  GTIS  Berkeley Options Database

5 データエラー 人為的なエラー 故意のエラー 故意ではないエラー システムエラー
ティックデータ データエラー 人為的なエラー 故意のエラー 故意ではないエラー システムエラー

6 ティックデータ Decimal Errors Test Quotes Repeated Quotes Quote Copying
Scaling Problem

7 フィルター・クリーニングの必要性 エラーの存在 さまざまな分布形状 データの出所の違いと信頼性 時間間隔の複雑性 建値情報の意味の違い
ティックデータ フィルター・クリーニングの必要性 エラーの存在 さまざまな分布形状 データの出所の違いと信頼性 時間間隔の複雑性 建値情報の意味の違い

8 フィルター・クリーニングの役割 悪いデータを除く 悪いデータを訂正する データのクオリティーを判断する
ティックデータ フィルター・クリーニングの役割 悪いデータを除く 悪いデータを訂正する データのクオリティーを判断する

9 ティックデータ 学術研究 : データのクオリティー リスクマネージメント : データの定常性 トレーディング
学術研究 : データのクオリティー トレーディング シミュレーション  : データの取引可能性 ・トレーディング リスクマネージメント : データの定常性

10 手法1 目視によるチェック システムと目視によるチェック システムだけによるチェック
ティックデータ 手法1 目視によるチェック システムと目視によるチェック システムだけによるチェック

11 手法2 単一の市場のデータ 単一のデータ 複数のデータ 複数の市場データ
ティックデータ 手法2 単一の市場のデータ 単一のデータ 複数のデータ 複数の市場データ

12 HFDF-1993 Data Set Description
ティックデータ HFDF-1993 Data Set Description CCYY-MM-DD  (GMT)   bid    ask  country/city bank filter     23:59:       23:59:       23:59:       23:59:       23:59:  

13 ティックデータ http://www.cqg.com CQG
Contract Date Session Time Price (T) (M) (C) JY1995U A N N JY1995U B N N ... JY1995U B N N JY1995U A N N JY1995U T N N JY1995U T N N

14 為替のティックデータの例 ドル円 頻度分布(価格の差)
為替のティックデータの例 ドル円 頻度分布(価格の差)

15 為替のティックデータの例 ドル円 頻度分布%(価格の差)
為替のティックデータの例 ドル円 頻度分布%(価格の差)

16 為替のティックデータの例 ドル円 頻度分布(価格の差)
為替のティックデータの例 ドル円 頻度分布(価格の差)

17 為替のティックデータの例 ドル円 頻度分布(スプレッド)
為替のティックデータの例 ドル円 頻度分布(スプレッド)

18 為替のティックデータの例 ドル円 頻度分布%(スプレッド)
為替のティックデータの例 ドル円 頻度分布%(スプレッド)

19 為替のティックデータの例 銀行ではアシスタントディーラーがデータインプット それぞれのベンダーに対して異なる人がインプット
ブローカーのボイスをそのままリピートすることもある インプットする人のポジションが故意に価格に影響する 1993年以前は大台もインプット、現在は大台は自動的に入る ブローカーにおいてもほぼ同じことが言える。

20 生データー>第1フィルター ー>計算ー>第2フィルター ー>クリーンデータ

21 特徴 Trust Capitalの導入 指数移動平均 時間の重視 ボラティリティ-の予測 ファットテイル 時間枠 データの訂正
olsendata 特徴 Trust Capitalの導入 指数移動平均 時間の重視 ボラティリティ-の予測 ファットテイル 時間枠 データの訂正

22 olsendata 生データ 計算 最も単純な チェック Scalar filtering window の決定 EMAの計算期間が決まる
Expected Volatiltiyの計算期間が決まる 新しいデータが計算期間に加わるかどうかは Level filterとpair filtering により決まる。 古いデータは300日後には自動的に排除 P>0 BidOfferSpread>0  質のよいデータであれば期間は短い  このWindowに含まれ るデータの信頼性   は新しいQuoteが来るたびに変わる  外されたデータの信頼性は固定される

23 olsendata 生データ 計算 Full Quote Filter 変形の理由 分布を単純にする 定常性を確保する 最も単純な チェック
データを買値・売値・ 売値買値のペアー 価格を必要に応じて変形する Log(P) Log(P-Pmin) など P>0 BidOfferSpread>0 変形の理由 分布を単純にする 定常性を確保する

24 olsendata 生データ 計算 Full Quote Filter Univariate Filter 最も単純な チェック
Decimal Error Scaling Error Special Filter C=min(Cbid,Cask,Cspread)

25 olsendata 生データ 計算 Full Quote Filter Univariate Filter Multivariate
最も単純な チェック 計算  Full Quote  Filter Univariate Filter Multivariate Filter Decimal Error Scaling Error Special Filter C=min(Cbid,Cask,Cspread)

26 olsendata Ctotal C1= 0 0.25 0.5 0.75 1 C2=1 (0.5) 1 0.75 0.75 0.878
Ctotal=C[t(C1)+t(C2)],C(T)= T/Sqrt(1+T2)、T(C)=(C-0.5)/Sqrt(C(1-C)) Ctotal C1=  0  0.25  0.5   0.75   1 C2=1 (0.5) 1 0.75  0.75 0.878 0.50  0.5 0.25 0.122 0.5 0.00

27 Level Filter 為替の場合スプレッドに用いる
olsendata Level Filter 為替の場合スプレッドに用いる

28 olsendata Pair Filter

29 olsendata 結果 期間 データ数 Reject USDJPY Jan89-Dec89 683,555 0.49%

30 簡単フィルター 為替レートドル円の例 1)最大値・最小値でのフィルターリング 2)ペアーになっていないデータははじく
3)スプレッドが0.15以上のものははじく 4)現在の買値が前の買値より±0.5以上であれば現在のデータはUnqualified になる。 5)現在の売値が前の売値より±0.5以上であれば現在のデータはUnqualified になる。 6)すべての計算が終了した後にUnqualifedが含まれているペアーを除く。

31 簡単フィルター 為替レートドル円の例

32 簡単フィルター 為替レートドル円の例

33 簡単フィルター 為替レートドル円の例

34 簡単フィルター 為替レートドル円の例


Download ppt "平成14年度第1回統数研/総研大「経済学」研究会 プログラム 日時:2002年7月19日1:00‐2:00"

Similar presentations


Ads by Google