プログラム実行履歴を用いたトランザクションファンクション抽出手法 †大阪大学 大学院情報科学研究科 ‡株式会社 日立システムアンドサービス 森岡 佑†, 谷口考治†, 楠本真二†, 井上克郎†, 英 繁雄‡, 芝元俊久‡, 前田憲一‡, 津田道夫‡ 2007/2/2 ソフトウェアサイエンス研究会
構成 ファンクションポイント計測の概要 研究の動機と目的 プログラムを利用したファンクションポイント計測法 提案手法の説明 適用実験、考察 トランザクションファンクション抽出手法 メソッド呼び出しのクラスタリング 適用実験、考察 まとめ、今後の課題 2007/2/2 ソフトウェアサイエンス研究会
ファンクションポイント(FP)計測の概要 アプリケーションソフトウェアに含まれるデータや処理を分類し,それぞれ点数をつけて数値化し,機能量を算出 データファンクション(データのまとまり) トランザクションファンクション(データの入出力処理) トランザクション ファンクション データ ファンクション 入力(EI) 出力(EO) 照会(EQ) ユーザ 計測対象ソフトウェア 2007/2/2 ソフトウェアサイエンス研究会
研究の動機と目的 最終成果物であるプログラム自身からファンクションポイントを計測したい ファンクションポイントはソフトウェアの設計仕様書から求められることが多い 過去に開発されたソフトウェアのFP計測は困難 設計仕様書が存在しない 最終成果物で実現されている機能が設計仕様書と一致しない 最終成果物であるプログラム自身からファンクションポイントを計測したい トランザクションファンクションの検出に着手 2007/2/2 ソフトウェアサイエンス研究会
プログラムを利用したFP計測方針 プログラムから計測する際のデータファンクション(DF), トランザクションファンクション(TF)の仮定 フィールド値にデータを保持する TF ・・・ メソッド呼び出しのまとまりとして実装されている DFに対して何らかの処理を行うメソッド群を含んでいる トランザクションファンクションは「アプリケーションに対するデータの出入りを伴う処理」を指す 仮定に基づいた計測方針 DFはユーザがクラス単位で指定 「DFに相当するクラス」を以降DFCとする TFは実行履歴上から自動で特定 DF ・ 特定したTFからFP値計測 2007/2/2 ソフトウェアサイエンス研究会
プログラムからFPを計測する手順 各クラスタで使用しているデータファンクションクラスと そのフィールド値の個数を求める 類似したクラスタがあればまとめる クラスタの種類を決定する プログラムを実行して履歴を取得する メソッド呼び出しをクラスタリング 各クラスタからもFPを求める プログラムからFPを計測する手順 データファンクションクラスからFPを求める 未調整FPを求める ユーザ 実行履歴 DFC1 DFC2 DFC3 DFC4 自動化 DFC1 DFC2 DFC3 DFC4 データファンクション クラス FP テストケース EQ プログラム EO 2007/2/2 ソフトウェアサイエンス研究会
FP値計測までの手順 合計して全体のFP値を求める メソッド呼び出しのクラスタリング TFの抽出 各クラスタの種類(EI,EO,EQ)の判定 類似したクラスタをまとめる 残ったクラスタをTFと考えてそれぞれFP値を計測 各DFのFP値を計測 合計して全体のFP値を求める TFの抽出 EO(外部出力), EQ(外部照会)はともに出力を表すため、この段階ではともに「出力」を表すTFとして判定 2007/2/2 ソフトウェアサイエンス研究会
メソッド呼び出しのクラスタリング:手順1 DFCのフィールド値からのデータ依存関係(データフロー)とフィールド値へのデータ依存関係を解析 実行履歴上でのデータフロー範囲を決定 実行履歴 DFC1 DFC2 DFC3 DFC4 データフロー範囲 2007/2/2 ソフトウェアサイエンス研究会
メソッド呼び出しのクラスタリング: 手順2 次の条件にあてはまるデータフローを除去 実行履歴 次の条件にあてはまるデータフローを除去 複数のトランザクションに跨っていると考えられるデータフロー 例. ログイン時に入力した情報を他トランザクションで使用 全メソッド呼び出し回数のうち、対象データフローが占める割合の閾値を設定 データベース - DFC 間のデータフロー DFCのデータの一時格納処理 メソッド外に出て行かないデータフロー データが他メソッドに遷移しない DFCの同一インスタンスへの処理を行う、隣接するデータフローを結合 1つのトランザクションファンクション中の処理とみなす DFC 同一クラスへ戻るデータフロー : 「備考表示」と「備考更新」を分けるため 隣接データフローの結合 2007/2/2 ソフトウェアサイエンス研究会
メソッド呼び出しのクラスタリング:手順3 範囲が重複するデータフローの範囲を1つにまとめる 1つのトランザクション中で複数のデータを処理していると考える 得られたデータフロー範囲中に含まれるメソッド呼び出し群を1つのクラスタとする 1クラスタがトランザクション1回の実行に対応 実行履歴 DFC1 DFC2 DFC3 DFC4 データフロー範囲が 重なる部分 2007/2/2 ソフトウェアサイエンス研究会
適用実験 対象プログラム ツール貸し出しシステム データファンクション 使用する実行履歴 約37000LOC 38トランザクションファンクション データファンクション 実際のデータファンクションに対応するクラスを8個指定 使用する実行履歴 ユーザが実行できる全ての処理を実行 16トランザクションファンクションが含まれる 重複を含め、35回のTF実行 表1. 含まれるトランザクション ファンクション 2007/2/2 ソフトウェアサイエンス研究会
評価方法 実行履歴中のメソッド呼び出しには、呼び出された順に時系列でID番号を付加 提案手法で検出した データフロー範囲 TFに対応する メソッド呼び出しの ID番号範囲 実行履歴中のメソッド呼び出しには、呼び出された順に時系列でID番号を付加 TFが実行されている箇所に対応するメソッド呼び出し群のID番号の範囲を、実行履歴やソースコードから判断 提案手法によって検出したデータフロー範囲が、TF実行箇所のメソッド呼び出しに付けられたID番号範囲と対応するかどうかを確認 1対1で対応するとき、TFが抽出できたと判定 同一TFが複数回出現する場合は、全ての出現時においてデータフローと1対1で対応するときのみ正しくTFが抽出できたと判定 取得データを 画面出力 2007/2/2 ソフトウェアサイエンス研究会
結果 35回のTF実行に対して、32個のデータフローを検出 トランザクションファンクションの検出結果 検出した32個のデータフローのうち、28個はトランザクションファンクションと1対1で対応 重複して現れるトランザクションファンクションを含む トランザクションファンクションの検出結果 含まれるトランザクションファンクション16個のうち、11個を正しく検出 2007/2/2 ソフトウェアサイエンス研究会
TF検出結果 16個中11個を正しく検出 TFを正しく検出できなかったケース コードグループ検索 選択肢の情報を取得 アイテムグループ検索 16個中11個を正しく検出 TFを正しく検出できなかったケース あるTFで生成されたデータが、次に実行されるTFでも利用される (表2.※) データの詳細をユーザに与えるTF 複数のTFが同時に実行される (表2. *) 画面に表示する選択肢のデータ項目を検索するTF 表2. TF抽出結果 ※ ※ * 画面に表示する選択肢のデータ項目を検索・取得するTF * * 2007/2/2 ソフトウェアサイエンス研究会
考察 あるTFで生成されたデータが、次に実行されるTFでも利用される場合に正しく検出できない 異なる実行履歴を使用した実験では検出可能 詳細情報取得のみ実行した際の実行履歴 16個中13個のTFの検出に成功 複数のTFが同時に実行される場合に正しく検出できない データフローは発生しているが、1つの大きなデータフローに含まれる 現状の提案手法ではデータフローのマージ処理を行うため検出できない 対処法検討中 2007/2/2 ソフトウェアサイエンス研究会
まとめと今後の課題 まとめ 実行履歴を利用してメソッド呼び出し群をクラスタリングすることによって、トランザクションファンクションを抽出する手法を提案 実際のプログラムを対象に適用実験 今後の課題 適用実験によって見つかった問題点への対策 複数のTFが同時に実行される場合の処理 別の実験対象ソフトウェアを用いて適用実験 2007/2/2 ソフトウェアサイエンス研究会