Presentation is loading. Please wait.

Presentation is loading. Please wait.

クラス動作シナリオ可視化手法の プログラム理解作業に対する有効性評価

Similar presentations


Presentation on theme: "クラス動作シナリオ可視化手法の プログラム理解作業に対する有効性評価"— Presentation transcript:

1 クラス動作シナリオ可視化手法の プログラム理解作業に対する有効性評価
平成22年2月15日 クラス動作シナリオ可視化手法の プログラム理解作業に対する有効性評価 大阪大学 大学院情報科学研究科 コンピュータサイエンス専攻 井上研究室 博士前期課程2年 宗像 聡(Munakata Satoshi) 平成22年3月18日 第167回ソフトウェア工学研究発表会 修士論文発表会

2 概要 クラスの動作理解を支援 オブジェクト指向プログラムの動作理解を支援 オブジェクトが多数生成されるクラスの動作理解は困難
平成22年2月15日 概要 オブジェクト指向プログラムの動作理解を支援 クラスの動作理解を支援 オブジェクトの振舞いを可視化する手法が有効 オブジェクトが多数生成されるクラスの動作理解は困難 各オブジェクトの振舞いを逐一確認するのは労力が大きい 振舞いの類似性に基づきオブジェクト群を分割する手法を提案 グループごとに振舞いを図として可視化 注目クラスの代表的な振舞いのみを確認できる 6つのオープンソースソフトウェアに適用して,有効性を検証 本発表では,オブジェクト指向プログラムの動作理解支援を目的として,ある1つの注目するクラスについて,その動作の理解を支援する一手法を提案します. クラスの動作理解とは,そのクラスがプログラム中でどのように使われるのか,または,そのクラスのオブジェクトがプログラム中でどのように振舞うのか理解することを指します. これには,プログラム実行時に行われた,そのクラスのオブジェクトの実際の振舞いを確認することが有効であると言われています. しかし,注目するクラスのオブジェクトがプログラム実行時に多数生成された場合には,このようにして,クラスの動作を理解することは困難になります. なぜなら,同じクラスのオブジェクトであっても,その振舞いはそれぞれに異なりますが,各オブジェクトの振舞いを逐一確認するのは労力が大きく,現実的でないためです. そこで,本研究では,注目するクラスのオブジェクト群を,その振舞いの類似性に基づいて分割する手法を提案します この分割により,互いに振舞いが類似するオブジェクトからなるグループが複数得られます.そして,グループごとにその振舞いを図として可視化することで,注目するクラスの特徴的な振舞いのみを提示できると考えました. 提示された図のみを確認することで,多数のオブジェクトを生成するクラスであっても,効率良く動作理解が行える,ということを目指しています. 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

3 クラスの動作理解 o1 o2 プログラムの保守にはクラスの動作理解が不可欠[1,2] 実行時のオブジェクトの振舞いの可視化が有効
平成22年2月15日 クラスの動作理解 プログラムの保守にはクラスの動作理解が不可欠[1,2] クラスの使われ方,クラスのオブジェクトの振舞い 実行時のオブジェクトの振舞いの可視化が有効 プログラム実行時に,動作情報を実行履歴として収集 注目クラスのオブジェクトごとに,関係する動作情報を抽出 呼び出し関係図・UMLシーケンス図,DOPG図として可視化[3,4,5] プログラム 実行履歴 クラス A 近年,多くのプログラムがオブジェクト指向に基づいて,設計および実装されています. オブジェクト指向プログラムは複数の役割の異なるクラスから構成されています. そのため,オブジェクト指向プログラムを適切にメンテナンスするには,使われているクラスの動作,つまりクラスの使われ方やそのオブジェクトの振舞いについて,十分に理解することが不可欠であるといわれています. クラスの動作理解には,プログラム実行時に行われた,そのクラスのオブジェクトの実際の振舞いを可視化して確認することが有効であると言われています. これは,次の手順で行われます. まず,プログラム実行時に,メソッド呼び出しなどの動作情報を収集します. 次に,注目するクラスのオブジェクトごとに,そのオブジェクトと関係する動作情報を抽出します. そして,抽出したオブジェクトごとの動作情報を,目的に応じて,呼び出し関係図や,UMLシーケンス図,DOPG図に変換します. このようにして,注目するクラスのオブジェクトの振舞いが図として可視化されます. 呼び出し関係図 シーケンス図 o1 o2 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

4 振舞いの確認における問題 ? 注目クラスのオブジェクトが多数生成される場合 クラス A オブジェクトの振舞いはそれぞれ異なる[6]
平成22年2月15日 振舞いの確認における問題 注目クラスのオブジェクトが多数生成される場合 オブジェクトの振舞いはそれぞれ異なる[6] 各オブジェクトの振舞いを逐一確認することは困難 クラス A しかし、実用的なシステムでは、1つのクラスからオブジェクトが、多数生成されることがしばしばあります。 しかし,注目するクラスのオブジェクトがプログラム実行時に多数生成される場合には,適用することが困難になります 同じクラスのオブジェクトであっても,その振舞いはオブジェクトごとにそれぞれ異なります. そのため, 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

5 以前に提案した手法[7] !! 目的 代表的な振舞いの可視化 クラス A オブジェクトを多数生成するクラスの動作理解支援
平成22年2月15日 以前に提案した手法[7] 目的 オブジェクトを多数生成するクラスの動作理解支援 代表的な振舞いの可視化 振舞いが類似するオブジェクト群を分割 グループごとに振舞いをシーケンス図として可視化 注目クラスのオブジェクトの代表的な振舞いのみを提示 クラス A !! 1つのクラスから生成された多数のオブジェクトの中には、互いに振舞いの類似しているものが多く存在することが期待できます。 そこで提案手法では、解析対象のオブジェクトを、振舞いの類似しているものが同じグループになるように分類し、グループごとに代表的な振舞いを可視化する、というアプローチをとります。 これにより、確認する振舞いの数を、なるべく実行履歴にある実行時情報を潰すことなく減らすことができ、クラスの動作の全体像を容易に把握できるようになると考えました。 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

6 提案手法 以前に提案した手法の問題点 対話的な動作理解支援手法として再定義 分割基準が固定で,多様な調査目的を反映できない
UML シーケンス図だけでは,提示された複数の振舞いの違いを比較,確認することが困難 対話的な動作理解支援手法として再定義 Step1:4つの分割基準から1つを選びオブジェクト群を分割 Step2:3つの可視化方法から1つを選び,各グループの振舞いの違いを強調して可視化 Step3:注目するグループについて,異なる分割基準で含まれるオブジェクト群を,さらに分割

7 Step1:オブジェクト群の分割 オブジェクト集合O={o1,…,on}上の同値関係を定義 同値関係を1つ選び,オブジェクト群を同値分割
平成22年2月15日 Step1:オブジェクト群の分割 オブジェクト集合O={o1,…,on}上の同値関係を定義 オブジェクトの振舞いの同値性に基づく同値関係 観点の異なる4つの同値関係 同値関係を1つ選び,オブジェクト群を同値分割 同値関係 Euse(os,ok) ・・・ os,okの参加した機能が同じ Emethods(os,ok) ・・・ os,okの使われ方が同じ Eused(os,ok),Ecalled(os,ok) ・・・ 本発表では説明を省略 オブジェクト群の分割は,オブジェクトの振舞いに基づく同値関係を定義し,それを用いて同値分割することで行います. このオブジェクトの振舞いの同値関係として,観点の異なる4つの同値関係を定義しました. Euseは,プログラム実行時に参加した機能が同じであるオブジェクトについて,同値関係が成り立ちます. また,Emethodsは,同じ使われ方をされたオブジェクトについて,同値関係が成り立ちます. そして,動作理解の目的に応じて,適用する同値関係を1つ選び,オブジェクト群を同値分割することになります. 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

8 Euse(os,ok) クラス A クラス X クラス Y o1 o2 o3 メソッド呼び出し元のクラスが完全一致
平成22年2月15日 Euse(os,ok) メソッド呼び出し元のクラスが完全一致 o1,o2 ・・・ { クラスX }, o3 ・・・ { クラスY } クラスはそれぞれ異なる役割を持つ 複数の役割のクラスが協調動作して,システムの機能が実現[7] 参加した機能の違いからくる,振舞いの差を識別 クラス A o1.print() o1 クラス X o2 o2.input() クラス Y o3 o3.input() 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

9 Emethods(os,ok) クラス A クラス X クラス Y o1 o2 o3 動作したメソッドが完全一致
平成22年2月15日 Emethods(os,ok) 動作したメソッドが完全一致 o1 ・・・ { print() }, o2,o3 ・・・ { input() } 動作したメソッドからは,クラスの使われ方が分析できる[8] 使われ方の違いからくる,振舞いの差を識別 クラス A o1.print() o1 クラス X o2 o2.input() クラス Y o3 o3.input() 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

10 Step2:振舞いの可視化 クラス A 各同値類からオブジェクトを1つランダムに選択 可視化方法を選び,各オブジェクトの振舞いを可視化
平成22年2月15日 Step2:振舞いの可視化 各同値類からオブジェクトを1つランダムに選択 同値関係から,ある観点では振舞いの性質が同じことがわかっている 可視化方法を選び,各オブジェクトの振舞いを可視化 呼び出し関係図,UMLシーケンス図,DOPG図 抽象度,識別できる振舞いの差が異なる クラス A Euse Euse 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

11 Step3:再帰的な分割 異なる同値関係を用いて,再帰的に分割 複数の観点から,より詳細に振舞いの差を確認できる クラス A Euse
平成22年2月15日 Step3:再帰的な分割 異なる同値関係を用いて,再帰的に分割 複数の観点から,より詳細に振舞いの差を確認できる クラス A しかし,各同値関係で識別できる振舞いの差は,限られています. Euse Euse 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

12 実装 Amida-OGAN GUIベースの対話的ツール 対話的に,分析クラス・同値類,分割基準,可視化方法を選択
平成22年2月15日 実装 Amida-OGAN GUIベースの対話的ツール 対話的に,分析クラス・同値類,分割基準,可視化方法を選択 呼び出し関係図・UMLシーケンス図・DOPG図 分割基準 可視化方法 分析クラス・同値類 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

13 適用実験 目的 調査質問 方法 クラス動作理解に対する有効性を検証 6つのオープンソースソフトウェアから取得した実行履歴に,提案手法を適用
平成22年2月15日 適用実験 目的 クラス動作理解に対する有効性を検証 調査質問 可視化するオブジェクトの選び方により,獲得する知識が変わるか? オブジェクト群の同値分割により,代表的な振舞いを提示できるか? 各クラスは同値分割により,幾つの同値類に分割されるか? 方法 6つのオープンソースソフトウェアから取得した実行履歴に,提案手法を適用 ケーススタディとして,特定クラスの動作理解を実施 各クラスの分割結果の調査 可視化するオブジェクトの選び方により,獲得できる知識が変わる場合はあるか? 振舞いに基づくオブジェクト群の同値分割により,代表的な振舞いを提示できるか? 各クラスのオブジェクト群は,同値分割により幾つの同値類に分割されるか? 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

14 分析対象 オブジェクトが複数存在するクラスの割合 約24~71%,平均で約36% ソフトウェア イベント数 クラス数 オブジェクト数
平成22年2月15日 分析対象 オブジェクトが複数存在するクラスの割合 約24~71%,平均で約36% ソフトウェア イベント数 クラス数 オブジェクト数 Scheduler 8578 (12) 17 1,973 JHotDraw 128,796 (97) 185 6,286 Apache PMD 633,309 (67) 105 8,431 MASU 3,198,125 (80) 309 12,414 Apache FOP 3,657,813 (120) 502 27,342 Antlr 7,305,687 (42) 60 21,022 オブジェクトが複数存在するクラスの割合は,約24~71%(平均で約36%) Software #Events #Classes #Objects Scheduler 8578 (12) JHotDraw 128,796 (97)185 6,286 Apache PMD 633,309 (67)105 8,431 MASU 3,198,125 (80)309 12,414 Apache FOP 3,657,813 (120)502 27,342 Antlr 7,305,687 (42)60 21,022 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

15 Scheduler Javaで実装された,予定管理用カレンダープログラム 実行シナリオ 実行開始から終了までに1973個のオブジェクトが出現
平成22年2月15日 Scheduler Javaで実装された,予定管理用カレンダープログラム 予定を記入したい日付に対応するセルをクリック 登録ダイアログが開き,予定を編集できる 実行シナリオ 異なる日付に計3つの予定を追加 実行開始から終了までに1973個のオブジェクトが出現 適用実験の目的 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

16 クラスCalendarDateの分析 クラスCalendarDate Euseによる分割を適用 日付ごとの予定データを管理する
平成22年2月15日 クラスCalendarDateの分析 クラスCalendarDate 日付ごとの予定データを管理する 実行履歴中には731個のオブジェクトが出現 731個のオブジェクトの振舞いを確認することは困難 Euseによる分割を適用 呼び出し元のクラスに基づく同値分割 参加した機能の違いを識別することが目的 3個の同値類{ s1, s2, s3 }に分割 s1は,オブジェクト数 641 s2は,オブジェクト数 87 s3は,オブジェクト数 3 どのグループが何かを説明. 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

17 {s1,s2,s3}の呼び出し関係図 注目オブジェクトと,他のクラスのオブジェクトとの メソッド呼び出し関係を有効グラフとして可視化
平成22年2月15日 {s1,s2,s3}の呼び出し関係図 s1 s2 注目オブジェクトと,他のクラスのオブジェクトとの メソッド呼び出し関係を有効グラフとして可視化 ・同じクラスは同じ色で表現 ・少数の同値類としか関係しないクラスほど,大きいノードで表現 s3 共通する呼び出し関係 同じ処理を行っていると予測できる 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

18 s3の呼び出し関係図 s3 登録ダイアグラムと予定データ をCalendarDateが仲介 予定データ追加に関係したと予測
平成22年2月15日 s3の呼び出し関係図 s3 登録ダイアグラムと予定データ をCalendarDateが仲介 予定データ追加に関係したと予測 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

19 s3のUMLシーケンス図の一部 登録ダイアログ上でユーザからのマウス操作 登録ダイアログから予定の追加要求を受ける
平成22年2月15日 s3のUMLシーケンス図の一部 登録ダイアログ上でユーザからのマウス操作 登録ダイアログから予定の追加要求を受ける 予定データベースに予定を追加 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

20 {s1,s2,s3}のDOPG図 s1 s2 クラスの動作の全体像の把握 段階的にクラスの動作を調査 s3

21 分析結果 (1/2) 同値関係 Euse による分割 オブジェクトの選び方により,獲得できる知識が変わる 参加した機能の違いを反映していた
平成22年2月15日 分析結果 (1/2) 同値関係 Euse による分割 参加した機能の違いを反映していた s1 ・・・ 初期化   s2 ・・・ 初期化 & 描画 s3 ・・・ 初期化 & セル描画 & 予定追加 オブジェクトの選び方により,獲得できる知識が変わる 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

22 分析結果 (2/2) 全オブジェクトの呼び出し関係図は,3パターン DOPG図では,6パターン 可視化した3図で網羅されていた
平成22年2月15日 分析結果 (2/2) 全オブジェクトの呼び出し関係図は,3パターン 可視化した3図で網羅されていた 提示した以外の振舞いを図として可視化することで,新たに得られる知識は少ない DOPG図では,6パターン 提示していない3パターンがある 動作したスレッド,推移的な呼び出しの違いなど 新たに同値関係を定義して,この様な振舞いの差を識別し分割することは可能 注目クラスのオブジェクトの振舞いとして,どの程度の差を識別する必要があるか,今後調査が必要 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

23 Euseに基づく分割結果 同値類が9 個以下である(1画面で図を 並べて確認できる)クラスの割合 全クラス → 約97%
平成22年2月15日 Euseに基づく分割結果 同値類が9 個以下である(1画面で図を 並べて確認できる)クラスの割合 全クラス → 約97% オブジェクト数が50 以上 → 約82% 同値類が9 個以下であるクラスの割合は全クラスに 対して約97%,オブジェクトが50 個以上存在するクラスに対して約82%, 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

24 多数の同値類に分割されるクラス イベント通知,データ保持,ユーティリティの役割のクラス MASUのクラスStateChangeEvent
平成22年2月15日 多数の同値類に分割されるクラス イベント通知,データ保持,ユーティリティの役割のクラス MASUのクラスStateChangeEvent 8344個のオブジェクト,45個の同値類 JHotDrawのクラスResourceBundleUtil 959個のオブジェクト,58個の同値類 多数のクラスから横断的に使用されるため 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

25 再帰的な分割 分割数の少ない分割基準から適用することで,興味あるオブジェクト群を絞ることが可能
分割基準によって分割数は大きく変わることがある 例) MASUのクラスStateChangeEvent Euseでは,45個の同値類に分割 Emethodsでは,3個の同値類に分割 分割数の少ない分割基準から適用することで,興味あるオブジェクト群を絞ることが可能 EuseかEmethods のどちらかが分割数9以下であるクラス 全体で約99% オブジェクト数が50以上のクラスで約93% 第167回ソフトウェア工学研究発表会 平成22年3月18日

26 調査結果 ケーススタディから,可視化するオブジェクトの選び方により,獲得できる知識が変わる場合が実際にあることを確認した.
ケーススタディでは,クラスに代表的な振舞いを提示できた. Schedulerでは,異なる機能に対応する3つの振舞いを,網羅的に提示できた オブジェクトが50 個以上あるクラスの内,約84~95%と大多数のクラスで,各分割数は9 以下だった 各振舞い図を,1 画面で比較,確認できる数 第167回ソフトウェア工学研究発表会 平成22年3月18日

27 まとめ クラスの動作理解を支援する手法 今後の課題 注目クラスの代表的な振舞いのみを可視化 動作理解作業に対する有効性評価
平成22年2月15日 まとめ クラスの動作理解を支援する手法 注目クラスの代表的な振舞いのみを可視化 振舞いの同値性に基づいて,オブジェクト群を同値分割 同値類ごとに振舞いを可視化 動作理解作業に対する有効性評価 6つのオープンソースソフトウェアから取得した実行履歴に,提案手法を適用 今後の課題 実際のメンテナンス作業に対する有効性評価 被験者を用いた対照実験,主観的評価など 考察が無い 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

28 第167回ソフトウェア工学研究発表会 平成22年3月18日

29 DOPG(Dynamic Object Process Graph)
平成22年2月15日 DOPG(Dynamic Object Process Graph) 1つのオブジェクトについて注目した制御依存グラフ DOPG図 ClassB # newClassA() Javaプログラム 10 11 12 class ClassB { void newClassA() { ClassA a = new ClassA (); for(int i=0; i<a.max(); i++) passClassA( a ); } void passClassA( ClassA a ) { a.call(); System.out.println(); Create o1 ClassA # max() ClassB # passClassA( ClassA ) 暗い オートシェイプで表現 色々と省略 サンプルとして完成させる もっと読みやすく 意味がわからん ClassB # passClassA( ClassA ) ClassA # call() 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

30 Methodsに基づく分割結果 同値類が9 個以下であるクラスの割合 全クラス → 約99% オブジェクト数が50 以上 → 約87%
平成22年2月15日 Methodsに基づく分割結果 同値類が9 個以下であるクラスの割合 全クラス → 約99% オブジェクト数が50 以上 → 約87% 同値類が9 個以下であるクラスの割合は全クラスに 対して約99%,オブジェクトが50 個以上存在するクラスに対して約87%, 第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会

31 UseとMethodsの分割結果の相関 平成22年2月15日 どっちかで9個以下のやつは 修士論文発表会
第167回ソフトウェア工学研究発表会 平成22年3月18日 修士論文発表会


Download ppt "クラス動作シナリオ可視化手法の プログラム理解作業に対する有効性評価"

Similar presentations


Ads by Google