ソースコードの静的解析によるソフトウェア保守支援に関する研究

ソースコードの静的解析によるソフトウェア保守支援に関する研究
大阪大学大学院情報科学研究科コンピュータサイエンス専攻井上研究室小堀一雄 20～30分以下. 6in1両面で人数分配布50人　20部+ A4の1枚で業績一覧　20部+ D論文の簡易製本2部+2部

ソフトウェア保守とはソフトウェア保守とは保守に関するコストソフトウェア保守を支援したい全ライフサイクルの3分の２を占める
納入後，ソフトウェアに対して加えられる，欠陥の修正，性能などの改善，変更された環境に適合させるための修正．[IEEE Std 1219] 保守に関するコスト全ライフサイクルの3分の２を占める 20年以上も保守を続けているシステムも存在する自分の思いはぶれないようにしてください。ストーリーが大事なぜそんな話になっているのか？私はこういう立場でこう考えたのでこうしましたソフトウェア保守を支援したい

ソフトウェア保守の課題課題保守を難しくする要因保守担当者に以下を理解させるのが重要であるどのように修正すべきか？
どこを（どこまで）修正すべきか？保守を難しくする要因社会基盤を担う重要なソフトウェアは、大規模化・複雑化・ライフサイクルの長期化が進む保守期間中にドキュメント最新化が成されず、実際の動作と乖離が発生保守のアウトソーシングやオフショアが進み、仕様決定時の情報を持たない人が保守を担当

ソフトウェア保守を支援する方法保守支援に関する様々な手段リバースエンジニアリング回帰テストソースコード動的分析ソースコード静的解析
ソースコードから設計情報を抽出する回帰テスト修正することでデグレードした箇所を特定するソースコード動的分析ソースコードの実行結果から振る舞いや特徴を分析動作環境とテストケースが必要ソースコード静的解析ソースコードの記述を分析して振る舞いや特徴を分析動作環境やテストケースは不要かいてあることだけちゃっちゃとやれや。

ソースコード静的解析を用いたソフトウェア保守支援
ソースコード静的解析技術を利用してプログラムから抽出された情報をもとに，プログラム保守の支援を目的として様々な解析が行われている．代表的な例を以下に示す．デバッグ支援プログラムスライスを用いることで，デバッグ対象を限定する影響波及解析再テストすべきテストケースを限定することで，テスト工程を効率化するソフトウェア部品の評価メトリクス値化された部品の性質から再利用性や品質を評価コピー部品の把握メトリクス計測された情報を配列化し，解析効率を上げる理解支援解析結果情報を選別の基準とし，大量の部品からの選別作業を支援する研究成果の世の中の位置づけを説明できるか？

研究の目的プログラム保守支援を目的としたソースコード解析手法の提案手法を実現したツールの評価アクセス修飾子過剰性の解析手法
本論文では、下記の2つのソースコード解析技術に着目し、保守や再利用における支援を目的とした以下の解析手法の提案、提案手法を実現したツールの評価を行う．プログラム保守支援を目的としたソースコード解析手法の提案アクセス修飾子過剰性の解析手法ソフトウェア類似部品の高速な解析手法手法を実現したツールの評価 1つのoverではわかったので、複数verで考えましょう verっていっても、MajorVUをAE、MajorのときにAEをチェックするのがいいんじゃないの？

研究対象とする課題① 「アクセス修飾子過剰性の解析」
研究対象とする課題①　　　　　　　　　　「アクセス修飾子過剰性の解析」保守の課題１：「どのように修正すべきか？」課題の具体例 public class X { private String str = null; private void setString( ) { // ① str = "hello"; } public int getLength() { // ② return str.length(); public int getCorrectLength() { this.setString(); return this.getLength(); <開発者の想定する正しい手順> ① 初期値がnullである変数strにStringオブジェクトを代入 ② 変数strの文字列長を取得 public getLength()のアクセス修飾子がprivateではなくpublic 外部からの呼び出しを想定したメソッドに①→②の呼び出し順序を実装話をまとめろ。いらんこといっぱい言った。練習不足。外部から①を飛ばして②を直接実行可能 NullPointerExceptionの発生

研究対象とする課題①　　　　　　　　　　「アクセス修飾子過剰性の解析」既存研究の問題アクセス修飾子の過剰性に関しての詳細な研究はあまり無いアクセス修飾子のチェックのみ行い、適切さについて議論していないアクセス修飾子の修正に関する支援が無い privateにすべきメソッドやフィールドに関する警告を提示する privateのみでなく、全アクセス修飾子について過剰性を解析・修正を支援する必要があるアクセス修飾子過剰性の解析・修正を支援する手法を提案する

研究対象とする課題② 「類似部品の高速な解析」
研究対象とする課題② 　　　　　　　　　　　　　「類似部品の高速な解析」保守の課題２：「どこを(どこまで)修正すればよいか？」課題の具体例想定シナリオ「類似部品に存在する類似バグを修正したい」生産性を上げたい！ネットやリポジトリに過去の部品が大量に蓄積されている再利用して素早く実装した（コピー＆ペーストによる類似部品作成）．～しばらくして～ある類似部品に修正・デバッグを行った．他の類似部品にも同じ修正・デバッグを行う必要がある．大量の既存部品から、いますぐ類似部品見つけたい！類似部品の発見、検索

研究対象とする課題② 　　　　　　　　　　　　　「類似部品の高速な解析」既存研究の課題文字列比較による類似測定手法が多い解析に時間がかかるため、解析対象が大規模化する場合、バッチ処理的な運用が想定される。しかし、類似部品の検索対象は随時作成されていくため、現在のリポジトリに対して即時に類似部品を発見したい。ソースコード部品類似性の高速な解析手法を提案するここなおしたら、あっこもなおさなあかん類似部品を測定する単純に、文字列を比較するときには問題がありますよ

博士論文構成と業績一覧の関連博士論文構成業績一覧第１章はじめに
第１章　はじめに第２章　アクセス修飾子過剰性に関する研究　[1-1], [1-2], [2-1], [2-2] 第３章　ソフトウェア部品類似性に関する研究 [1-3], [1-4], [2-4] 第４章　むすび業績一覧主要論文 [1-1] 小堀一雄, 石居達也, 松下誠, 井上克郎: “Javaプログラムのアクセス修飾子過剰性分析ツールModiCheckerの機能拡張とその応用例”. SEC journal, Vol.33, 2013.（学術論文，採録決定） [1-2] D. Quoc, K. Kobori, N. Yoshida, Y. Higo and K. Inoue,: ModiChecker: Accessibility Excessiveness　Analysis Tool for Java Program, コンピュータソフトウェア, Vol.29, No.3, pp , 2012.（学術論文） [1-3] 小堀一雄, 山本哲男, 松下誠, 井上克郎: “コードの静的特性を利用したJavaソフトウェア部品類似判定手法” ，電子情報通信学会論文誌D，Vol.J90-D(4) , pp , 2007.（学術論文） [1-4] Kazuo Kobori, Tetsuo Yamamoto, Makoto Matsushita, Katsuro Inoue: “Classification of Java Programs in SPARS-J”, International Workshop on Community-Driven Evolution of Knowledge Artifact, Session 4-3, Irvine, CA, 2003.（国際会議録）関連論文 [2-1] 石居達也, 小堀一雄, 松下誠, 井上克郎: “アクセス修飾子過剰性の変遷に着目したJavaプログラム部品の分析”, 情報処理学会研究報告 Vol.2013-SE-180, No.1, pp.1-8, (国内会議録) [2-2] Dotri Quoc，Kazuo Kobori，Norihiro Yoshida，Yoshiki Higo，Katsuro Inoue: “Modi Checker : Accessibility Excessiveness Analysis Tool for Java Program”日本ソフトウェア科学会大会講演, Vol28, 6C-2, pp.1-7，2011. (国内会議録) [2-3] 小堀一雄，山本哲男，松下誠，井上克郎: “メソッド間の依存関係を利用した再利用支援システムの実装”, 電子情報通信学会技術研究報告, SS , Vol.104, No.722, pp.13-18, 2005.（国内会議録） [2-4] 小堀一雄，山本哲男，松下誠，井上克郎: “類似度メトリクスを用いたJavaソースコード間類似度計測ツールの試作”, 電子情報通信学会技術研究報告, SS2003-2, Vol.103, No.102, pp.7-12, (国内会議録)

アクセス修飾子過剰性に関する研究博士論文　第２章

背景：アクセス修飾子アクセス修飾子フィールド/メソッドへのアクセスを制限する修飾子(※)
public, protected, default(宣言なし),privateが存在過剰に設定すると不具合の原因となりうる過剰：アクセス可能な範囲 > 実際のアクセス範囲アクセス修飾子アクセス可能な範囲 public あらゆる部品 protected 自身と同じパッケージに属する部品及び自身のサブクラス default(宣言なし) 自身と同じパッケージに所属する部品 private 自身と同じクラス ※本研究ではクラスのアクセス修飾子については考慮しない

アクセス修飾子過剰性を表すメトリクス AE(Accessibility Excessiveness)
フィールド/メソッドのアクセス修飾子を以下の３つに分類適切：実際の被アクセス状況通りのアクセス修飾子が宣言されている（表中緑色） AE：実際の被アクセス状況に比べて過剰に広いアクセス修飾子が宣言されている状態（表中オレンジ色） NA(NoAccess)：どこからもアクセスされていない状態（表中黄色）実際の被アクセス範囲に対応するアクセス修飾子 Public Protected Default Private NoAccess pub-pub pub-pro pub-def pub-pri pub-na x pro-pro pro-def pro-pri pro-na def-def def-pri def-na pri-pri pri-na 現在宣言しているアクセス修飾子

アクセス修飾子過剰性の解析・自動修正ツールModiChecker
入力：解析対象のソースコード群必要なライブラリ(.jarなど) MASU（既存のJava解析ツールソースコードの内容・呼び出し関係を解析する AST(抽象構文木) データベースフィールド/メソッドに宣言しているアクセス修飾子を抽出フィールド/メソッドの呼び出される範囲を抽出アクセス修飾子の過剰性（AE）を抽出 MASU - 出力：各フィールド/メソッドのAE種別

ModiCheckerの適用実験目的考察事項対象ソフトウェア複数のオープンソースにおける各AEの分布状況を確認する
MASU(519 files, LOC) Ant (1141 files, LOC) jEdit 4.4.1(546 files, LOC)

MASUに対する結果　～各AEの割合～ 35.7% 14.3% JSSST11 2018/9/22

MASUに対する結果～考察～ AEであるフィールド総数（割合） : 280(35.7%)
将来的な利用を想定 : 20 自動生成 : 255 設定ミス : 5 自動生成ツールによって、一律publicと設定されたフィールドが多かった AEであるメソッド総数（割合） : 253(14.3%) 将来的な利用を想定 : 181 自動生成 : 6 設定ミス : 66 Java Beanの使用上機械的にpublicと設定されたメソッド(setter/getter)が多かった Ant,Jditに分析したことをいう。java beanの制約上、実際のアクセス範囲に関わらず、getter, setterメソッドには機械的にpublicが設定されていた JSSST11 2018/9/22

応用実験（１）概要目的：先の実験で、ソフトウェアのある時点におけるAEの解析をおこなうことができた
応用実験（１）　概要目的：先の実験で、ソフトウェアのある時点におけるAEの解析をおこなうことができた次に、応用として、ソフトウェアの開発履歴を追ってAEの状態がどのように遷移するか分析することで、AEを解析すべき契機に関する情報を開発者に提案したい実験内容：バージョンアップ時に、アクセス修飾子が適切・AE・NAのうち、どの状態に遷移していくのか可視化する計測事項：全バージョンにおける状態遷移総数における、状態遷移の種別ごとの割合を調査する

応用実験（１）　実験対象実験対象：7つのJavaプロジェクト（バージョン数があり、最近まで開発が行われていて、世の中で利用されているソフトウェア）番号プロジェクト名バージョン番号バージョン数開発期間(年) 1 Apache Ant 1.1 ～ 1.8.4 23 2003～2012 2 Areca Backup 5.0 ～ 66 2007～2012 3 ArgoUML ～ 0.34 19 2002～2011 4 FreeMind 0.0.2 ～ 0.9.0 16 2000～2011 5 JDT_Core 2.0.1 ～ 3.7 2002～2012 6 jEdit 3.0 ～ 4.5.2 21 2000～2012 7 Apache Struts 1.0.2 ～ 2.3.7 34

バージョン間における状態遷移適切 NA AE なし 2バージョン間におけるフィールド/メソッドの状態遷移は以下を状態遷移図で表現する
状態数：４適切、AE、NA、なし（フィールド/メソッドが削除された状態）状態遷移数：18 a ~ r 適切 NA AE なし a,p b c d e,q f g h i,r o l j m k n

結果考察-メソッド状態遷移(単位:%)

応用実験（１）結果考察フィールド/メソッドに共通して得られた知見フィールドについて得られた知見メソッドについて得られた知見
応用実験（１）　結果考察フィールド/メソッドに共通して得られた知見一度、アクセス修飾子が設定されると、その後アクセス修飾子が変更されるケースは少ない用途が変わる場合は、フィールド/メソッド自体を変更する傾向にあるフィールドについて得られた知見アクセス範囲を明確にして作成されるものが大半メソッドについて得られた知見作成時点ではアクセス範囲が定まっていないもの(NA)が多いできたら消えないのはわかったじゃあ、いつできるの？

応用実験（２）概要目的：先の応用実験（１）で、ソフトウェアの開発履歴を追ってアクセス修飾子の状態がどのように遷移するか分析できた
応用実験（２）　概要目的：先の応用実験（１）で、ソフトウェアの開発履歴を追ってアクセス修飾子の状態がどのように遷移するか分析できた次に、さらなる応用として、どのようなバージョンアップの際にAEの変化が大きくなるのか分析することで、AE解析を行うべきタイミングを提案したい仮説 Major version up時にAEが大きく変化する過剰なアクセス修飾子を設定されたフィールド・メソッドが追加される Minor version up時にはAEはほとんど変化しない一度作成されたAEは修正されることはない（先の応用実験結果）

Antの22バージョンにおけるAE変化量仮説に合致しそうな結果を得たので検定を行う

応用実験（２）結果考察フィールド：全AE・NAでMajorVU時とMinorVU 時の間で有意差（有意水準0.05）がみられた
応用実験（２）　結果考察フィールド：全AE・NAでMajorVU時とMinorVU 時の間で有意差（有意水準0.05）がみられたメソッド：pub-pri,def-pri,def-na 以外のAE・NAについMajorVU 時とMinorVU 時の間で有意差（有意水準0.05）がみられた上記のAEは他のAE・NAに比べて各バージョン間の値の変化量が小さく，順位がタイとなる値が多かったためマン・ホイットニーの U 検定では誤差が出やすい状況下にあった．下記仮説を裏付ける結果が得られた Major version up時にAEが大きく変化する Minor version up時にはAEはほとんど変化しない

ソフトウェア類似部品に関する研究博士論文　第３章

研究対象とする課題② 「類似部品（Javaクラス）の高速な解析」
解決したい課題（その２）「どこまで修正すればよいか？」課題の具体例想定シナリオ「類似部品に存在する類似バグを修正したい」生産性を上げたい！ネットやリポジトリに過去の部品が大量に蓄積されている再利用して素早く実装した（コピー＆ペーストによる類似部品作成）．～しばらくして～ある類似部品に修正・デバッグを行った．他の類似部品にも同じ修正・デバッグを行う必要がある．大量の既存部品から、いますぐ類似部品見つけたい！類似部品の発見、検索

研究対象とする課題② 　　　　　　　　　　　　　「類似部品の高速な解析」既存研究の課題文字列比較による類似測定手法が多い解析に時間がかかるため、解析対象が大規模化する場合、バッチ処理的な運用が想定される。しかし、類似部品の検索対象は随時作成されていくため、現在のリポジトリに対して即時に類似部品を発見したい。ソースコード部品類似性の高速な解析手法を提案するここなおしたら、あっこもなおさなあかん類似部品を測定する単純に、文字列を比較するときには問題がありますよ

類似度メトリクス 2つの視点から類似度メトリクスを計測する数値比較のため、文字列比較に比べて解析コストの低下が期待できるトークン構成
メトリクス：ソースコードにおける各トークンの出現数トークン＝予約語 + 記号 + 演算子 + 識別子　　　（96種）（49種）（9種）（37種）（１種） ※ jdk1.3の場合意味：ソフトウェア部品の表層的特徴を表す複雑度メトリクス：クラス内のメソッド数, サイクロマチック数（分岐の数）など意味：ソフトウェア部品の構造的特徴を表す数値比較のため、文字列比較に比べて解析コストの低下が期待できる

類似判定法トークン構成に関するメトリクスと複雑度に関するメトリクスの全てにおいて
部品AとBのメトリクス値差分があらかじめ設定した閾値以内になった場合類似部品と判定する分類メトリクス閾値※ トークン構成各トークンの出現数差分の和／小さいほうの部品のトークン総数 0.03 複雑度サイクロマチック数メソッドの宣言数 1 メソッド呼び出し数 2 ネストの深さ “class”トークン数 “interface”トークン数（※今回の実験で経験的に設定した値）

類似判定の効率化メトリクス計測時に、いくつかのメトリクスでハッシュキーを作成する新しく類似測定をしたい部品Pが追加される
メトリクス[A,B,C]の閾値＝[0.0.1] ハッシュキー＝ 8bit 8bit 8bit (24bit) メトリクスA メトリクスB メトリクスC 残りの全メトリクスを用いた類似判定の計算を行うのは、左下図の部品A，B，Cの3つのみに限定する部品と、部品の持つメトリクス値から作成したハッシュキーを対応させた表を構築しておく最終結果を変えずに解析コストを下げることが可能 [ ]= null [ ]= 部品A [ ]= 部品B，部品C [ ]= null [ ]= 部品Z ・・・・・・

適用実験の概要実験目的実験内容比較するツール実験対象のソースコード
今回提案したメトリクス値比較による類似判定手法が、　　従来の文字列比較による類似判定手法より解析コストが低くなることを確かめる実験内容同じソースコード群に対して、各手法を実装した２ツールによる類似判定を行った際の解析コストを比較する比較するツール既存の文字列比較を用いた類似度測定ツールSMMT 今回提案したメトリクス比較を用いた類似度測定ツールLuigi 実験対象のソースコード JDK1.3に属する431個のクラス

考察（解析コスト）解析コストは1/150になった文字列比較を用いた類似度測定ツールSMMTの計算コスト：24.35（sec）
メトリクス値比較を用いた類似度測定ツールLuigiの計算コスト対象： JDK1.3 　　　　　431クラスハッシュキーを構成するメトリクス事前分類クラスタ数計算コスト(sec) 未使用 1 05.02 [ C ] 21 00.56 [ C,M ] 85 00.29 [ C,M,T ] 232 00.16 解析コストは1/150になったメトリクス値比較だけで1/5に低下ハッシュキーにより、さらに1/30に低下 C：サイクロマチック数 M：宣言メソッド数 T : トークン構成メトリクス

むすび博士論文　第４章

まとめ下記のソースコード静的解析技術を提案・評価したアクセス修飾子の解析手法高速なソースコード類似度判定手法
AEメトリクスを用いたアクセス修飾子解析手法を提案した上記手法をツールModiCheckerに実装した ModiCheckerの適用実験により、以下を示した AE・NAの解析・可視化を実現した AEは一度作り込まれると、version upしても修正されず残る傾向にある多くのAE・NAにおいて、major version upの方がminor version upより多くのAEが発生する傾向にある高速なソースコード類似度判定手法メトリクス比較を用いた類似判定手法を提案した上記手法をツールLuigiに実装した Luigiの適用実験により、以下を示した既存の文字列比較を用いた類似度測定ツールSMMTと比べて150倍の速度をもつことを示した

今後の研究方針アクセス修飾子解析手法 AEが発生した原因をインタビューなどで調査する AEの発生を防ぐ開発環境を提供する
テストケースも合わせてModiCheckerで解析する品質（バグ）とAEの関連性を分析する類似判定手法現在、類似判定エンジンのみなので、単独のツールとして利用しやすいようにする各メトリクスの閾値の設定を簡単にできるようにする Java以外の言語への対応

発表おわりご清聴ありがとうございました．

以下、補足資料

業績一覧主要論文 [1-1] 小堀一雄, 石居達也, 松下誠, 井上克郎: “Javaプログラムのアクセス修飾子過剰性分析ツールModiCheckerの機能拡張とその応用例”. SEC journal, Vol.33, pp , 2013.（学術論文） [1-2] D. Quoc, K. Kobori, N. Yoshida, Y. Higo and K. Inoue,: ModiChecker: Accessibility Excessiveness　Analysis Tool for Java Program, コンピュータソフトウェア, Vol.29, No.3, pp , 2012.（学術論文） [1-3] 小堀一雄, 山本哲男, 松下誠, 井上克郎: “コードの静的特性を利用したJavaソフトウェア部品類似判定手法” ，電子情報通信学会論文誌D，Vol.J90-D(4) , pp , 2007.（学術論文） [1-4] Kazuo Kobori, Tetsuo Yamamoto, Makoto Matsushita, Katsuro Inoue: “Classification of Java Programs in SPARS-J”, International Workshop on Community-Driven Evolution of Knowledge Artifact, Session 4-3, Irvine, CA, 2003.（国際会議録）関連論文 [2-1] 石居達也, 小堀一雄, 松下誠, 井上克郎: “アクセス修飾子過剰性の変遷に着目したJavaプログラム部品の分析”, 情報処理学会研究報告 Vol.2013-SE-180, No.1, pp.1-8, (国内会議録) [2-2] Dotri Quoc，Kazuo Kobori，Norihiro Yoshida，Yoshiki Higo，Katsuro Inoue: “Modi Checker : Accessibility Excessiveness Analysis Tool for Java Program”日本ソフトウェア科学会大会講演, Vol28, 6C-2, pp.1-7，2011. (国内会議録) [2-3] 小堀一雄，山本哲男，松下誠，井上克郎: “メソッド間の依存関係を利用した再利用支援システムの実装”, 電子情報通信学会技術研究報告, SS , Vol.104, No.722, pp.13-18, 2005.（国内会議録） [2-4] 小堀一雄，山本哲男，松下誠，井上克郎: “類似度メトリクスを用いたJavaソースコード間類似度計測ツールの試作”, 電子情報通信学会技術研究報告, SS2003-2, Vol.103, No.102, pp.7-12, (国内会議録)

はじめに

ソフトウェア保守とはソフトウェア保守とは「修正」と「ソフトウェア保守」の分類 [JISX0161:2008]
納入後，ソフトウェアに対して加えられる，欠陥の修正，性能などの改善，変更された環境に適合させるための修正．[IEEE Std 1219] 「修正」と「ソフトウェア保守」の分類 [JISX0161:2008] 分類名定義是正保守ソフトウェア製品の引渡し後に発見された問題を訂正するために行う受身の修正緊急保守是正保守の内，実施までシステム運用を確保するための，計画外で一時的な修正予防保守引渡し後のソフトウェア製品の潜在的な障害が運用障害になる前に発見し，是正を行うための修正適応保守引渡し後，変化した又は変化している環境において，ソフトウェア製品を使用できるように保ち続けるために実施するソフトウェア製品の修正完全化保守引渡し後のソフトウェア製品の潜在的な障害が故障として現れる前に，検出し訂正するための修正修正の分類ソフトウェア保守の分類是正保守緊急保守訂正予防保守適応保守改良完全化保守

ソースコード解析ソースコード解析の分類ソースコード静的解析ソースコードを実際に動作することなく解析を行うことで，性質や振る舞い情報を抽出する技術ソースコードの中身を扱うため，網羅性の高い解析をすることが可能ソースコード動的解析ソースコードを動作環境上で実際に動作させ，その動作結果や動作中のログなどを解析することで性質や振る舞い情報を抽出する技術マルチスレッド処理など，ソースコード静的解析では発見が難しい　振る舞いを解析することが可能網羅的な振る舞いを調べるには多くのテストケースが必要となる．動作環境やテストケースの準備が不要であるため、　現場への適用が容易な「ソースコード静的解析」に　注目する。変更

研究対象とする課題①　　　　　　　　　　「アクセス修飾子過剰性の解析」解決したい課題（その１）「過剰に広いアクセス修飾子をもつフィールド，メソッドに関する理解支援」課題の具体例想定シナリオ：設計時に意図しなかった不正なメソッド呼び出し対策の考察：対策１：ドキュメントにプログラム内部構造を詳細に書く　　　　　　　→作成コスト、メンテナンスコストが大きすぎる　　　　　　　→膨大な資料を説明・理解するコストが大きすぎる対策２：不正な呼び出しができないようにリファクタリングする　　　　　　　→不正な呼び出しの可能性がある箇所の特定が難しい　　　　　　　→設計時に想定した範囲より過剰に広い範囲からアクセスされる　　　　　　　　フィールド・メソッドの解析・修正を支援したい

適用実験

ModiChecker適用実験の概要実験の目的実験対象のソフトウェア Validation of our approach
Quantitative analysis of AE Id in some software systems Reasons for excessive/unused fields/methods (found by interviewing developers) Reason 1 : Set for future use Reason 2 : Created by other program(automatic code generators or refactoring tools…) or accessed by other programs(Java bean) Reason 3 : Carelessness and immaturity　実験対象のソフトウェア Industrial Software(341 Java files/ LOC) r

適用実験結果（フィールド）実際の被アクセス宣言 Public Protected Default Private NoAccess
207 59 936 33 x 9 18 4 5 2 1123 AEであるフィールドの数 NAであるフィールドの数

適用実験結果（メソッド）実際の被アクセス宣言 Public Protected Default Private NoAccess
816 14 23 190 1005 x 13 36 48 9 3 488 4 AEであるメソッドの数 NAであるメソッドの数

適用結果の考察 AEもしくはNAのフィールド/メソッドの数は以下のとおり
NA(NoAccess)であるフィールド（40個）について内容を確認した結果将来的な利用を想定したもの：8 外部からの利用を想定したもの：5 serialVersionUID（直列化ランタイムからの使用を想定）実際に未使用だったもの：27 その内、潜在バグを伴っていたもの：5 AEの研究なのにNoAccessの分析で良いのか？　NoAccessもAEの一部として重要であることを事前に言うべきか？

Discussion Validation of ModiChecker output
Changed all of the excessive access modifier and deleted some unused fields/methods Modified programs were compiled and executed without any error Developer should look for the detailed result and make decision to change/delete the unused/excessive fields/methods Conclusion for excessiveness Number for reason State the reason first , then give the solution English grammar

Antに対する結果　～各AEの割合～ 18.9% 35.5%

Antに対する結果～考察～ AEフィールド総数（割合） : 611(18.9%) AEメソッド総数（割合） : 1520(35.5%)
将来的な利用を想定 : unknown 自動生成 : 0 設定ミス : unknown AEメソッド総数（割合） : 1520(35.5%) AEメソッドの割合> AEフィールドの割合 java beanの制約上、実際のアクセス範囲に関わらず、getter, setterメソッドには機械的にpublicが設定されていた 2018/9/22

jEditに対する結果　～各AEの割合～ 24.1% 30.4%

jEditに対する結果～考察～ AEフィールド総数（割合） : 604(24.1%) AEメソッド
将来的な利用を想定 : unknown 自動生成 : 0 設定ミス : unknown AEメソッド総数（割合） : 981(30.4%) AEメソッドの割合> AEフィールドの割合

応用実験①

応用実験②

バージョン毎のフィールド/メソッド分類 AE以外の状態を2つにグループ化し，計3つの状態を定義 ③NA ①AE ②適切 Public
宣言されてはいるがどこからもアクセスされていない ①AE アクセス可能な範囲が実際のアクセス範囲より広い Public Protected Default Private NoAccess pub-pub pub-pro pub-def pub-pri pub-na x pro-pro pro-def pro-pri pro-na def-def def-pri def-na pri-pri pri-na ②適切アクセス可能な範囲と実際のアクセス範囲が一致 AE以外の状態を2つにグループ化し，計3つの状態を定義

応用実験概要データの取得にはアクセス修飾子過剰性検出ツールModiCheckerを利用
応用実験　概要分析１：プロジェクト開発履歴における各状態遷移の出現頻度分析目的：バージョンアップの際にAEであるアクセス修飾子の修正がどれ程の頻度で行われているのかを明確にする計測データ：全バージョン間での(各種状態遷移総数÷全状態遷移総数) 分析2：プロジェクト開発履歴における各AEの修正状況分析目的：AEの種類ごとに，修正頻度に差異がみられるかどうかを明確にする計測データ：修正されたAE数 ÷ 全バージョン内のAE総数データの取得にはアクセス修飾子過剰性検出ツールModiCheckerを利用

バージョン間での状態遷移の分類(2/2) グループ対応する記号性質 AE修正 a,b,c アクセス修飾子の変化によりAE修正
適切→適切はアクセス修飾子が変化したもののみ AE発生 d,e,f アクセス修飾子の変化によりAE発生 AE→AEはアクセス修飾子が変化したもののみアクセス消失 g,h,i アクセス修飾子の変化によりアクセスが消失 NA→NAはアクセス修飾子が変化したもののみフィールド/メソッド作成 j,k,l バージョンアップにより新たに作成フィールド/メソッド削除 m,n,o バージョンアップにより削除変化なし p,q,r バージョンアップ前後で変化がない適切，AE，NAそれぞれ1状態ずつ

分析1結果-Antにおけるフィールド状態遷移
0.02,71.42 6.41 適切なし 2.03 0.03 0.46 0.04 0.16 0.21 0.13 1.41 0.02 NA AE 0.00 0.07,15.28 0.00,2.28 0.03

分析１結果-フィールド状態遷移(単位:%)
<AE修正，AE発生，アクセス消失> アクセス修飾子の修正を伴う遷移は全体の1%に満たない <フィールド作成> 「適切」で作成される場合が最も多い変化なし(p,q,r)→全体の約53～97% 変化なし(適切)→全体の約36～71%

分析１結果-メソッド状態遷移(単位:%) <メソッド作成> 比較的「NA」で作成される場合が多い
<AE修正，AE発生，アクセス消失> アクセス修飾子の修正を伴う遷移は全体の1%に満たない <メソッド作成> 比較的「NA」で作成される場合が多い変化なし(p,q,r)→全体の約51～96% 変化なし(NA)→全体の約25～55%

結果考察-フィールド状態遷移(単位:%)

結果考察-メソッド状態遷移(単位:%) <メソッド作成> 比較的「NA」で作成される場合が多い

分析２結果-フィールドAE修正状況(単位:%)
AEが修正される割合はAEの種類に関わらず0.2%に満たない pub-def,pub-pri → 全7プロジェクトにて修正作業が行われている pro-def,pro-pri,def-pri → 6プロジェクトにて修正作業が行われている

分析２結果-メソッドAE修正状況(単位:%)
注： × ・・・全バージョンにて一度も出現しなかったことを表す AEが修正される割合はAEに関わらず高々0.2%に満たない pub-def,pub-pri → 全7プロジェクトにて修正作業が行われている pub-pro,pro-pri → 6プロジェクトにて修正作業が行われている

結果考察-フィールド状態遷移(単位:%)

結果考察-メソッド状態遷移(単位:%) <メソッド作成> 比較的「NA」で作成される場合が多い

ソースコードの静的特性を用いた Javaプログラム間類似度測定ツールの試作

背景ソフトウェアを収集して再利用部品検索システムを構築ソフトウェア開発効率を飛躍的に向上するための手法として、再利用が注目されている
再利用とは既存の類似ソフトウェア部品を参照し，一部手直しをして用いることインターネットの普及により大量のソースコードが比較的容易に入手可能となった再利用を活用するためには，過去に開発された類似なソフトウェア部品に関する情報を入手することが必要これらのソースコードは，開発者にとって有益な再利用部品である可能性があるソフトウェアを収集して再利用部品検索システムを構築

SPARS-J（1/2） SPARS-J 利用実績に基づくソフトウェア部品検索システム
（Software Product Archiving, analyzing ,and Retrieving System for Java）システムの特徴対象：Javaプログラムソースコード利用実績に基づいた評価値(Component Rank*)を計算し，利用実績によるランク付けを行う事で，利用実績の高い部品を，ユーザに提供可能 * Katsuro Inoue, Reishi Yokomori, Hikaru Fujiwara, Tetsuo Yamamoto, Makoto Matsushita, Shinji Kusumoto: "Component Rank: Relative Significance Rank for Software Component Search", to be appeared in Proceedings of 25th International Conference on Software Engineering (ICSE 2003), Portland, Oregon, 2003.

+ SPARS-J（2/2） Component Rankの計算では，部品間のコピー関係を把握するために類似度を測定している
類似部品を一つの部品群として扱い，利用関係を合成する評価値にコピー関係を反映させることが可能 B D B D 類似合成 + 部品A 部品A´ 部品群A C E F C E F これまでは，ソースコードの文字列比較を行う事で，類似部品を判定していた

ハッシュ関数を用いた解決法ハッシュ関数 h(Ttotal) を用いた加工｜h(Ttotal) － h(Ttotal×0.97)｜≦ １
　log1.04（Ttotal） h(Ttotal) 6 5 4 3 2 1 Ttotal Ttotal

6 5 4 3 2 1 Ttotal Ttotal×0.97 Ttotal×1.03

ハッシュによる類似判定の効率化現状の問題点アイデア実現方法類似判断には９６（トークン構成）＋６（複雑度）＝１０２種類のメトリクスを
用いて比較を行っている。新しい部品が入ってきた場合、全部の既存部品と102種類のメトリクスの比較を行なわないとならないアイデア下記のような部品を比較対象から除外することで、さらに高速化できないか？トークンの総出現回数が0.97倍未満 or 1.03倍超である部品複雑度メトリクスが閾値を超える部品実現方法最終的な類似判断結果に直接影響を与えるメトリクス（＝主メトリクス）をキーとしたハッシュを利用し、事前に分類をしておく．

類似判定の効率化メトリクス計測時に、いくつかの主メトリクスでハッシュキーを作成する新しく類似測定をしたい部品Pが追加される
主メトリクス[A,B,C]の閾値＝[0.0.1] ハッシュキー＝ 8bit 8bit 8bit (24bit) 主メトリクスA 主メトリクス B 主メトリクス C 102種のメトリクスを用いた類似判定の計算を行うのは、部品A，B，Cの3つのみとするハッシュキーと既存登録部品を対応させた表を構築しておく最終結果を変えずに解析コストを下げることが可能 [ ]= null [ ]= 部品A [ ]= 部品B，部品C [ ]= null [ ]= 部品Z ・・・ DB ・・・

6 5 4 3 2 1 Ttotal Ttotal

6 5 4 3 2 1 Ttotal

実験結果 SPARS-Jの類似度測定部「Luigi」として実装対象： JDK1.3 431クラス
　　　　　431クラス文字列比較を用いた類似度測定ツールの計算コスト：24.35（sec）主メトリクス類似クラスタ最終クラスタ計算コスト(sec) 未使用 1 278 05.02 [ C ] 21 00.56 [ C,M ] 85 00.29 [ C,M,T ] 232 00.16 [ ]= null [ ]= 部品A [ ]= 部品B，部品C [ ]= null [ ]= 部品Z ・ C：サイクロマチック数 M：宣言メソッド数 T : f(Ttotal) DB ・

　　　　　431クラス文字列比較を用いた類似度測定ツールの計算コスト：24.35（sec）主メトリクス類似クラスタ最終クラスタ計算コスト(sec) 未使用 1 278 05.02 [ C ] 21 00.56 [ C,M ] 85 00.29 [ C,M,T ] 232 00.16 C：サイクロマチック数 M：宣言メソッド数 T : f(Ttotal) トークン構成度+複雑度の両方で類似と判定され、最終的に類似と判定された部品群の数

　　　　　431クラス文字列比較を用いた類似度測定ツールの計算コスト：24.35（sec）主メトリクス類似クラスタ最終クラスタ計算コスト(sec) 未使用 1 278 05.02 [ C ] 21 00.56 [ C,M ] 85 00.29 [ C,M,T ] 232 00.16 C：サイクロマチック数 M：宣言メソッド数 T : f(Ttotal) 類似度の測定精度を落とすことなく効率だけが上がっている

　　　　　431クラス文字列比較を用いた類似度測定ツールの計算コスト：24.35（sec）主メトリクス類似クラスタ最終クラスタ計算コスト(sec) 未使用 1 278 05.02 [ C ] 21 00.56 [ C,M ] 85 00.29 [ C,M,T ] 232 00.16 メトリクス比較により，コストは1/5 C：サイクロマチック数 M：宣言メソッド数 T : f(Ttotal)

　　　　　431クラス文字列比較を用いた類似度測定ツールの計算コスト：24.35（sec）主メトリクス類似クラスタ最終クラスタ計算コスト(sec) 未使用 1 278 05.02 [ C ] 21 00.56 [ C,M ] 85 00.29 [ C,M,T ] 232 00.16 ハッシュキーにより，コストは1/30 メトリクス比較により，コストは1/5 C：サイクロマチック数 M：宣言メソッド数 T : f(Ttotal)

+ SPARS-J（2/2） ⇒ Component Rankの計算では，部品間のコピー関係を把握するために類似度を測定している
類似部品を一つの部品群として扱い，利用関係を合成する評価値にコピー関係を反映させることが可能類似部品A 部品群A 部品A 部品A´ 合成 + ⇒ これまでは，ソースコードの文字列比較を行う事で，類似部品を判定していた

Ttotalをハッシュキーに適応するときの問題点
類似判定の条件 diff(A,B) トークンの差分が Ttotalの3％以内＜ 0.03 min(Ttotal（A）, Ttotal（B）) Ttotal =30　⇒ 29～31 Ttotal =150　⇒ 145～155 DB [ ]= null [ ]= 部品A [ ]= null [ ]= null [ ]= 部品B [ ]= 部品C [ ]= 部品D，部品E [ ]= null [ ]= 部品F [ ]= null [ ]= 部品G [ ]= 部品H,部品I [ ]= 部品Z ・ [ ]= null [ ]= 部品A [ ]= 部品B，部品C [ ]= null [ ]= 部品Z ・ DB ・

類似度判定法（トークン構成メトリクス） ∑ ∑ D(A,B) D(A,B) ＜ 0.03※ ならA,Bは類似と判定 Ttotal（X） (
部品Xのトークン構成メトリクス：（Xm1,・・・,Xm96) 96 Ttotal（X） ∑ ( ) 部品X の全トークン数：＝ Xmk k=1 96 ∑ 部品A,Bの各トークンの差分の和 diff(A,B) ： ( ) ＝ Amk Bmk k=1 ■部品Aと部品Bの非類似度 diff(A,B) D(A,B) min(Ttotal（A）, Ttotal（B）) （※今回の実験で経験的に設定した値） D(A,B) ＜ 0.03※ ならA,Bは類似と判定

Overview of Experiment(1/2)
Objectives of experiment Validation of our approach Quantitative analysis of AE Id in open source code Reasons for excessiveness Reason 1 : Set for future use　 Reason 2 : Created by other program(automatic code generators or refactoring tools…)　 Reason 3 : Carelessness and immaturity　 Change number in latter pages State the experiment process Object of experiment : validation of our approach, Quantitative analyses of AE ID in open source 2018/9/22

Overview of Experiment(2/2)
Target Software Ant (1141 files, LOC) jEdit 4.4.1(546 files, LOC) MASU(519 files, LOC) JSSST11 2018/9/22

Result of Ant(1/2) Ratio of each AE Id
18.9% 35.5% JSSST11 2018/9/22

Result of Ant(2/2) Excessive fields Excessive methods
Total number : 611(18.9%) Set for future use : unknown Created by other program : 0 Carelessness and immaturity : unknown Excessive methods Total number : 1520(35.5%) Ratio of excessive methods > ratio of excessive fields Encapsulation : Make fields private and provide public getter/setter to access fields JSSST11 2018/9/22

Result of jEdit(1/2) Ratio of each AE Id
24.1% 30.4% JSSST11 2018/9/22

Result of jEdit(2/2) Excessive fields Total number : 604(24.1%)
Set for future use : unknown Created by other program : 0 Carelessness and immaturity : unknown Excessive methods Total number : 981(30.4%) Ratio of excessive methods > ratio of excessive fields JSSST11 2018/9/22

Result of MASU(1/2) Ratio of each AE Id
35.7% 14.3% JSSST11 2018/9/22

Result of MASU(2/2) Excessive fields Total number : 280(35.7%)
Set for future use : 20 Created by other program(automatic code generator) : 255 Carelessness and immaturity : 5 Excessive methods Total number : 253(14.3%) Set for future use : 181 Created by other program(automatic code generator) : 6 Carelessness and immaturity : 66 Ratio of excessive fields > ratio of excessive methods Caused by fields created by automatic code generator JSSST11 2018/9/22

文献一覧 (1/5) [1-1] M. Page-Jones,: “The Practical Guide to Structured Systems Design”, New York, Yourdon Press, [1-2] A.April, and A.Abran,: "Software Maintenance Management: Evaluation and Continuous Improvement", IEEE Computer Society-John Wiley & Sons, Inc., New Jersey, [1-3] Nghi Truong, Paul Roe, and Peter Bancroft,: “Static analysis of students' Java programs”, In Proc. ACE '04, , [1-4] IEEE Std 1219,: "Standard for software maintenance", [1-5] ISO/IEC 14764:2006,: "software engineering – software life cycle processes - maintenance", [1-6] JIS X 0161:2008,: "ソフトウェア技術−ソフトウェアライフサイクルプロセス−保守 Software Engineering-Software Life Cycle Processes-Maintenance", [1-7] E. J. Chikofsky, and J. H. Cross,: "Reverse engineering and design recovery: A taxonomy", IEEE Software, Vol.7, No.1, pp.13–17, [1-8] Imagix Corporation,: "Imagix 4D", [1-9] IBM,: "Rational software modeler", [1-10] T. J. Biggerstaff,: “Design recovery for maintenance and reuse”, Computer, Vol.22, No.7, pp.36–49, [1-11] E. Gamma, R. Helm, R. Johnson, and J. M. Vlissides,: "Design Patterns: Elements of Reusable Object-Oriented Software", Addison Wesley, [1-12] N. Shi, and R. A. Olsson,: "Reverse engineering of design patterns from Java source code", In Proc. of ASE 2006, pp.123–134, [1-13] N. Tsantalis, A. Chatzigeorgiou, G. Stephanides, and S. T. Halkidis,: “Design pattern detection using similarity scoring”, IEEE Transactions on Software Engineering, Vol.32, No.11, pp.896–909, [1-14]L. Prechelt, B. Unger-Lamprecht, M. Philippsen, and W. Tichy,: "Two controlled experiments assessing the usefulness of design pattern documentation in program maintenance", IEEE Transactions on Software Engineering, Vol.28, No.6, pp.595–606, [1-15] K. H. Bennet. Software maintenance: A tutorial. In M. Dorfman, and R. H.Thayer eds,: "Software Engineering", IEEE Computer Society Press, [1-16] X. Ren, F. Shah, F. Tip, B. G. Ryder, and O. Chesley,: "Chianti: a tool for change impact analysis of java programs", In Proc. of OOPSLA 2004, pp.432–448, 2004.

文献一覧 (2/5) [1-17] G. Rothermel and M. J. Harrold,: "A safe, efficient regression test selection technique", ACM Transactions on Software Engineering and Methodology, Vol.6, No2, pp.173–210, [1-18] S. R. Chidamber and C. F. Kemerer,: "A metrics suite for object oriented design", IEEE Transactions on Software Engineering, Vol.20, No.6, pp.476–493, [1-19] E. J. Weyuker,: “Evaluating software complexity measures”, IEEE Transactions on Software Engineering, Vol.14, No.9, pp.1357–1365, [1-20] V. R. Basili, L. C. Briand, and W. L. Melo,: "A validation of object-oriented design metrics as quality indicators", IEEE Transactions on Software Engineering, Vol.22, No.10, pp.751–761, [1-21] M. Weiser,: “Program slicing”, In Proc. of ICSE '81, pp.439–449, [1-22] T. M. Meyers and D. Binkley,: "An empirical study of slice-based cohesion and coupling metrics", ACM Transactions on Software Engineering and Methodology, Vol.17, No.1, pp.1-27, [1-23] Y. Kataoka, T. Imai, H. Andou, and T. Fukaya,: "A quantitative evaluation of maintainability enhancement by refactoring", In Proc. of ICSM 2002, pp.576–585, [1-24] M. Fowler,: ”Refactoring: improving the design of existing code”, Addison Wesley, [1-25] W. F. Opdyke,: “Refactoring object-oriented frameworks”, PhD thesis, University of Illinois at Urbana-Champaign, [1-26] M. Weiser,: “Program slicing”, Proc. of the 5th International Conference on Software Engineering, pp.439–449, [1-27] J.Gosling, B.Joy, G.Steele, G.Bracha, A.Buckley,: “The Java Language Specication, Java SE 7 Edition”, [1-28] K. Khor, Nathaniel L.Chavis, S.M.Lovett and D. C. White,: “Welcome to IBM Smalltalk Tutorial ”, 1995 [1-29] A. Müller,: “Bytecode Analysis for Checking Java Access Modifiers”, Work in Progress and Poster Session, 8th Int. Conf. on Principles and Practice of Programming in Java (PPPJ 2010), Vienna, Austria, [1-30] T. Cohen,: “Self-Calibration of Metrics of Java Methods towards the Discovery of the Common Programming Practice”, The Senate of the Technion, Israel Institute of Technology, Kislev 5762, Haifa, [1-31] D. Evans, and D. Larochells,: “Improving Security Using Extensible Lightweight Static Analysis”, IEEE software, vol.19, No.1, pp , [1-32] J. Viega, G. McGraw, T. Mutdosch, and E. Felten,: “Statically Scanning Java Code: Finding Security Vulnerabilities”, IEEE software, Vol.17 No.5 pp , 2000.

文献一覧 (3/5) [1-33] Jlint,: [1-34] B. S. Baker,: “Finding clones with Dup: Analysis of an experiment”, IEEE Trans. Softw. Eng., Vol.33, No.9, pp.608–621, [1-35] I. D. Baxter, A. Yahin, L. Moura, M. S. Anna, and L. Bier,: "Clone detection using abstract syntax trees", In Proc. of ICSM '98, pp.368–377, [1-36] L. Jiang, G. Misherghi, Z. Su, and S. Glondu. Deckard,: "Scalable and accurate tree-based detection of code clones", In Proc. of ICSE 2007, pp.96–105, [1-37] T. Kamiya, S. Kusumoto, and K. Inoue, “CCFinder: A multi-linguistic token-based code clone detection system for large scale source code”, IEEE Transactions on Software Engineering, vol.28, no.7, pp , [1-38] R. Komondoor, and S. Horwitz,: "Using slicing to identify duplication in source code", In Proc. of SAS 2001, pp.40–56, [1-39] B. Laguë, D. Proulx, J. Mayrand, E. M. Merlo, and J. Hudepohl,: "Assessing the benefits of incorporating function clone detection in a development process", In Proc. of ICSM '97, pp.314–321, [1-40] Z. Li, S. Lu, S. Myagmar, and Y. Zhou,: "CP-Miner: Finding copy-paste and related bugs in large-scale software code", IEEE Trans. Softw. Eng., Vol.32, No.3, pp.176–192, [1-41] A. Zeller,: “Why Programs Fail”, Morgan Kaufmann Pub., [1-42] M. Kim, L. Bergman, T. Lau, and D. Notkin,: "An ethnographic study of copy and paste programming practices in oopl", In Proc. of ISESE 2004, pp.83–92, [1-43] A. Aiken,: "Moss (measure of software similarity) plagiarism detection system", moss/ [1-44] L. Prechelt, G. Malpohl, and M. Philippsen, “Jplag: Finding plagiarisms among a set of programs”, Technical Report , Fakultat fur Informatik, Universitat Karlsruhe, [1-45] K. Verco, and M. Wise,:“YAP3 : Improved detection of similarities in computer program and other texts”, Proc. of the 27th SIGCSE Technical Symposium on Computer Science Education, pp.130–134, 1996 [1-46] 長橋賢児,: “類似性に基づくソフトウェア品質の評価,” 情処学研報2000-SE-126, Vol.2000, No.25, pp.65–72, [1-47] 山本哲男, 松下誠, 神谷年洋, 井上克郎,: “ソフトウェアシステムの類似性とその計測ツールSMMT”, 電子情報通信学会論文誌D-1, Vol.J85-D-I, No.6, pp , [1-48] 日本情報システム・ユーザー協会,: "非機能要求仕様定義ガイドライン - 検収フェーズのモデル取引・整備報告書 UVC（User Vender Collaboration）研究プロジェクトⅡ報告書 " , 2007．

文献一覧 (4/5) [2-1] Dotri Quoc, Kazuo Kobori, Norihiro Yoshida, Yoshiki Higo, Katsuro Inoue, ModiChecker: Accessibility Excessiveness Analysis Tool for Java Program, コンピュータソフトウェア, Vol.29, No.3, pp , [2-2] G.Booch, R.Maksimchuk, M.Engel, B.Young, J.Conallen, and K.Houston, “ Object-Oriented Analysis and Design with Applications ”, Addison Wesly, [2-3] K. Arnold, J. Gosling, D. Holmes,: ”The Java Programming Language, 4th Edition”,Prentice Hall, 2005, [2-4] SourceForge.jp,: [2-5] T. Cohen,: “Self-Calibration of Metrics of Java Methods towards the Discovery of the Common Programming Practice ”, The Senate of the Technion, Israel Institute of Technology, Kislev 5762, Haifa, [2-6] D. Evans, and D. Larochells,“Improving Security Using Extensible Lightweight Static Analysis ”, IEEE software, vol.19, No.1, pp , [2-7] J. Viega, G. McGraw, T. Mutdosch, and E. Felten,“ Statically Scanning Java Code: Finding Security Vulnerabilities ”, IEEE software, Vol.17 No.5 pp , [2-8] FindBugs,: [2-9] Jlint,: [2-10] N. Rutar,: C. Almazan, and J. Foster, “ A Comparison of Bug Finding Tools for Java ”, 15th International Symposium on Software Reliability Engineering (ISSRE04), pp , [2-11] Apache Ant,: [2-12] jEdit,: [2-13] 三宅達也, 肥後芳樹, 楠本真二, 井上克郎,: "多言語対応メトリクス計測プラグイン開発基盤MASUの開発", 電子情報通信学会論文誌D, vol. J92-D, no. 9, pp , [2-14]小堀一雄, 石居達也, 松下誠, 井上克郎: “Javaプログラムのアクセス修飾子過剰性分析ツールModiCheckerの機能拡張とその応用例”. SEC journal, Vol.33, 2013.

文献一覧 (5/5) [3-1]V.R.Basili, G.Caldiera, F.McGarry, R.Pajerski, G.Page, and S.Waligora,: “The software engineering – an operational software experience”, in Proceedings of 14th International Conference on Software Engineering(ICSE14), pp , Melbourne, Australia, [3-2] C. Braun,: "Reuse", in John J. Marciniak, editor, Encyclopedia of Software Engineering, John Wiley & Sons, Vol.2, pp , [3-3] Diffutils,: [3-4] K. Inoue, R. Yokomori, H. Fujiwara, T. Yamamoto, M. Matsushita, and S. Kusumoto,: “Component Rank: Relative Significance Rank for Software Component Search”, to be appeared in Proceedings of 25th International Conference on Software Engineering (ICSE 25), pp.14-24, [3-5] S.Isoda,: “Experience report on a software reuse project: Its structure, activities, and statistical results”, in Proceedings of 14th International Conference on Software Engineering (ICSE 14), pp , Melbourne, Australia, [3-6] J.Gosling, B.Joy, G.Steele, and G.Bracha,: ”The Java Language Specification, Second Edition”, Prentice Hall, [3-7] B.Keepence, and M.Mannion,: “Using patterns to model variability in product families”, IEEE Software, Vol.16, No.4, pp , [3-8] W.Miller, and E.Myers,: “A file comparison program”, Software-Practice and Experience, Vol.15, No.11, pp , [3-9] E.Myers,: “An O(N D) difference algorithm and its variations, Algorithmica, Vol.1, pp , [3-10] SourceForge,: [3-11] E.Ukkonen: Algorithms for approximate string matching. INFCTRL: Information and Computation (formerly Information and Control), Vol.64, pp , [3-12] 横森励士, 梅森文彰, 西秀雄, 山本哲男, 松下誠, 楠本真二, 井上克郎,: "Javaソフトウェア部品検索システムSPARS-J", 電子情報通信学会論文誌 D-I, VolJ87-D-I, No.12, pp , 2004.

考察（類似判定精度） SMMTとの結果と比較結果適合率：156/201=0.776 再現率：156/199=0.783
適合しなかった部品について非常に規模の小さい部品（総トークン数が10数個以内）が多いことが分かった．小さい規模の部品に関してもLuigiは類似判定の対象としていたのに対して， SMMTでは類似対象から外していた．再現しなかった部品についてコピーしてメソッドを増やしたような部分的に高い類似性をもつものが多かった． Luigiでは部品全体のメトリクス値のみを扱う方法で高速化を図ったため，このような部分的に高い類似性を評価できないというトレードオフがあることがわかった． SPARSというツールで同じ部品をあつめなあかんという状況下では十分満足できるものでした。 SMMTと比較して定量的な分析をしたところ、0.8ぐらいだったけど、適合再現しなかった部品を調べたらこうでした。もっとよくなると思います。全部品数 Luigiが類似と判定した部品数 SMMTが類似と LuigiとSMMT両方が類似と判定した部品数 431 201 199 156

類似判定法（トークン構成メトリクス） D(A,B) ＜ 0.03※ なら，部品A,Bは類似候補と判定する
部品X のトークン構成メトリクス：（Xm1 ,・・・, Xm96) 変数の意味変数式部品A,B 間における各トークンの差分の合計値 diff(A,B) 部品X の全トークン数 Ttotal (X) 部品A,B の非類似度 D(A,B) D(A,B) ＜ 0.03※ なら，部品A,Bは類似候補と判定する（※今回の実験で経験的に設定した値）

類似判定法（複雑度メトリクス）以下の6種類のメトリクスを使用する
メトリクス名閾値※ サイクロマチック数メソッドの宣言数 1 メソッド呼び出し数 2 ネストの深さ “class”トークン数 “interface”トークン数部品A,B の各メトリクスの差分が閾値以内に収まったら部品A,B は類似候補と判定する（※今回の実験で経験的に設定した値）

ソースコードの静的解析によるソフトウェア保守支援に関する研究

Similar presentations

Presentation on theme: "ソースコードの静的解析によるソフトウェア保守支援に関する研究"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

ソースコードの静的解析による ソフトウェア保守支援に関する研究

Similar presentations

Presentation on theme: "ソースコードの静的解析による ソフトウェア保守支援に関する研究"— Presentation transcript:

Similar presentations

About project

フィードバック

ソースコードの静的解析によるソフトウェア保守支援に関する研究

Presentation on theme: "ソースコードの静的解析によるソフトウェア保守支援に関する研究"— Presentation transcript: