メソッド名とその周辺の識別子の相関ルールに基づくメソッド名変更支援手法

Slides:

Advertisements

Similar presentations

Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 1 ソフトウェア部品推薦のための.

Advertisements

シーケンス図の生成のための実行履歴圧縮手法

シーケンシャルパターンマイニングに基づくオブジェクト指向プログラムのための欠陥検出手法

プログラミング基礎I(再) 山元進.

メソッド周辺の識別子とメソッド本体のAPI利用実績に基づいたAPI集合推薦手法

Javaのための暗黙的に型定義される構造体

Myoungkyu Song and Eli Tilevich 発表者：石尾隆（大阪大学）

アクセス修飾子過剰性の変遷に着目したJavaプログラム部品の分析

第２回：Javaの変数と型の宣言プログラミングII 2007年10月2日.

アルゴリズムとデータ構造 2011年6月13日

動詞に着目した相関ルールを利用するメソッド名の命名支援手法の評価

変数のスコープの設計判断能力を育成するプログラミング教育

JSFによるWebアプリケーション開発第6回

相関ルールマイニングを用いたメソッドの命名方法の分析

ソースコードの変更履歴におけるメトリクス値の変化を用いたソフトウェアの特性分析

ソースコード中に出現する動詞-目的語関係を利用したメソッド名の命名支援手法

コーディングパターンとキーワードを用いて生成したコードスニペットの推薦

Javaクラスの利用関係を用いたソフトウェア部品のカテゴリ階層構築法

コードクローンに含まれるメソッド呼び出しの変更度合の分析

コードクローンに含まれるメソッド呼び出しの変更度合の調査

識別子の命名支援を目的とした動詞-目的語関係の辞書構築

オブジェクト指向プログラミング第八回知能情報学部新田直也.

独習ＪＡＶＡ 6.8 コンストラクタの修飾子 6.9 メソッドの修飾子 6.10 ObjectクラスとClassクラス 11月28日（金）

オブジェクト指向プログラミング第十一回知能情報学部新田直也.

暗黙的に型付けされる構造体の Java言語への導入

利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成

Javaプログラムの変更を支援する影響波及解析システム

7.4 intanceof 演算子 7.5～7.9パッケージ 2003/11/28 紺野憲一

ソースコードの特徴量を用いた機械学習によるメソッド抽出リファクタリング推薦手法

Java8について 2014/03/07.

コードクローンの動作を比較するためのコードクローン周辺コードの解析

ソースコード縮退によるソースコード理解神谷年洋科学技術振興事業団さきがけ研究21 オブジェクト指向シンポジウム2003.

コードクローン検出に基づくデザインパターン適用支援手法の提案と実現

プログラムで多用される動詞と目的語の関係を利用したメソッド名提案ツール

不確実データベースからの負の相関ルールの抽出

コード片に共通した特性を自動抽出するソースコード閲覧ツールの試作

○ 後藤祥1，吉田則裕2 ，井岡正和1 ，井上克郎1 1大阪大学 2奈良先端科学技術大学院大学

オブジェクト･プログラミング第8回.

コードクローンの理解支援を目的としたコードクローン周辺コードの解析

コードクローン分類の詳細化に基づく集約パターンの提案と評価

既存ソフトウェア中の頻出コード片を用いたコード補完手法の提案

コーディングパターンのあいまい検索の提案と実装

アルゴリズムとプログラミング (Algorithms and Programming)

オブジェクト指向プログラミング第九回知能情報学部新田直也.

オブジェクト指向プログラミング第八回知能情報学部新田直也.

メソッドに用いられる動詞-目的語関係を収録した辞書構築手法の提案

プログラミング言語論第十一回理工学部情報システム工学科新田直也.

C#プログラミング実習第3回.

プログラムスライスを用いた凝集度メトリクスに基づく類似メソッド集約候補の順位付け手法

設計情報の再利用を目的とした UML図の自動推薦ツール

アルゴリズムとデータ構造 2012年6月11日

「マイグレーションを支援する分散集合オブジェクト」

オープンソースソフトウェアに対するコーディングパターン分析の適用

メソッドの同時更新履歴を用いたクラスの機能別分類法

アルゴリズムとデータ構造1 2009年6月15日

状況に応じて適切な例外処理が行なえるアスペクト指向分散環境実験の支援ツール

統合開発環境のためのプログラミング言語拡張フレームワーク

ソフトウェア理解支援を目的とした辞書の作成法

JAVA入門⑥ クラスとインスタンス.

プログラムの一時停止時に将来の実行情報を提供するデバッガ

オブジェクト指向言語論第九回知能情報学部新田直也.

アルゴリズムとデータ構造 2010年6月17日

コードクローン解析に基づくデザインパターン適用候補の検出手法

Javaとは Javaとはオブジェクト指向言語でJava VM(Java仮想マシン)と呼ばれるプログラム上で動作します。

オブジェクト指向言語論第六回知能情報学部新田直也.

オブジェクト指向言語におけるセキュリティ解析アルゴリズムの提案と実現

識別子の読解を目的とした名詞辞書の作成方法の一試案

プログラム理解のための付加注釈 DocumentTag の提案

オブジェクト指向言語論第九回知能情報学部新田直也.

プログラム依存グラフを用いたソースコードのパターン違反検出法

Presentation transcript:

メソッド名とその周辺の識別子の相関ルールに基づくメソッド名変更支援手法井上研究室　柏原由紀

値を書き込むためのオブジェクトを取得する背景メソッド名が不適切だとソースコードの理解に時間がかかるメソッド名から動作を推測できるようなメソッド名にするべき処理内容を表す他の開発者に通じる値を設定している・・・・・・実は値を書き込むためのオブジェクトを取得する

メソッドの命名適切なメソッド名をつけることは難しいメソッド名の構造動詞，目的語を選択して組み合わせる必要がある複数の単語を組み合わせて動作を表現する動詞+目的語(open+BinaryStream)での命名が多い動詞，目的語を選択して組み合わせる必要がある処理内容と対象を正確に表現するドメイン知識やプログラミング経験が必要適切なメソッド名をつけることは難しい

研究概要開発者のメソッド名変更を支援するメソッドの内容を推測できる候補を提示するメソッド名の候補を提示メソッドを特徴づける識別子を利用過去に開発されたソースコード中のメソッドから事例を学習返り値がbooleanのときメソッド名の動詞はhasが多いフィールドnameSetにアクセスしているメソッドの目的語はNameが多い命名相関ルール

提案手法 1：命名相関ルールの作成 2：メソッド名変更候補の生成変更したいメソッドの指定記述中のソースコードソースコード集合開発者メソッド名候補の提示メソッド名変更候補

1：命名相関ルールの作成ソースコード集合から命名相関ルールを作成する 1-1：名前と周辺識別子の取得 1-2：命名相関ルールのマイニングメソッドごとの名前と周辺識別子の集合命名相関ルール

1-1：メソッド名と周辺識別子メソッド名の構成要素周辺識別子メソッド本体の内容を表す識別子メソッドが定義されている場所動詞目的語返り値の型引数の型と名前呼び出しているメソッド名アクセスしているフィールド名クラス名,親クラス名インターフェース名メソッド本体の内容を表す識別子 public class NameList implements Serializable { LinkedList<String> namelist; int size; public String findName(String n){ if (namelist.contains(n)) { return n; } return null; public void setName(Integer size) { this.size = size; メソッド名の動詞：find メソッド名の目的語：Name 返り値の型：String 　… メソッドが定義されている場所

1-2：命名相関ルールのマイニングメソッド名の構成要素と周辺識別子の集合相関ルールマイニング[1] 命名相関ルール 1 動詞:open 目的語：OutputStream 返り値の型:OutputStream 呼び出しメソッド名：free ... 2 動詞:new … 3 目的語：File 返り値の型：OutputStream フィールド名：name 4 動詞:find 目的語Name 返り値の型：String 相関ルールマイニング[1] 命名相関ルール条件部　　帰結部 1:{返り値の型:OutputStream} → {動詞:open} 2:{返り値の型:OutputStream,呼び出しメソッド名:free} → {目的語：OutputStream} [1] Agrawal, Rakesh and Imielinski, Tomasz and Swami, Arun “Mining association rules between sets of items in large databases“

2:メソッド名変更候補の生成周辺識別子命名相関ルール現在のメソッド名 2-1：命名相関ルールの検索記述中のソースコード 2-2：メソッド名候補の生成 openOutputStream setBinaryStream setField 1:{返り値の型:OutputStream} → {動詞:open} 2:{返り値の型:OutputStream,呼び出しメソッド名:free} → {目的語:OutputStream} メソッド名の候補

2-1：命名相関ルールの検索周辺識別子を検索キーとする変更対象のメソッドの周辺識別子を取得周辺識別子が条件部を満たす命名相関ルールを取得収集した周辺識別子返り値の型：OutputStream フィールド名：outStream 呼び出しメソッド名：free 返り値の型：OutputStream フィールド名：outStream 呼び出しメソッド名：free 周辺識別子で検索する命名相関ルール　　条件部　　帰結部 1:{返り値の型:OutputStream} → {動詞:open} 2:{返り値の型:OutputStream,呼び出しメソッド名:free} → {目的語:OutputStream} 3:{返り値の型:void,呼び出しメソッド名:free} → {動詞:find} 4:{フィールド名:outStream,返り値の型:OutPutStream} → {動詞:close} ・・・　　条件部　　帰結部 1:{返り値の型:OutputStream} → {動詞:open} 2:{返り値の型:OutputStream,呼び出しメソッド名:free} → {目的語:OutputStream} 3:{返り値の型:void,呼び出しメソッド名:free} → {動詞:find} 4:{フィールド名:outStream,返り値の型:OutPutStream} → {動詞:close} ・・・

2-2：メソッド名候補の生成命名相関ルールと元のメソッド名を利用動詞と目的語を組み合わせて生成優先度が高い順に提示元のメソッド名の動詞，目的語同士は組み合わせない優先度が高い順に提示命名相関ルールや候補の性質から計算動詞目的語メソッド名候補 open close OutputStream openOutputStream openBinaryStream setOutputStream closeBinaryStream ・・・命名相関ルール　　　　　　　　から得た元のメソッド名　　　　　から得た set BinaryStream 生成と並び替え

手法を実現したツール開発環境：統合開発環境Ｅｃｌｉｐｓｅのプラグイン対象言語：Java 開発者が指定したメソッドに対してメソッド名の変更候補を提示する

③ビューにメソッド名の候補リストが表示される手法を実現したツール ②ツールを起動する ①メソッド内にカーソルを置く ③ビューにメソッド名の候補リストが表示される

評価実験目的適切なメソッド名が生成できるか適切なメソッド名が上位に提示できるか適切なメソッド名オープンソースソフトウェアに記述されたメソッド動詞と目的語の組で命名されたメソッド @Override修飾子がついていないメソッド評価に用いたオープンソースソフトウェア ArgoUMLとjEdit 命名相関ルール生成に用いていない

評価実験：方法元のメソッド名を変更するメソッド名の候補リストを生成する元のメソッド名の構成要素がリストのどの位置に出現するか調べる動詞，目的語を変更動詞のみ変更目的語のみ変更メソッド名の候補リストを生成する元のメソッド名の構成要素がリストのどの位置に出現するか調べる元のメソッド名そのもの元のメソッド名の動詞元のメソッド名の目的語動詞，目的語を変更

評価実験：結果（ArgoUML）動詞は87.9%が生成できている目的語は18.9%が生成できている正解が出現するメソッドの数動詞は87.9%が生成できている全体の46.8%が100位以内目的語は18.9%が生成できている全体の4.9%が100位以内メソッド名は16.7%が生成できている全体の0.9%が100位以内 6000 対象メソッド数5542 5000 4000 3000 2000 1000 1 10 100 1000 10000 100000 正解が出現する順位

まとめと今後の課題まとめ今後の課題メソッド本体に対して関係がある可能性が高いメソッド名を提示する手法を提案し，ツールを実装した動詞は多くのメソッドで比較的高い順に生成できた目的語は提示できている数は少ないメソッド名は提示できても順位が低い今後の課題被験者実験による評価をおこなう並び替えの方法を見直す目的語を提示するためにルールの生成方法を見直す

評価実験：結果（jEdit）正解が出現する順位対象メソッド数2162 正解が出現するメソッド

評価実験：動詞変更(ArgoUML) 正解が出現する順位対象メソッド：6204 正解が出現するメソッド

評価実験：目的語変更(ArgoUML) 正解が出現する順位対象メソッド：6204 正解が出現するメソッド

命名相関ルールメソッドの周辺識別子が出現したときのメソッド名の構成要素の出現しやすさの関係 {返り値:String，フィールド名:nameset}→{目的語:Name} 返り値がStringでnamesetという名前のフィールドにアクセスしているメソッドの目的語はNameであることが多い {呼び出しメソッド名:hasNext}→{動詞:find，目的語Field} メソッド本体でhasNext()というメソッドを呼び出しているメソッド名の動詞にfindが，目的語にFieldがつかわれていることが多い

相関ルールマイニング入力データ内で同時に出現しやすい要素の関係を見つける手法支持度：条件部と帰結部の要素が同時に出現する数バスケット分析支持度：条件部と帰結部の要素が同時に出現する数確信度：条件部が出現するとき，帰結部が出現する割合相関ルールマイニング　支持度　確信度 {オムツ} →{ビール} 2 1 {牛乳} →{パン} 1 1 {オムツ,パン}→{ビール} 1 1 {パン,ビール}→{オムツ} 1 1 ・・・ A パン牛乳 B オムツビール C D E ・オムツを買う人は同時にビールを買うことが多い・オムツとパンを買う人は同時にビールを買うことが多い

評価実験：結果（ArgoUML）動詞は87.9%が生成できている目的語は18.9%が生成できている正解が出現するメソッドの数動詞は87.9%が生成できている 5542個中4871個このうち53.3%が100位以内に生成できている 4871個中2595個目的語は18.9%が生成できている 5542個中1048個メソッド名は16.7%が生成できている 5542個中928個 6000 5000 4000 3000 2000 1000 1 10 1000 100000 正解が出現する順位 100 10000

並び替えの基準命名相関ルールの支持度，確信度周辺識別子の数に対する条件部の一致率動詞と目的語を同一ルールから得たか動詞が呼び出しメソッド名の動詞に使われているかどうか目的語がメソッド本体に出現する識別子の命名に使われているかどうか動詞と目的語の組で生成されているかどうか