動詞に着目した相関ルールを利用するメソッド名の命名支援手法の評価

Slides:

Advertisements

Similar presentations

API 呼び出し列の差分を利用した Android アプリケーション比較ツールの試作井上研究室神田哲也.

Advertisements

Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 1 ソフトウェア部品推薦のための.

シーケンス図の生成のための実行履歴圧縮手法

プログラミング基礎I(再) 山元進.

Ex7. Search for Vacuum Problem

プログラミング基礎I(再) 山元進.

Ex8. Search for Vacuum Problem(2)

メソッド周辺の識別子とメソッド本体のAPI利用実績に基づいたAPI集合推薦手法

JavaによるCAI学習ソフトウェアの開発

Javaのための暗黙的に型定義される構造体

Myoungkyu Song and Eli Tilevich 発表者：石尾隆（大阪大学）

情報伝播によるオブジェクト指向プログラム理解支援の提案

アクセス修飾子過剰性の変遷に着目したJavaプログラム部品の分析

第２回：Javaの変数と型の宣言プログラミングII 2007年10月2日.

Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.

リファクタリングのための変更波及解析を利用したテスト支援ツールの提案

メソッド名とその周辺の識別子の相関ルールに基づくメソッド名変更支援手法

アルゴリズムとデータ構造 2011年6月20日

第６回独習Ｊａｖａゼミ第６章　セクション４～６発表者直江　宗紀.

ソースコードに対する適用可能な修正手順を可視化するリファクタリング支援手法の提案

相関ルールマイニングを用いたメソッドの命名方法の分析

細かい粒度でコードの再利用を可能とするメソッド内メソッドのJava言語への導入

ソースコード中に出現する動詞-目的語関係を利用したメソッド名の命名支援手法

コードクローンに含まれるメソッド呼び出しの変更度合の分析

コードクローンに含まれるメソッド呼び出しの変更度合の調査

識別子の命名支援を目的とした動詞-目的語関係の辞書構築

細かい粒度でコードの再利用を可能とするメソッド内メソッドとその効率の良い実装方法の提案

独習ＪＡＶＡ 6.8 コンストラクタの修飾子 6.9 メソッドの修飾子 6.10 ObjectクラスとClassクラス 11月28日（金）

オブジェクト指向プログラミング第十一回知能情報学部新田直也.

暗黙的に型付けされる構造体の Java言語への導入

コードクローンの分類に基づいたメソッド引き上げ手順の提案とその有効性評価

動的依存グラフの3-gramを用いた実行トレースの比較手法

ポインタ解析におけるライブラリのスタブコードへの置換の効果

クローンセットに対する主要編集者の分析法の提案と調査

Javaプログラムの変更を支援する影響波及解析システム

プログラム動作理解支援を目的としたオブジェクトの振舞いの同値分割手法

ソースコードの特徴量を用いた機械学習によるメソッド抽出リファクタリング推薦手法

コードクローンの動作を比較するためのコードクローン周辺コードの解析

コードクローン検出に基づくデザインパターン適用支援手法の提案と実現

プログラムで多用される動詞と目的語の関係を利用したメソッド名提案ツール

Ex7. Search for Vacuum Problem

コード片に共通した特性を自動抽出するソースコード閲覧ツールの試作

○ 後藤祥1，吉田則裕2 ，井岡正和1 ，井上克郎1 1大阪大学 2奈良先端科学技術大学院大学

コードクローンの理解支援を目的としたコードクローン周辺コードの解析

コードクローン分類の詳細化に基づく集約パターンの提案と評価

コーディングパターンのあいまい検索の提案と実装

アルゴリズムとプログラミング (Algorithms and Programming)

プログラミング言語論第十三回理工学部情報システム工学科新田直也.

メソッドに用いられる動詞-目的語関係を収録した辞書構築手法の提案

プログラムスライスを用いた凝集度メトリクスに基づく類似メソッド集約候補の順位付け手法

設計情報の再利用を目的とした UML図の自動推薦ツール

保守請負時を対象とした労力見積のためのメトリクスの提案

「マイグレーションを支援する分散集合オブジェクト」

サブゼミ第7回実装編① オブジェクト型とキャスト.

オープンソースソフトウェアに対するコーディングパターン分析の適用

アルゴリズムとデータ構造1 2009年6月15日

欠陥検出を目的とした類似コード検索法吉田則裕，石尾隆，松下誠，井上克郎大阪大学大学院情報科学研究科

ソフトウェア理解支援を目的とした辞書の作成法

JAVA入門⑥ クラスとインスタンス.

プログラムの一時停止時に将来の実行情報を提供するデバッガ

アルゴリズムとデータ構造 2012年6月21日

アルゴリズムとデータ構造 2010年6月17日

コードクローン解析に基づくデザインパターン適用候補の検出手法

Javaとは Javaとはオブジェクト指向言語でJava VM(Java仮想マシン)と呼ばれるプログラム上で動作します。

オブジェクト指向言語におけるセキュリティ解析アルゴリズムの提案と実現

識別子の読解を目的とした名詞辞書の作成方法の一試案

プログラム理解のための付加注釈 DocumentTag の提案

プログラム依存グラフを用いたソースコードのパターン違反検出法

オブジェクト生成の観測に基づくプログラム実行の要約の抽出

Presentation transcript:

動詞に着目した相関ルールを利用するメソッド名の命名支援手法の評価 ○柏原由紀1，石尾隆1，井上克郎1 1 大阪大学大学院情報科学研究科　コンピュータサイエンス専攻　動詞に着目した相関ルールを利用するメソッド名の命名支援手法の評価について，大阪大学の柏原が発表いたします．

値を書き込むためのオブジェクトを取得する背景メソッド名が不適切だとプログラム理解に時間がかかる[1] 開発者は識別子の名前から動作を推測している不適切な名前がついていると動作を誤解する setだから値を設定している？・・・まず，この研究の背景について説明します． javaプログラムにおいて，メソッド名が不適切だと，プログラム理解に時間がかかることが知られています．開発者は識別子の名前からその動作を推測しているため，不適切な名前がついているとその動作を誤解してしまいます．例えばこちらのコード片において，setBinaryStreamというメソッドを読んだとき，setは値を設定するメソッドによく使われる語なので，開発者は何かの値を設定するメソッドであるとその動作を予測します．しかし，実際の動作は値を書き込むためのオブジェクトを取得するメソッドであるため，その動作を誤解してしまいます．実は値を書き込むためのオブジェクトを取得する [1]Lawrie et.al. “What‘s in a name? a study of identfiers.”

メソッド名メソッド名は動詞＋目的語の組で命名される一部の動詞は具体的な使い方が知られている他の動詞については使い方が知られていないさまざまなプログラミングのガイドライン [2][3] 例：isEmpty, hasElement 一部の動詞は具体的な使い方が知られている返り値がboolean なら is, hasなど Høstら[4]が40個の動詞の使い方を調査した “find”の動詞は「ローカル変数を使っている，かつ，ループを含んでいる」メソッドによく使われる　他の動詞については使い方が知られていない多くの単語から適切な動詞を選ぶ必要があり，難しい一般に，メソッドはその動作と対象を動詞と目的語の組で表して命名されると，さまざまなプログラミングのガイドラインで言われています．一部の動詞については，使い方がよく知られています．フィールドアクセスにget，setが使われることや，返り値がbooleanのとき，isやhasの動詞が使われるというものです．また，Hostらは上記の動詞を含めて40個の動詞について使い方を調査し，ルールとしてまとめています．しかし，これ以外の動詞について，一般にどのような語をどのようなメソッドに対して使うべきなのかということは具体的に知られていません．その中で開発者は命名のために多くの単語から適切な語を選ぶ必要があり，命名が難しいです． [2] Java Code Conventions，[3]Code Complete [4] Høst et.al. “The Programmer's Lexicon, Volume I: The Verbs”

我々の先行研究開発者にメソッド名に用いる動詞の候補を提示する手法を提案開発者が用いたときの影響を評価していない既存のソフトウェアからメソッド本体とメソッド名の関係を表すルールを抽出するメソッド本体に出現する識別子の名前・型を利用相関ルールマイニングを利用抽出したルールを用いて対象のメソッドに対して動詞の候補を提示する私たちは先行研究において，メソッド名に用いる動詞に着目し，開発者にメソッド名に用いる動詞の候補を提示する手法を提案しました．既存のソフトウェアからメソッド本体とメソッド名の動詞の関係を表すルールを自動で抽出し，抽出したルールを用いて，メソッドに対して適切だと考えられる可能性が高い順に動詞の候補リストを提示します．メソッド本体に出現する識別子の名前・型を，メソッド本体を表す要素として扱い，相関ルールマイニングを利用してルールを抽出します．しかし，この手法では開発者に対する効果については評価していません．開発者が用いたときの影響を評価していない

研究概要開発者にメソッド名に用いる動詞の候補を提示する手法の改良した開発者が実際に提案手法によって適切な動詞の候補を選択できるようになるのか評価した被験者実験により評価そこで本研究では，メソッド名に用いる動詞の候補リストを提示する手法の改良を行った上で，改良した手法を用いて，実際に提案手法によって適切な動詞の候補を選択できるようになるのかを評価しました．

手法：概要 ①ルール抽出部 ②動詞推薦部ルールバイトコード対象のメソッド動詞の候補リスト X → Y 要素 → 動詞 ①ルール抽出部　 X → Y 要素 → 動詞ルールバイトコード手法は，ルールを抽出するステップ1と，動詞の候補リストを提示するステップ2の2ステップから成ります．ステップ1について改良を行いました．各ステップについて順に説明します．対象のメソッド動詞の候補リスト ②動詞推薦部

手法：概要 ①ルール抽出部 ②動詞推薦部ルールバイトコード対象のメソッド動詞の候補リスト X → Y 要素 → 動詞 ①ルール抽出部　 X → Y 要素 → 動詞ルールバイトコードまず，ステップ1について，変更点を比較しながら順に説明します．対象のメソッド動詞の候補リスト ②動詞推薦部

{返り値の型 : String[], 引数の型: String} 抽出するルールメソッド本体の内容を表す要素と，メソッド名の動詞の関係を表す相関ルール条件部帰結部 {メソッド本体の内容を表す要素} メソッド名の動詞 {返り値の型 : String[], 引数の型: String} split {呼び出しメソッド名の動詞: add} add 確信度：条件部が出現するときにメソッド名に帰結部の動詞が使われる条件付き確率支持度：ルールを満たすメソッドの数リフト値：このルールのConfidece値が，単純な帰結部の出現率の何倍であるかステップ1で抽出するルールは，メソッド本体の内容を表す要素と，メソッド名の動詞の関係を表す相関ルールです．ルールの左辺は条件部，右辺は帰結部といいます．メソッド内にある要素が出現するとき，ある動詞が使われやすいということを表します．具体的なルールとして，返り値の型がStringの配列のとき，splitの動詞が使われやすいといったルールや，呼び出しメソッド名の動詞がaddのとき，そのメソッド名の動詞にもaddが使われやすいといったルールです．また，各ルールには，3つの評価値がついており，確信度は，学習セット内における，条件部が出現するときに帰結部が出現する条件付き確率のことで，支持度は学習セットの中でルールを満たすメソッドの数を表します， Lift値は，このルールの確信度が，単純な帰結部の出現率の何倍であるかを表しており，帰結部の動詞が学習セット内で非常によく使われているときにLift値が低くなります．

メソッド本体の内容を表す要素既存手法メソッドに出現する単語・型返り値の型引数の型呼び出しメソッド名引数の名前 public class NameList implements Serializable{ LinkedList<String> nameList; int size; public String findName(int index){ if(index < 100 ){ if ( 0 <= index ){ return nameList.get(index); } printError(); return null; private void printError() { System.err.println("Error."); メソッドに出現する単語・型返り値の型引数の型呼び出しメソッド名引数の名前 (アクセスしている)フィールド名既存手法では，メソッド本体の内容を表す要素は，返り値の型，引数の型，呼び出しメソッド名，引数の名前，フィールド名の5種類を用いています．例えば左のコード片のfindNameメソッドからメソッド本体の内容を表す要素を取得するとき，これらの要素がメソッド本体を表す要素として取得されます．これらの要素集合は，一つのメソッドから一意に取得でき，各メソッドから要素集合を抽出し，相関ルールマイニングによりルールを抽出します．返り値の型：　String 引数の名前： index　呼び出しメソッド名　printError ・・・

メソッド本体の内容を表す要素提案手法メソッドに出現する単語・型返り値の型引数の型呼び出しメソッド名の動詞 public class NameList implements Serializable{ LinkedList<String> nameList; int size; public String findName(int index){ if(index < 100 ){ if ( 0 <= index ){ return nameList.get(index); } printError(); return null; private void printError() { System.err.println("Error."); メソッドに出現する単語・型返り値の型引数の型 (アクセスしている)フィールドの型呼び出しメソッド名の動詞その他の語アクセスしているフィールド名に使われる語引数の名前に使われる語呼び出しメソッド名の動詞以外の語提案手法では，メソッド本体の内容を表す要素として，返り値の型，引数の型，フィールドの型，呼び出しメソッド名の動詞，その他の語の5種類に分類した型や単語を用いるように改良を加えています．既存手法で用いる要素にフィールドの型を追加し，呼び出しメソッド名，フィールド名，引数の名前を，単語に分解して，呼び出しメソッド名の動詞とその他の語として扱うようにします．たとえば左のコード片のfindNameメソッドからメソッド本体の内容を表す要素を取得するとき，これらの要素がメソッド本体を表す要素として取得されます．返り値の型：　String その他の語：　error その他の語：　list 呼び出しメソッド名の動詞:　print ・・・

ルール抽出の際の条件既存手法動詞から始まるメソッドのみ学習に用いる以下の条件を満たすルールのみを抽出する get , set, testの動詞から始まるメソッドは除外 toString, equals, hashCodeメソッドは除外以下の条件を満たすルールのみを抽出する支持度が100以上のルール条件部の要素数が4個以下のルールまた，既存手法ではルール抽出においていくつかの制限を加えています．まず，学習に用いるメソッドとして，動詞から始まっているメソッドのみを用いています．ただし，get，set，testから始まるメソッドは使い方が既に知られているため， toString，equals，hashCodeメソッドは，javaの基底クラスであるObjectクラスに定義されており，オーバーライドしていることが多いため，学習セットから除外しています．さらに，有効なルールを抽出するために，100個以上のメソッドで使われているものを，また，オーバーフィッティングを避けるために条件部の要素数が4つ以下のものをルールとして抽出しています．

ルール抽出の際の条件提案手法動詞から始まるメソッドのみ学習に用いる以下の条件を満たすルールのみを抽出する get , set, testの動詞から始まるメソッドは除外 toString, equals, hashCodeメソッドは除外以下の条件を満たすルールのみを抽出する支持度が100以上のルール条件部の要素数が4個以下のルールリフト値が1以上のルール条件部が返り値の型：voidのみでないルール提案手法ではさらに2つの条件を加えました．より意味のあるルールを抽出するためにLift値が1以上のルールを抽出し，また，返り値の型がvoidであることのみが条件部に出現するようなルールを排除するようにしました．

手法：概要 ①ルール抽出部 ②動詞推薦部ルールバイトコード対象のメソッド動詞の候補リスト X → Y 要素 → 動詞 ①ルール抽出部　 X → Y 要素 → 動詞ルールバイトコードこのようにして抽出したルールを用いて，ステップ2でメソッド名の動詞の候補リストを提示します．ステップ2については，既存手法と同様です．例を用いて説明します．対象のメソッド動詞の候補リスト ②動詞推薦部

共通：動詞の候補推薦 public boolean (int i) { return getField(); } 確信度 {返り値の型: boolean} is {引数の型: String, 返り値の型 : String[]} split {返り値の型: boolean, 呼び出しメソッド名の動詞: get} {呼び出しメソッド名の動詞: get} {返り値の型: boolean} is {引数の型: String, 返り値の型 : String[]} split {返り値の型: boolean, 呼び出しメソッド名の動詞: get} {呼び出しメソッド名の動詞: get} 0.4 0.5 0.6 1 2 0.2 ・・・・ public boolean (int i) { return getField(); } public boolean (int i) { return getField(); } 1 . is 2. split … スライド上部のルールを用いて，左下のメソッドに対して動詞の候補を提示します．まず，ルールのうち，条件をすべて満たすルールを選択します．このとき，帰結部に同じ動詞を持つルールがある場合，確信度が高いもののみを選択します．選択したルールを確信度が高い順に順位をつけます．そして，この順位と同じ順番に帰結部の動詞を候補リストとして提示します．開発者は提示されたリストを参考に，対象のメソッドの命名を行います．

評価実験 RQ1 RQ2 提案手法が，既存手法よりも適切な動詞を提示できるか提示される候補リストは，開発者の適切な動詞選択を支援するかこの手法に対して，2つの観点から評価を行いました．提案手法が，既存手法よりも適切な動詞を提示できるか，提示される動詞の候補リストは，開発者の適切な動詞選択を支援するかという2点について評価しました．

RQ1. 既存手法より適切な動詞を提示できるか - 評価方法あるソフトウェア内の各メソッドの適切な動詞(既につけられている動詞)が候補リストの上位何番目に提示できているか上位に提示できているほどよい抽出したルール : 提案手法：2,947,148，　既存手法：304,770 112のOSS1(1,162,132個のメソッド)から学習評価対象学習に用いた112のOSS: 1,162,132個のメソッド学習に用いていない4つのOSS: 13,563 個のメソッド Saxon-HE, Order Portal, NeoDatis， BlueJ public boolean isB(int i) { return getB(); } 1 . is 2. split … 手法が適切な動詞を提示できるかについては，それぞれの手法を，あるソフトウェア内のメソッドに適用し，既につけられている動詞が候補リストの上位何位に提示できているかを数えました．既につけられている動詞をそのメソッドの適切な動詞とみなしており，上位に正解を提示できているメソッドの数が多いほど適切な動詞を提示できている手法であると考えました．こちらのメソッドの例だと既につけられている動詞が1位に提示できているので，非常によいとみなします．評価のために112のOSSプロジェクトから既存手法，提案手法それぞれを用いてルールの抽出を行いました．既存手法では3万個，提案手法では300万個のルールを抽出しました．また，評価対象として，ルールの抽出に用いた112個のOSS，ルールの抽出に用いていない4つのOSSそれぞれに手法を適用して比較を行いました． 1. Qualitas Corpus http://qualitascorpus.com/

RQ1. 既存手法より適切な動詞を提示できるか - 結果既存手法：39%のメソッドに対し上位5位以内に提案手法：48%のメソッドに対し上位5位以内に提示できた正解の動詞が提示されたメソッドの割合提案手法：学習に用いていないソフトウェア提案手法：学習セット既存手法：学習に用いていないソフトウェア評価した結果を累積度数分布で表示した図です．横軸は正解の動詞が提示されている順位，縦軸は正解の動詞が提示されたメソッドの割合を表しています．例えば，この図のピンク色の線からは，提案手法を学習に用いていないソフトウェアに適用したとき，80%のメソッドに対して上位100位以内に適切な動詞を提示できていることを読み取ることができます．結果として，学習に用いたソフトウェアに対しても，学習に用いていないソフトウェアに対しても，提案手法を用いた場合の方が，既存手法と比べて，より上位に適切な動詞を提示できていることがわかりました．既存手法：学習セット正解の動詞が提示されている順位

RQ2. 開発者の適切な動詞選択を支援するか – 評価方法既存のソースコードに定義されているメソッドからメソッド名などを削除削除したメソッド名を被験者が推測し解答評価基準提案手法によって提示される候補リストの有無で正解数に変化があるか比較候補リストは上位5位を提示開発者が適切な動詞を選択できるのかどうかについては，被験者実験を行うことで評価を行いました．既存のソースコードに定義されているメソッドからメソッド名を削除した課題を作成し，被験者に削除したメソッド名を推測する課題を解いてもらいました．提案手法によって提示される候補リストがある場合とない場合で正解数の差を分析しました．候補リストは上位5つを提示します．

RQ2. 開発者の適切な動詞選択を支援するか - 課題となるメソッドの選択課題となるメソッドを12個選択 4つのオープンソースソフトウェアから選択 RQ1と同じソフトウェア群行数5行から15行のメソッドを選択動詞一語で命名されているメソッドを選択提案手法で正解が提示される順位を均等に 1位，3位，5位に正解があるもの，　候補リスト内に正解がないもの：3つずつ課題となるメソッド12個を4つのOSSから選択しました．開発者の負担を考慮して5行から　15行のメソッドを，目的語による影響を考慮して動詞一語で命名されているメソッドを課題として選択しました．手法によって正解が提示される順位が均等になるようにメソッドを選択しました．

RQ2. 開発者の適切な動詞選択を支援するか -課題作成方法 public class AesMd5Cypher implements IO { public void write (byte b) throws IOException { try { byte[] bytes = {b}; write(bytes, 0, 1); } catch (IOException e) { DLogger.error(e.getMessage() + " - " + OdbThread.getCurrentThreadName()); throw e; } public class AesMd5Cypher implements IO { private String fileName; /** This method is ... */ public void write (byte b) throws IOException { try { byte[] bytes = {b}; write(bytes, 0, 1); } catch (IOException e) { // throw exeption DLogger.error(e.getMessage() + " - " + OdbThread.getCurrentThreadName()); throw e; } /** this method is … */ public long read(byte[] bytes,int offfset, int size) throws IOException { int totalread = 0; 　　 … 完成対象メソッド内でアクセスされていないフィールドの定義を削除メソッド内外のコメントを削除対象のメソッド名を削除 (候補を提示する場合) write append add load create 対象以外のメソッドを削除課題の作成方法について説明します．まず，対象のメソッドが記述されているjavaファイルを取得します．ここから対象以外のメソッドを削除します．対象メソッド内でアクセスしていないフィールド，メソッド内外に記述されているコメントを削除します．最後に，対象のメソッドの名前を削除します．被験者はこの状態のメソッドを読んでメソッドの動作を推測します．候補リストがある場合は，このように上位5位の動詞が提示されます．課題を解いてもらう際，候補が提示された場合でも，リスト外から動詞を選ぶことができるとしています．

RQ2. 開発者の適切な動詞選択を支援するか - 被験者と課題の割り当て情報科学を学んでいる学生12人課題の割り当て各課題を8人ずつに割り当てた候補リストありで4人，なしで4人各被験者に8問ずつ割り当てた各被験者に候補リストありで4問，なしで4問 6人はリストありを先に，残り6人はリストなしを先に解答被験者ごとに異なる順序被験者は私の所属研究室の学生12人です．課題の割り当て方については，各課題を8人ずつに解いてもらうように割り当てました．候補リストがある状態で4人に，ない状態で4人に割り当てました．また，被験者一人につき，8つの課題を解いてもらうよう割り当てました．被験者は8つの課題のうち，候補リストがある状態で4つ，ない状態で4つの課題を解くように割り当てました． 6人の被験者は候補リストありの課題4問を先に，残りの6人は候補リストなしの課題4問を先に解答してもらいました．また，同じ順序で課題を解く被験者がいないように割り当てました．

RQ2. 開発者が適切な動詞を選択できるか - 実際の実験アンケートこちらが，実際に用いた実験課題の一部です． 1ﾍﾟｰｼﾞにつき1つの課題を提示しており，課題のメソッドがあり，候補リストがある場合は，メソッドの下部に候補リストが提示されています．さらにその下部に，適切だと思う動詞と，その動詞を選んだ理由を記述する欄があります．このような課題が8つ，8ﾍﾟｰｼﾞ続き，最後のページには開発経験等を問うアンケートがあります．

RQ2. 開発者の適切な動詞選択を支援するか - 実験手順実験の内訳 5分間の説明，課題の解答，アンケートの記入被験者のみがいる部屋で実施先に候補リストありで解く人と，先に候補リストなしで行う人で別々に実施制限制限時間は設けなかった解答にかかった時間を測るため，カメラを設置後戻りしての解答は許可しなかった実験では，5分間の説明ののちに，課題の解答を行ってもらい，最後にアンケートの記入をしてもらった．実験は被験者のみがいる部屋で実施し，先に候補リストがある課題から解く人と，さきに候補リストなしの課題から解く人で別々に実施しました．解答時間について制限時間は設けませんでしたが，極端に速い回答もしくは遅い解答がなかったかどうか確認するために，カメラを設置して時間を計測しました．ページをめくってから次のページに移動するまでの時間をその課題にかかった時間としました．また，一度解いた課題の解答を修正する等の後戻りは許可しませんでした．

RQ2. 開発者の適切な動詞選択を支援するか - 結果候補リストの有無による正解・不正解の解答数正解不正解合計候補リストあり 28 20 48 候補リストなし 25 23 53 43 96 カイ二乗検定(片側検定) 候補リストがあるときの方が正解数が有意に多いか p = 0.43 より　有意水準α =0.05で　有意差なし被験者に課題を解答してもらった正解率を表に示します．結果として，候補リストがある状態で解いてもらった48問のうち28問が正解，候補リストが無い状態で解いてもらった48問のうち25問が正解となりました．候補リストがある場合の方が，正解数が多い結果となったものの，カイ二乗検定を行ったところ，有意水準0.05で正解数の差は有意でないことがわかりました．

候補リスト内に正解が含まれている順位ごとに正解数が異なるか候補リストを提示したときに，正解が提示されている順位ごとの正解・不正解の正解数候補リストあり候補リストなし 1位に正解 11/12 10/12 3位に正解 8/12 4/12 5位に正解 7/12 候補リスト内に正解なし 2/12 さらに詳しく分析を行いました．候補リスト内に正解が含まれている順位ごとに正解数をみると，候補リスト内に正解が提示されているとき正解率が高いことがわかりました．候補リスト内に正解がない場合に特に正解数が低かった課題について解答の仕方を分析したところ，常に候補リストの中から選んで間違っているのではないことがわかりました．候補リスト内に正解が提示されているとき，候補リストがある方が正解数が多い常にリスト内から解答が選ばれているわけではない

候補リスト内に正解が含まれているときに正解数が多いか候補リスト内に正解が含まれている課題における，候補リストの有無による正解・不正解の解答数正解不正解合計候補リストあり 26 10 36 候補リストなし 18 44 28 72 フィッシャーの正確確率検定(片側検定) 候補リストがあるときの方が正解数が有意に多いか p = 0.045 より　有意水準α =0.05で　有意差あり候補リスト内に正解が含まれているとき，有意に正解数が多いかどうかをフィッシャーの正確確率検定を用いて検定を行ったところ，有意水準0.05で有意差があるということがわかりました．

考察候補リストがあるだけでは全体での有意差なし候補リスト内に正解がある場合，正解数が有意に高い候補リスト内に正解を含めていれば，開発者が適切な動詞を選択する手助けになる候補リストを提示する手法の精度を高める必要がある候補リストがある場合全体では正解数は有意に多くなく，候補リスト内に正解がある場合に正解数が有意に高いことから，候補リスト内に正解が含まれていれば開発者が適切な動詞を選択する助けになると考えられます．従って，候補リストを提示する手法の精度は，今のままでは不十分であり，精度を高める必要があると考えられます．

まとめと今後の課題まとめ今後の課題メソッド命名の支援のためのメソッド名に用いる動詞の候補リストを提示する手法を改良した既存手法よりも上位に正解を提示できていることを示した候補リスト内に正解が含まれているとき，正解率が高いことを示した今後の課題手法の改善標本数を増やして再評価まとめと今後の課題です．本研究では，メソッド命名の支援を行うために，メソッド名に用いる動詞の候補リストを提示する手法を提案しました．学習に用いていないソフトウェアに適用したとき，48%のメソッドに対して上位5位以内に正解を提示できたことを確認しました．また，被験者実験を行い，候補リスト内に正解が含まれているとき，正解率が有意に高いことをしめしました　．今後の課題として，候補の提示手法を改善することや，被験者実験における標本数を増やして再度実験を行うことが考えられます．以上です．

以下非表示スライド

候補リストありのときの方が正解が少なかった例：reset public abstract class Builder implements Receiver { protected String systemId; protected String baseURI; protected NodeInfo currentRoot; protected boolean lineNumbering = false; protected boolean started = false; protected boolean timing = false; protected boolean open = false; public void reset() { systemId = null; baseURI = null; currentRoot = null; lineNumbering = false; started = false; timing = false; open = false; } 候補リストあり end init initialize 候補リストなし reset start enter leave write end

候補リストありのときの方が正解が少なかった例：update public class ProductGroupController extends AbstractController { private static final String PATH_UPDATE = BASE_PATH + "/updateProductGroup.jsp"; private void update() { try { openConnection(); processUpdate(); commit(); refreshMenu(); forward(PATH_UPDATE); } catch (Exception e) { doCatch(e); } finally { finallyMethod(); } 候補リストあり commit update refresh 候補リストなし commit process refresh do execute

候補リストありのときの方が正解が多かった例：find public class JdiThreadSet extends HashSet<JdiThread> { public JdiThread find(ThreadReference thread)　{ for(Iterator<JdiThread> it=iterator(); it.hasNext(); ) { JdiThread currentThread = (JdiThread)it.next(); if(currentThread.getRemoteThread().equals(thread)) { return currentThread; } Debug.reportError("Encountered thread not in ThreadSet!"); return null; 候補リストあり find 候補リストなし update get report is translate parse find

候補リストありのときの方が正解が多かった例：print public abstract class CallableView extends MemberView { public void print(FormattedPrintWriter out, int indents){ Comment comment = getComment(); if(comment != null) comment.print(out, indents); out.setItalic(false); out.setBold(true); for(int i=0; i<indents; i++) out.indentLine(); out.println(getLongDesc()); } 候補リストあり print write 候補リストなし set display output write visit print