NTT ソフトウェアイノベーションセンタ丹野治門

Slides:

Advertisements

Similar presentations

プログラムの変更前後での実行履歴の差分検出手法

Advertisements

Heap Cloning: Enabling Dynamic Symbolic Execution of Java Programs

Observable modified Condition/Decision coverage

岩井儀雄コンピュータ基礎演習　ー探索、整列ー岩井　儀雄

【ICSE2012 勉強会】 Recovering Links between an API and Its Learning Resources 担当：岩崎　慎司（NTTデータ）

リファクタリングのための変更波及解析を利用したテスト支援ツールの提案

メソッド名とその周辺の識別子の相関ルールに基づくメソッド名変更支援手法

動的スライスを用いたバグ修正前後の実行系列の差分検出手法の提案

Semi-Supervised QA with Generative Domain-Adaptive Nets

プログラム実行履歴を用いたトランザクションファンクション抽出手法

コードクローンに含まれるメソッド呼び出しの変更度合の分析

コードクローンに含まれるメソッド呼び出しの変更度合の調査

識別子の命名支援を目的とした動詞-目的語関係の辞書構築

ソードコードの編集に基づいたコードクローンの分類とその分析システム

決定木とランダムフォレスト和田　俊和.

ネットワーク理論 Text. Part 3 pp 最短路問題 pp 最大流問題 pp.85-94

動的スライスを用いたバグ修正前後の実行系列の比較

コードクローンの分類に基づいたメソッド引き上げ手順の提案とその有効性評価

動的依存グラフの3-gramを用いた実行トレースの比較手法

オブジェクト指向プログラムにおけるエイリアス解析手法の提案と実現

動的スライスを用いたバグ修正前後の実行系列の差分検出手法

利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成

Online Decoding of Markov Models under Latency Constraints

クローンセットに対する主要編集者の分析法の提案と調査

重複コードと非重複コードにおける修正頻度の比較

TDDとメソッドの外部設計テストファーストの秘訣 2009/08 biac.

仮想メモリを用いた VMマイグレーションの高速化

限られた保存領域を使用する Javaプログラムの実行トレース記録手法の提案と評価

Javaプログラムの変更を支援する影響波及解析システム

訓練データとテストデータが異なる分布に従う場合の学習

社会シミュレーションのためのモデル作成環境

ソースコードの特徴量を用いた機械学習によるメソッド抽出リファクタリング推薦手法

コードクローンの動作を比較するためのコードクローン周辺コードの解析

コードクローン検出に基づくデザインパターン適用支援手法の提案と実現

Data Clustering: A Review

プログラム実行に対するフェイズ検出を用いたログ取得量の動的変更手法の提案

Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水洋志.

プログラム理解におけるThin sliceの統計的調査による有用性評価

バイトコードを単位とするJavaスライスシステムの試作

プログラミング 4 探索と計算量.

シナリオを用いたレビュー手法PBRの追証実験 - UMLで記述された設計仕様書を対象として -

○ 後藤祥1，吉田則裕2 ，井岡正和1 ，井上克郎1 1大阪大学 2奈良先端科学技術大学院大学

VMが利用可能なCPU数の変化に対応した並列アプリケーション実行の最適化

コードクローンの理解支援を目的としたコードクローン周辺コードの解析

コードクローン分類の詳細化に基づく集約パターンの提案と評価

既存ソフトウェア中の頻出コード片を用いたコード補完手法の提案

コーディングパターンのあいまい検索の提案と実装

インスタンスの型を考慮したJavaプログラムの実行経路の列挙手法の提案

ソフトウェアプロダクト集合に対する派生関係木の構築

オブジェクトの協調動作を用いたオブジェクト指向プログラム実行履歴分割手法

プログラムスライスを用いた凝集度メトリクスに基づく類似メソッド集約候補の順位付け手法

保守請負時を対象とした労力見積のためのメトリクスの提案

クローン検出ツールを用いたソフトウェアシステムの類似度調査

オープンソースソフトウェアに対するコーディングパターン分析の適用

メソッドの同時更新履歴を用いたクラスの機能別分類法

蓄積されたオブジェクトの動作履歴を用いた実行履歴削減手法の提案

ソフトウェア理解支援を目的とした辞書の作成法

エイリアス関係を考慮した Javaプログラム用静的スライシングツール

プログラムの一時停止時に将来の実行情報を提供するデバッガ

動的スライスを用いたバグ修正前後の実行系列の差分検出手法の提案

動的スライスを用いたバグ修正前後の実行系列の差分検出手法の提案

コードクローン解析に基づくデザインパターン適用候補の検出手法

回帰テストにおける実行系列の差分の効率的な検出手法

Javaとは Javaとはオブジェクト指向言語でJava VM(Java仮想マシン)と呼ばれるプログラム上で動作します。

メソッド抽出リファクタリングが行われるメソッドの特徴調査

プログラム依存グラフを用いたソースコードのパターン違反検出法

オブジェクト指向言語論第六回知能情報学部新田直也.

Detecting Software Modularity Violations

ICSE'11勉強会 Riding the Design Wave I セッション

Presentation transcript:

NTT ソフトウェアイノベーションセンタ丹野治門 make test-zesti： A Symbolic Execution Solution for Improving Regression Testing NTT ソフトウェアイノベーションセンタ　丹野治門

目的と貢献目的現状の問題点提案主な貢献点ソフトウェアにおけるより多くのバグを見つけたい開発者が作るテスト(○意味あるテスト，✕高コスト) 機械的に作るテスト(○低コスト, ✕無意味なものが多い) (例) パスカバレッジ向上を目指したSymbolic Execution 提案開発者が作った(回帰テスト向け)テストケースを種にして様々なバリエーションを生成主な貢献点 OSSでしっかり評価，未知のバグを発見 ICSE'12 勉強会 2012/8/30

着眼点 Sensitive Operationsの周辺を徹底的にテストするようにする具体例：配列へのアクセス回帰テスト用テストケース（開発者が作成） int v[100]; void f(int x){ if(x > 99){ x = 99; } v[x] = 0; この2つのテストケースでパスカバレッジ（分岐網羅）は100%だが・・・ TestCase01 x = 100 TestCase02 x = 50 x = -1のとき配列不正アクセスエラー Sensitive Operation周辺はバグが存在する可能性が高い！ ICSE'12 勉強会 2012/8/30

着眼点 Sensitive Operationsの周辺を徹底的にテストするようにする具体例：配列へのアクセス回帰テスト用テストケース（開発者が作成） int v[100]; void f(int x){ if(x > 99){ x = 99; } v[x] = 0; この2つのテストケースでパスカバレッジ（分岐網羅）は100%だが・・・ TestCase01 x = 100 TestCase02 x = 50 x = -1のとき配列不正アクセスエラー！提案手法 TestCase03 x = -1 ICSE'12 勉強会 2012/8/30

手法テスト実行と同時にSymbolic Executionを実施「Symbolic Execution結果＋追加条件」で新規テスト生成提案手法によるテストケース生成の一例 TestCase02 x = 50 int v[100]; void f(int x){ if(x > 99){ x = 99; } v[x] = 0; 入力変数：　x = x0 パス条件：　not(x0 > 99) テストケース生成 TestCase03 x = -1 Symbolic Execution 境界値条件　x0 > 0 && 　x0 <100 追加！ ICSE'12 勉強会 2012/8/30

評価評価に用いたOSS(３つ) 評価結果 GNU Coreutils，libdwarf，readelf 合計58件(うち，52件は未知)のバグを検出 OSSコミュニティに報告，バグ改修も進んでいる提案手法で発見したCoreutilsのバグ一覧 Min Depth バグに到達するまでの「条件分岐」の数通常のSymbolic Executionでは時間がかかりすぎて発見しにくいバグ ICSE'12 勉強会 2012/8/30 Paul Dan Marinescu and Cristian Cadar “make test-zesti： A Symbolic Execution Solution for Improving Regression Testing” ICSE2012.　Table1より引用

NTT ソフトウェアイノベーションセンタ張暁晶 BALLERINA: Automatic Generation and Clustering of Efficient Random Unit Tests for Multithreaded Code NTT ソフトウェアイノベーションセンタ　張暁晶

背景・目的・貢献背景目的貢献マルチスレッドを用いるソースコードの単体試験は、手間がかかるテスト対象が持つオブジェクトを、複数のスレッドで触るような試験であるこのような単体試験を「ランダム生成」する従来手法では・・・生成された単体試験の実行が遅い並行性バグをうまく見つけられないバグじゃないのにバグだという誤報（false alarm）が出る目的並行性バグをうまく見つけられるような単体試験をランダム生成する貢献並行性バグをうまく見つけられるような単体試験をランダム生成する手法を提案生成された単体試験でのfailureを、人手で点検する手間を軽減できる「クラスタリング手法」も提案評価：実際のバグ検出による効果確認 ICSE'12 勉強会 2012/8/30

→既存手法Randoop algorithm[1]を改造手法概要1 単体試験のランダム生成：２つのスレッドのみ用意するそれぞれが、ランダムに選ばれたテスト対象のメソッドを1つだけ実行する並行性バグにあたる確率を上げるために、上記のような「シンプルな」並行コードを、「より複雑な」シーケンシャルなランダム生成コードの後ろに追記する BALLERINAが生成した単体試験シーケンシャルなランダム生成コード →既存手法Randoop algorithm[1]を改造並行実行する 2つのスレッド Adrian Nistor et al. “BALLERINA: Automatic Generation and Clustering of Efficient Random Unit Tests for Multithreaded Code”, In Proc. of ICSE 2012, pp.727-737, Figure 2 より [1] C. Pacheco, S. K. Lahiri, M. D. Ernst, and T. Ball, “Feedbackdirected random test generation,” in ICSE, 2007. ICSE'12 勉強会 2012/8/30

手法概要2 点検すべきfailureを絞り込むクラスタリング手法： Test Oracleとして既存手法linearizability[2]を採用しているので誤報が出る可能性がある「似たような」バグレポートはたぶん、全部誤報か全部本物のバグかだろう →バグレポートを下記２点によりクラスタリングする Failure発生時に実行していたメソッド Failureの種類評価では、1個の本物のバグに対して、数百個の誤報が出る →非実用的クラスタリングの導入後では誤報は3～4個にまで減った [2] S. Burckhardt, C. Dern, M. Musuvathi, and R. Tan, “Line-Up: A complete and automatic linearizability checker,” in PLDI, 2010. ICSE'12 勉強会 2012/8/30

評価 6件のOSSに含まれる14個の本物のバグで評価提案手法は、既存ランダム生成手法より、 2～10倍速くバグを見つけた Groovy, JDK, JFreeChart, Apache Log4j, Apache Lucene, Apache Pool 提案手法は、既存ランダム生成手法より、 2～10倍速くバグを見つけたクラスタリング手法により、点検すべきfailure の数を4～8倍減らした未知のバグをさらに3件検出できた Apache Log4j, Apache Poolから ICSE'12 勉強会 2012/8/30

On-Demand Test Suite Reduction Dan Hao@Peking University （株）NTTデータ技術開発本部　朱峰錦司

議異！りあ裁判長！コードカバレッジを保っていても・・・バグ発見能力には疑いの余地があります！背景（１／２）従来のテストケース削減手法は、コードカバレッジを一定に保てれば減らしてよい、というものが多いﾁｮｼｬ裁判長！コードカバレッジを保っていても・・・バグ発見能力には疑いの余地があります！ ICSE'12 勉強会 2012/8/30

背景（２／２） 2つの既存手法を試してみると… 20%以上の確率でバグ発見能力6割減 20%以上の確率でバグ発見能力4割減 ※元論文P.2から抜粋 ICSE'12 勉強会 2012/8/30

テストケース削減によるバグ発見能力低下の実績データをもとに、この集合を線形計画法で発見する！目的バグ発見能力を一定に保ちながらテストケースを削減する手法の提案全てのテストケースの集合以下を満たす最小のテストケースの集合・バグ発見能力の低下は l% 以下・（統計学に頼るので）信頼度は c% テストケース削減によるバグ発見能力低下の実績データをもとに、この集合を線形計画法で発見する！ ICSE'12 勉強会 2012/8/30

手法概要（１／２）実績データの作成既存のソフトウェアをもとに、テストケースの削減とバグ発見能力の低下との相関を分析信頼度は90%,95%,99%の3パターンに決め打ち ※元論文P.4から抜粋テストケース数を4から2に減らすと、99%の確率でバグ発見能力は（最高で）83.3%減少してしまう ICSE'12 勉強会 2012/8/30

手法概要（２／２）線形計画法の適用モデル式の簡易化（省略） 2種類のモデル式を提案 local constraintsに基づく式あるテストケースの部分集合において、q行目のソースコードをカバーするケースがもともとp_j個あった状態からq個に減少した際に… 線形計画法の適用 2種類のモデル式を提案 local constraintsに基づく式 global constraintsに基づく式モデル式の簡易化（省略）全ての行個別で不等式が成り立たたないといけない ※元論文P.5から抜粋過去の実績では、テストケースをp_j個からq個に減らすとこれぐらい能力が落ちるソースコード全体で成り立てばよい ※元論文P.5から抜粋 ICSE'12 勉強会 2012/8/30

評価 3つのシナリオで手法を評価他手法との比較テストケース削減効果は少ないが、バグ発見能力を維持したい場合は非常に効果的対象実績データ適用対象結果 1 8つのCプログラム 1つのプログラムの半分プログラムの残り半分全てのプログラムにおいて、2つのモデル式の場合ともに、結果は妥当であった 2 1つのJavaプログラムの3リビジョン前バージョン後バージョンバージョン番号が近いほうがより結果は妥当であった 3 7つのCプログラム 6プログラム残り1プログラム globalの場合のほうが削減効果は大きいが、localの場合のほうがバグ発見能力が高い ICSE'12 勉強会 2012/8/30