© 2015 IBM Corporation 我々の ISCA2015 論文の Time-to-Accept Quantitative Comparison of Hardware Transactional Memory for Blue Gene/Q, zEnterprise EC12, Intel.

Slides:



Advertisements
Similar presentations
英語ゼミ 6/15( 水 ) 金 正福. Part2 Unit8 ~査読者とのやりと り~ 科学技術英語 ロボット工学.
Advertisements

だい六か – クリスマスとお正月 ぶんぽう. て form review ► Group 1 Verbs ► Have two or more ひらがな in the verb stem AND ► The final sound of the verb stem is from the い row.
VE 01 え form What is え form? え? You can do that many things with え form?
BCD : Physics Options  e , e - e -, GigaZ, fixed target T. Omori 2005 年 12 月 20 日 BCD
ARC, CPSY 研究会 合同イベント トップカンファレンスの凱旋講演か ら 研究会の貢献を考える パネリスト: 塩谷先生, Nakaike-san ,藤原 先生 司会: ごしま@ NII.
顧客向け プログラム シスコ カスタマー ロイヤルティ Business Enablement and Strategy Team
米国セキュリティ調査 (2002 CSI/FBI調査 攻撃場所)
Note for How to Write an English Paper (2014 Second Semester)
第十七か ぐちとうわさ話.
STEP 2 ノート・テイキングのサンプル.
Chapter 11 Queues 行列.
CSWパラレルイベント報告 ヒューマンライツ・ナウ        後藤 弘子.
Food, Places, and People.
Windows Summit /13/2017 © 2010 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be.
HPCA? 何それおいしいの?.
日本癌学会利益相反(COI)マネジメント方法の改訂
Chris Burgess (1号館1308研究室、内線164)
What did you do, mate? Plain-Past
Only One Flower in the World
日本人の英語文章の中で「ENJOY」はどういうふうに使われているのか
Japanese verbs informal forms
There are 5 wearing verbs in Japanese depending on the part of body or the item being worn.
Tohoku University Kyo Tsukada
V 03 I do NOT eat sushi. I do NOT do sumo.
十年生の 日本語 Year 10 Writing Portfolio
Reasonので + Consequence clause
Licensing information
定期考査2 英語.
The Sacred Deer of 奈良(なら)
Who Is Ready to Survive the Next Big Earthquake?
Did he/she just say that? Get your head out of the gutter! Oh wait….
CRLA Project Assisting the Project of
“You Should Go To Kyoto”
Microsoft Partner Network Office 365 社内使用ライセンスの有効化
Cisco Customer Loyalty
ストップウォッチの カード ストップウォッチの カード
New accessory hardware Global Platform Division
Session 8: How can you present your research?
Causative Verbs Extensively borrowed from Rubin, J “Gone Fishin’”, Power Japanese (1992: Kodansha:Tokyo) Created by K McMahon.
HHIHi.
Cache Organization for Memory Speculation メモリ投機を支援するキャッシュの構成法
Windows Azure 通知ハブ.
2004 WFDSA Direct Seller Survey Research Deck Taiwan
全国粒子物理会 桂林 2019/1/14 Implications of the scalar meson structure from B SP decays within PQCD approach Yuelong Shen IHEP, CAS In collaboration with.
WELCOME TO THE WORLD OF DRAGON BALL
Disclosure of conflict of interest
Where is Wumpus Propositional logic (cont…) Reasoning where is wumpus
豊田正史(Masashi Toyoda) 福地健太郎(Kentarou Fukuchi)
大規模なこと Large scale.
Windows Summit /24/2019 © 2010 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be.
第24回応用言語学講座公開連続講演会 後援:国際言語文化研究科教育研究プロジェクト経費
My Dance Circle December 13, 2018  表紙 my dance circle.
Question Words….
日本癌学会利益相反(COI)マネジメント方法の改訂
クイズやゲーム形式で紹介した実例です。いずれも過去のインターン作です。
名古屋大学大学院国際原語文化研究科 第46回日本語教育学講座講演会
22 物理パラメータに陽に依存する補償器を用いた低剛性二慣性系の速度制御実験 高山誠 指導教員 小林泰秀
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
この研究発表の内容に関する利益相反事項は, ☑ ありません
北大MMCセミナー 第62回 附属社会創造数学センター主催 Date: 2016年11月4日(金) 16:30~18:00
Windows Summit 2010 © 2010 Microsoft Corporation.All rights reserved.Microsoft、Windows、Windows Vista およびその他の製品名は、米国 Microsoft Corporation の米国およびその他の国における登録商標または商標です。
Conflict of Interest disclosure slide A potential conflict of interest exists when there is involvement between the speaker/presenter with any for-profit.
For Master’s Students 修士学生
MO装置開発 Core part of RTR-MOI Photograph of core part.
Mondriaan Memory Protection の調査
Cluster EG Face To Face meeting
Grammar Point 2: Describing the locations of objects
日本膵臓学会 CO I 開示 発表者名(全員記載): ○○ ○○ 、 ○○ ○○ 、・・・ (◎発表責任者)
Improving Strategic Play in Shogi by Using Move Sequence Trees
Windows Azure メディアサービス
Presentation transcript:

© 2015 IBM Corporation 我々の ISCA2015 論文の Time-to-Accept Quantitative Comparison of Hardware Transactional Memory for Blue Gene/Q, zEnterprise EC12, Intel Core, and POWER8. 仲池 卓也 (日本 IBM 東京基礎研究所) SWoPP 2015 BoF-2 (ARC, CPSY 研究会合同イベント ) トップカンファレンスの凱旋講演から研究会の貢献を考える

© 2015 IBM Corporation IBM Research - Tokyo 概要 1. 我々の ISCA2015 論文概要 T. Nakaike, R. Odaira, M. Gaudet, M. M. Michael, and H. Tomari. Quantitative Comparison of Hardware Transactional Memory for Blue Gene/Q, zEnterprise EC12, Intel Core, and POWER8. 2.ISCA2015 への Time-to-Accept - 論文を通すための私見 2

© 2015 IBM Corporation IBM Research - Tokyo 我々の ISCA2015 論文概要 T. Nakaike, R. Odaira, M. Gaudet, M. M. Michael, and H. Tomari. Quantitative Comparison of Hardware Transactional Memory for Blue Gene/Q, zEnterprise EC12, Intel Core, and POWER8.

© 2015 IBM Corporation IBM Research - Tokyo Motivation  These processors are the first to implement HTM. Clarifying the advantages and disadvantages is important to enhance the next generation of processors.  The advantages and disadvantages of the HTM systems are unclear. The HTM systems have been evaluated individually. There is no paper comparing the performance of the HTM systems. 4 IBM Blue Gene/QIBM Mainframe zEC12IBM POWER8 Intel Haswell

© 2015 IBM Corporation IBM Research - Tokyo Goal  Quantitatively compare the intrinsic performance of the HTM systems Use STAMP benchmarks Tune the transaction-retry counts Compare the speed-up ratios and the abort ratios 5 Approach  Clarify the advantages and disadvantages of the four HTM systems: Blue Gene/Q, zEC12, Haswell, and POWER8

© 2015 IBM Corporation IBM Research - Tokyo Speed-up ratios with 4 cores  There is no HTM system that is more scalable than the others for all of the benchmarks. zEC12 had the highest speed-up ratio on average. 6 POWER8 won! Haswell won! zEC12 won! Blue Gene/Q won!

© 2015 IBM Corporation IBM Research - Tokyo vacation-low with 4 cores  Blue Gene/Q had high transaction begin/end overhead. SW register checkpointing, system calls to begin/end transactions, etc.  POWER8 had many capacity-overflow aborts. Fallback to locking caused many lock-conflict aborts. 7

© 2015 IBM Corporation IBM Research - Tokyo kmeans-low with 4 cores  zEC12 had many cache-fetch related aborts which are categorized into “Other”. These aborts should be unnecessary though the meaning of this abort reason is not fully disclosed.  Haswell had many data conflicts on the prefetched cache lines which data are not used in the program. Disabling prefetch improved the speed-up ratio to

© 2015 IBM Corporation IBM Research - Tokyo yada with 4 cores  Only Blue Gene/Q improved the performance over the sequential execution.  Transactional-store capacities of zEC12 and Haswell seem to be insufficient. Transactional-load capacities seem to be sufficient. 9

© 2015 IBM Corporation IBM Research - Tokyo Recommendation for Next HTM Systems  Implement precise conflict detection zEC12: False transaction aborts (cache-fetch related aborts) Haswell: Conflicts on the prefetched cache lines  Increase transactional-store capacity POWER8 needs to increase both transactional-load and –store capacities.  Reduce the transaction begin/end overhead. Blue Gene/Q had higher overhead than the other three processors. 10

© 2015 IBM Corporation IBM Research - Tokyo ISCA2015 への Time-to-Accept

© 2015 IBM Corporation IBM Research - Tokyo ISCA2015 への Time-to-Accept  実験開始から Accept まで 10 ヶ月程度 実働は 2 ヶ月 + 2週間 執筆開始直前、実験に不備が見つかり、 6 月に集めたデータは無駄に 実験データが膨大なため整理に手を焼く  4 (プロセッサ数) ×10 (ベンチマーク数) ×125 (実験パラメータ) ×4 (試行 回数)  全データが出揃ったのは APLOS 投稿前日  HTM 、 STAMP ベンチマークの使用経験は 2 年くらい R. Odaira, J. G. Castanos, and T. Nakaike. Do C and Java Programs Scale Differently on Hardware Transactional Memory? IISWC’13. R. Odaira and T. Nakaike. Thread-Level Speculation on Off-the-Shelf Hardware Transactional Memory. IISWC’ 年 6/1 実験 開始 8/7 ASPLOS 投稿 11/10 Reject 11/25 ISCA 投稿 2015 年 3/6 Accept! 7/15 執筆 開始

© 2015 IBM Corporation IBM Research - Tokyo Q. 通すのに苦労した点  A. 新規性を示すこ と  我々が主張する新規性 これまで異なる HTM 実装を比較した論文は存在せず、今回比較によって得られた 知見は新規  ASPLOS 査読者のコメント No surprising … 比較論文は無いが BG/Q や Haswell は既に詳しい評価が行われてお り、いくつかの知見は既に知られている 深い解析がない Haswell のプリフェッチの問題は信用できない  ASPLOS 投稿時はプリフェッチを disable した実験ができなかったため  ASPLOS のコメントを受けて 2 週間でやったこと プロセッサ固有の機能を評価  Constrained transactions of zEC12, HLE of Haswell, suspend/resume instructions of P8  評価が2分、高評価の査読者はいたが、無いほうが良いという査読者もいた Haswell のプリフェッチを disable した際の実験結果を追加  これは全査読者にうけた 13

© 2015 IBM Corporation IBM Research - Tokyo Accept された理由(私見)  我々の主張が ASPLOS の査読者には受け入れられなかったが 、 ISCA の査読者には受け入れられたのだと思う 追加の実験結果も一因ではあったと思う  Rebuttal を丁寧に返したのも良かったと思う 間違った指摘でない限り査読者のコメントを受け入れた 我々の論文は border line にあったと思われるので、このような場合 rebuttal も Accept のための重要な要素になると思われる 14

© 2015 IBM Corporation IBM Research - Tokyo Lessons Learned  テーマが良ければ少ない労力で論文を通せる 実働2ヶ月 + 2週間で Accept  誰もまだしていない、もしくはできないテーマを見つける 今回の論文を書く動機は「 HTM を持つ4つのプロセッサ全てを使える のはおそらく我々だけ、比較すれば論文になるはず」だった 15