UltraFastTM 設計手法成功のためのガイドライン Vivado Design Suite.

Slides:

Advertisements

Similar presentations

IBM SmarterCloud Control Desk 7.5 新機能ガイド－資産と構成アイテムの同期

Advertisements

ＣＰＵ設計とパイプライン.

Chapter11-4(前半) 加藤健.

VLSI設計論第4回アキュムレータマシンと仮遅延シミュレーション

実地棚卸/棚卸検数 & 在庫調整 SAP Best Practices.

LZ圧縮回路の設計とハード・ソフト最適分割の検討電子情報デザイン学科高性能計算研究室４回生　中山　和也 2009/2/27.

Capter9 Creating an Embedded Test Bench ( )

パイプラインパフォーマンス管理 SAP Best Practices.

計算機アーキテクチャ特論Chapter.6.6~6.9

POWERSHOW Limited DVR-POS システム小売業者のための理想的な損失防止DVRシステム.

Fiery Color Profiler Suite v4.7

Handel-C基礎および７セグとマウスのハンドリング

IM、プレゼンス、連絡先 IM 要求に応答するプレゼンスを設定または変更するユーザーを検索する

Verilog HDL 12月21日(月）.

事業計画発表者名 | 会社名.

市販のソフトウェアがこれほど脆弱な理由 (それをどのように解決するか).

Fire Tom Wada IE dept. Univ. of the Ryukyus

第１章計算基盤としてのFPGA 滝本　宗宏.

第10回 Dフリップフロップディジタル回路で特に重要な D-FF 仕組みを理解するタイミング図を読み書きできるようにする瀬戸

画像処理ボード上での高速テンプレートマッチングの実装と検証

リファクタリングのための変更波及解析を利用したテスト支援ツールの提案

ML 演習第 7 回新井淳也、中村宇佑、前田俊行 2011/05/31.

Ibaraki Univ. Dept of Electrical & Electronic Eng.

8. 順序回路の簡単化，機能的な順序回路五島正裕.

演算/メモリ性能バランスを考慮したマルチコア向けオンチップメモリ貸与法

2005年11月2日（木）計算機工学論A 修士1年 No, 堀江準.

VLSI設計論慶應義塾大学理工学部情報工学科山﨑信行

組み込み向けCPU 小型デバイスに搭載されるCPU 特徴携帯電話，デジタルカメラ，PDA，センサデバイスなど小型低消費電力多機能

Oracle APEX Forms変換の概要

6. 順序回路の基礎五島正裕.

九州大学キャンパスクラウド利用法情報ネットワーク特論講義資料.

OpenMPハードウェア動作合成システムの検証(Ⅰ)

高速剰余算アルゴリズムとそのハードウェア実装についての研究

SQL パフォーマンスチューニング～プランガイドの利用～

PCPU物理設計～マクロレベルの配置配線～

5 テスト技術 5.1 テストとは LISのテスト故障診断 fault diagnosis 故障解析 fault analysis

オブジェクト指向プログラムにおけるエイリアス解析手法の提案と実現

ディジタル回路 6. 順序回路の実現五島正裕.

実行時情報に基づく OSカーネルのコンフィグ最小化

ゲーム開発モデルの基礎.

DDRターミネーションレギュレータの使用法－何個のメモリを駆動できるのか－

ディジタル回路の設計と CADによるシステム設計

VLSI設計論第3回順序回路の記述と論理合成

情報処理　タイマの基礎 R8C タイマの基礎.

アスペクト指向言語のための独立性の高いパッケージシステム

VMMのソフトウェア若化を考慮したクラスタ性能の比較

オペレーティングシステムJ/K 2004年11月15日2時限目

ビジネスプロジェクトの計画発表者名 | 会社名.

信号伝搬時間の電源電圧依存性の制御による超伝導単一磁束量子回路の動作余裕度の改善

VMが利用可能なCPU数の変化に対応した並列アプリケーション実行の最適化

コードクローン分類の詳細化に基づく集約パターンの提案と評価

プロジェクトの概要プロジェクト名 | 会社名 | 発表者名.

UMLの概要とオブジェクト指向の基本概念

B演習(言語処理系演習)第2回田浦.

組込みシステムとはコンピュータ制御システム?

Fire Tom Wada IE dept. Univ. of the Ryukyus

Ibaraki Univ. Dept of Electrical & Electronic Eng.

コンピュータアーキテクチャ第 9 回.

計算機工学特論スライド電気電子工学専攻修士１年弓仲研究室河西良介

プログラムの差分記述を容易に行うためのレイヤー機構付きIDEの提案

8. 順序回路の実現五島正裕.

Cソースコード解析によるハード／ソフト最適分割システムの構築

新入社員トレーニング発表者名発表日このテンプレートは、トレーニング資料をグループ設定で紹介するための開始ファイルとして使用できます。

コンピュータアーキテクチャ第 9 回.

Microsoft® Office® 2010 トレーニング

プログラムの一時停止時に将来の実行情報を提供するデバッガ

信号伝搬時間の電源電圧依存性の制御による超伝導単一磁束量子回路の動作余裕度の改善

オブジェクト指向言語におけるセキュリティ解析アルゴリズムの提案と実現

ベイジアンネットワークとクラスタリング手法を用いたWeb障害検知システムの開発

Presentation transcript:

UltraFastTM 設計手法成功のためのガイドライン Vivado Design Suite

内容 UltraFast 設計手法の概要ハードウェアに適合する HDL コードの記述タイミング制約の作成と検証クロック配置、ピン配置、フロアプラン

UltraFastTM 設計手法の利点コンパイル時間を短縮し、予測可能な結果を取得適切な設計手法が必要プロジェクトのスケジュールによりタイムトゥマーケットの短縮が必要リスクを効果的に管理反復回数、特に最終段階での変更を最小限に抑える予測および解析機能により、設計の初期段階でさまざまなオプションを試すことが可能エキスパートや上級ユーザーからの推奨事項ベストプラクティス (チェックリストおよび資料へのリンク) 検証ツールおよびレポートリンティングおよび DRC

UltraFast 設計手法ガイド (UG949) PCB 設計 : ボードの製造し直しを回避 XPE を使用して消費電力を要件に対して検証 Vivado I/O 配置を使用し、インターフェイスを含む最上位で DRC を実行デザインの作成 : 最高の QoR を得るためのコーディングスタイル Vivado の HDL 言語テンプレートを使用新しいリンティング機能 : 設計手法 DRC ルールデックインプリメンテーション : 短期間でタイミングクロージャを達成短期間でクロージャを達成するための手法 : 最小限の制約でクロージャ最終的なクロージャ : 適切な制約でクロージャ XDC 言語テンプレートおよびタイミング DRC ルールデックを使用

設計サイクルを高速化するためのストラテジ初期段階で反復作業デザインフローの初期段階からクロージャを開始する後の段階よりも反復作業を短時間で実行可能結果の品質 (QoR) に与える影響が大きい QoR への影響 100x 10x 1.2x 1.1x デバイス/IP の選択 PCB / 設計インプリメンテーションクロージャ IP の統合、RTL デザイン、検証コンフィギュレーション、検証、デバッグ設計サイクルの時間とコストを削減

タイミングクロージャを短期間で達成するための手法基本制約の作成優先順位を決め、1 ステップごとにクロージャまず合成 (高速、影響が大きい) で、その後バックエンドで最も単純な制約から開始 : ほとんどの問題の原因となる内部 Fmax (フリップフロップ間の制約) クロックの依存性を適切に定義デザインおよび制約が妥当なものであることを確認解析して根本的な原因を把握してから修正方法を決定クロックパス vs. データパス vs. インターコネクト遅延 vs. ロジック遅延… I/O 制約を追加し (Vivado XDC テンプレートを使用)、再実行… 最終的な制約と混同しない完全な制約は必要 6

デザインクロージャを段階的に達成必要な場合タイミング例外、基本制約内部パスを最適化チップ全体を最適化調整 I/O 制約を追加合成解析配置配線基本制約内部パスを最適化 Fmax 基本 XDC 合成解析配置配線 I/O 制約を追加チップ全体を最適化 Fmax 完全な XDC 合成解析配置配線必要な場合タイミング例外、フロアプランを追加調整 Fmax 最終 XDC

クリティカルパスが変わることがある実際のデザイン例合成後の予測 (実際の問題) ワーストパス : ロジックレベル数 13 配置後ワーストパス : ロジックレベル数 7 ロジックレベル数が 7 ～ 13 のパスはローカルに配置される配線後 (実際の問題の副作用) ワーストパス : ロジックレベル数 4 ロジックレベル数が 5 ～ 13 のパスは優先的に配線されるワーストパス : 4.3ns ワーストパス : 4.2ns ワーストパス : 4.1ns タイミングクロージャを短期間で達成するためタイミングの問題を初期段階で解析および修正 8

HDL コーディングスタイルの影響ブロックの推論デザインをパイプライン処理してロジックレベルを削減リセットをできるだけ使用しない RAM、DSP、LUT RAM、SRL の推論には推奨されるテンプレートを使用デザインをパイプライン処理してロジックレベルを削減リセットをできるだけ使用しないリセット回路は通常不要 : ザイリンクスデバイスは既知のステートで起動専用シフトレジスタ (SRL) および RAM メモリ配列はリセットを使用しないリセットが必要な場合は同期リセットを使用レジスタを専用 RAM および DSP ブロックにパック可能リセットをデータパス (LUT) にインプリメントすることも可能合成ツールでの処理がより柔軟に実行されるほかの合成ツールまたは以前のリリースで必要だった属性を再確認 KEEP、dont_touch、syn_preserve、max_fanout などの属性はできるだけ使用しない

HDL 言語テンプレートの使用 IDE からテンプレートにアクセス合成テンプレート [Windows] → [Language Templates] をクリック合成テンプレート BRAM、LUTRAM、ROM、SRL カウンター、乗算器 FSM、デコーダー、エンコーダー …

ハードウェアに適したコード記述 DSP ブロックのカスケード機能を活用 in ブロック RAM の競合を回避するロジック(*) を使用しない乗算器のチェーンをパイプライン処理すると最適なパフォーマンスが得られる in 加算器のツリーはパフォーマンスのボトルネックとなる out out DSP48 DSP48 DSP48 DSP48 競合チェックをディスエーブルにした推論合成ツールで競合が発生すると想定される rdaddr RAMB wraddr rdaddr dout RAMB din wraddr dout din = (*) : Synplify でデフォルトで追加されるロジック (syn_no_rw_check 属性を使用すると削除される)

リセットの影響適切なリセットを選択することによりパフォーマンスを向上非同期リセットを使用すると DSP/RAM が推論されない P A 可能な限りリセットを使用しないのがベスト非同期リセットではなく同期リセットを使用アクティブ Low リセットでなくアクティブ High リセットを使用レジスタのデフォルト値は INIT プロパティで指定非同期リセットを使用すると DSP/RAM が推論されない DSP48 A B P 使用済みレジスタ rst 未使用レジスタ非同期リセットをエミュレートする回路 ‘1’

LUT コンバイン LUT コンバインは LUT の 2 つの出力 (O5/O6) を利用ツールの動作利点 : エリアを節約欠点 : 密集を引き起こす可能性があるツールの動作 XST/Synplify ではデフォルトで LUT コンバインを使用、Vivado 合成にはソフト LC 制約があるインプリメンテーションでは place_design で使用率に応じて LUT が組み合わせられるデバイスまたは Pblock の使用率が高いと、より多くのLUT が組み合わせられる Use report_utilization を使用し、O5 と O6 を使用する LUT を確認ガイドライン : >15% の LUT が O5 と O6 の両方を使用している場合合成で LUT コンバインをオフにすることを考慮 Slice Logic Distribution +-------------------------------------------------------------+-----------+ |Site Type | Used| |Slice | 45910| |LUT as Logic | 120084| | using O5 output only | 422| | using O6 output only | 105082| | using O5 and O6 | 14580|

その他のデザイン解析 report_high_fanout_nets report_control_sets ネットのファンアウトを削減するには、次を使用 max_fanout (Vivado 合成および XST) syn_maxfan (Synplify) タイミングドリブン複製には phys_opt_design を使用 report_control_sets パッキングの問題や適合の問題を表す –verbose オプションを実行して完全なリストを生成 Synplify の syn_reduce_controlset_size 属性を使用して制御デフォルトは 2 だが、8 に設定してファンアウトの小さい制御セットを除去

クリティカル警告を確認して解決 Vivado はクリティカル警告が発生しても停止しないクリティカル警告は深刻なデザインの問題多くの問題を同時に修正することが可能クリティカル警告を解決しないと、ビットストリーム生成でエラーが発生するクリティカル警告は深刻なデザインの問題無効な制約または XDC 構文エラーパスの分割ネットリストオブジェクトが見つからない、または無効次の段階に進む前にこれらの警告を解決デザイン解析の結果が不正確になる可能性があるクリティカル警告があると、最適なデザインを作成できない

タイミング制約は適切なものにする必要がある制約 (クロック、I/O) が不足している場合パスのタイミングが実際よりも良いようにレポートされる違反はレポートされないが、ハードウェアでは機能しないパスが不適切に制約されている場合重要でないパスに時間と最適化のエフォートが費やされるレポートされたタイミング違反がハードウェアでは問題とならない場合がある制約により間違ったホールド違反がレポートされた場合実行時間が長くなり、セットアップ違反が発生することがある配置配線では、ホールド違反を修正することが最優先されるデザインにホールド違反があると、ハードウェアで機能しないデザインにセットアップ違反があっても、ハードウェアでは機能する (ただし低速)

IP 制約多くのコアには独自の制約/例外制約があるネイティブでない IP : 注意が必要ネイティブ IP : 制約は自動的に含まれる PCIe、MIG、RAM ベースの非同期 FIFO… ネイティブでない IP : 注意が必要 NGC ファイルで提供されている IP 制約を含め忘れることがあるので注意ネイティブ IP : 制約は自動的に含まれる IDE の [Sources] ビュー : [Compile Order] タブの [Constraints] フォルダー report_compile_order -constraints を使用して制約ファイルソースを確認

適切な制約の作成方法クロックを作成し、クロックの関連性を定義入力遅延および出力遅延を設定タイミング例外を設定 4 手順のガイドライン入力遅延および出力遅延を設定不正なホールド違反を作成しないよう注意タイミング例外を設定できるだけ少なく各手順でレポートコマンドを使用して検証 18

クロックの基本原則 SDC ベースのタイミングエンジンでは、クロックは作成しないと認識されないプライマリクロックは create_clock を使用して作成クロックはクロック調整ブロックを介して自動的に伝搬される MMCM および PLL の出力クロックは自動生成されるギガビットトランシーバーは自動的に伝搬されないので、手動で作成する必要あり必要に応じて内部クロックを create_generated_clock を使用して作成デフォルトではクロック間のすべてのパスのタイミングが解析されるクロックをここで作成しないクロックをここで作成

クロックを作成する 4 つの手順手順 1 手順 2 report_clocks の出力例最上位ポートに create_clock を使用してプライマリクロックを作成デザインを合成するか、ネットリストデザインを開く手順 2 report_clocks を実行レポートを参照して周期、位相、伝搬を確認必要に応じて制約を修正 Attributes P: Propagated G: Generated Clock Period Waveform Attributes Sources sys_clk 10.000 {0.000 5.000} P {sys_clk} pll0/clkfbout 10.000 {0.000 5.000} P,G {pll0/plle2_adv_inst/CLKFBOUT} pll0/clkout0 2.500 {0.000 1.250} P,G {pll0/plle2_adv_inst/CLKOUT0} pll0/clkout1 10.000 {0.000 5.000} P,G {pll0/plle2_adv_inst/CLKOUT1} report_clocks の出力例

クロックを作成する 4 つの手順 (続き) 手順 3 手順 4 report_clock_interaction を使用してクロックの関連性を評価注意 : クロック間のパスはすべてデフォルトで制約されるクロック間のパス (クロック乗せ換え) を非同期として指定適切な CDC 同期回路が設計されていることを確認 set_clock_groups を使用 (set_false_path よりも推奨) 注意 : この制約により set_max_delay 制約が無効になるので注意制約が適用されていないオブジェクトがあるかを確認 check_timing を使用手順 4 report_clock_networks を実行ロジックが含まれないクロックラインを設計するヒント : 合成でクロックゲーティングオプションを使用して LUT を削除

クロックネットワークレポート report_clock_network は制約されていないネットワークを表示 create_clock クロックネットワークレポートに制約されていないクロックが含まれる場合クロックネットワークレポートに制約されていないクロックなし create_clock

クロック関連性の定義と検証

クロック乗せ換えの制約適切な同期化手法を使用 MTBF を最大化 1 ビットの場合は 2 段以上のレジスタバスの場合は FIFO 平均故障間隔 (MTBF) を最大にするため、ASYNC_REG を設定して同期化フリップフロップを同じスライスに配置 set_property ASYNC_REG TRUE \ [get_cells [list sync0_reg sync1_reg]]

非同期 CDC の制約 – 1 ビットクロック間のタイミングパスを無視クロックグループ間のタイミングパスを無視 set_clock_groups -asynchronous -group {clk1} -group {clk2} 上記は次と等価 : set_false_path -from [get_clocks clk1] -to [get_clocks clk2] set_false_path -from [get_clocks clk2] -to [get_clocks clk1] 注意 : これにより set_max_delay 制約は無効になるクロックグループ間のタイミングパスを無視 # SDC create_clock for the two primary clocks create_clock -name clk_oxo -period 10 [get_ports clk_oxo] create_clock -name clk_core -period 10 [get_ports clk_core] # Set Asynchronous Clock Groups set_clock_groups -asynchronous -group [get_clocks -include_generated_clocks clk_oxo] \ -group [get_clocks -include_generated_clocks clk_core} ]

非同期 CDC の制約 – バスビルトインハード FIFO を使用 (推奨) 非同期転送用に設計されている set_clock_groups 制約を使用ファブリックのグレイコードで記述された FIFO 転送を使用タイミング要件を設定 : set_max_delay $delay \ –from [get_pins cell1/C] \ –to [get_pins cell2/D] \ –datapath_only ($delay は clk A の周期または 2 つのクロック周期の小さい方より小さい) set_max_delay を含む XDC ファイルは IP カタログで自動生成される非同期クロックグループは作成しない set_clock_groups が set_max_delay より優先され、 set_max_delay が無効になる sync. cell1 sync. cell2 注記 : -datapath_only はザイリンクス特定 (SDC に準拠しない)

入力/出力遅延 I/O 制約なしで開始主要なタイミングが妥当なものになったら、現実的な I/O 遅延を指定指定する遅延値は外部遅延主要なタイミング問題を検出し、修正することに集中 Vivado では I/O 制約を設定しないと I/O タイミングは解析されない I/O タイミングを無視するために false_path -from または -to get_ports は不要主要なタイミングが妥当なものになったら、現実的な I/O 遅延を指定 set_input_delay および set_output_delay を使用不正な遅延値 (< 0ns など) を使用すると、解析か不正になる指定する遅延値は外部遅延 UCF のデフォルト : 内部遅延 27

タイミング例外 : できるだけ少なく利点 : タイミングクロージャに有益インプリメンテーション時間が長くなるのを回避非現実的なタイミング要件を調整例外がタイミングクロージャおよび実行時間に悪影響を与えることもある set_false_path set_multicycle_path set_max_delay セマンティック set_multicycle_path : –hold を使用 (誤ったホールド違反を回避) regexp : 複雑な式を回避、制約を厳しくしすぎない set_false_path –from : 実行時間への影響なし (単にパスから削除) set_false_path -from -to : 影響あり (削除不可、プロセスで共有されるパス)  非同期クロックの間に set_clock_groups を使用実行時間優先順位 set_multicycle_path 3 –from REGA/Q set_multicycle_path 2 –to REGB/D -to よりも -from が優先される

マルチサイクルパス set_multicycle_path N を設定するとホールドチェックは N-1 で実行されるセットアップチェックを変更すると、ホールドチェックも変更される実行時間とセットアップへの悪影響を回避するためのガイドライン適切な回路 (クロックイネーブルロジックなど) を追加ホールド要件を 0 に戻して (N-1 減らす) 誤ったホールド違反を回避 hold setup Launch set_multicycle_path –from [get_cells regB] –to [get_cells regC] 2  setup:2, hold:1 == set_multicycle_path –from [get_cells regB] –to [get_cells regC] 2 -setup set_multicycle_path –from [get_cells regB] –to [get_cells regC] 1 –hold  setup:2, hold:0

Vivado 言語テンプレートの使用 XDC テンプレート IDE からテンプレートにアクセス [Windows] → [Language Templates] をクリック SDR および DDR テンプレート入力および出力ソース同期/システム同期中央揃え/エッジ揃え

レポートの解読 report_timing_summary で生成されるタイミングサマリレポート [Intra-Clock Paths] セクション : クロックドメイン内のパス [Inter-Clock Paths] セクション : 異なるクロックドメイン間のパス report_timing をインタラクティブにアドバンスオプションを指定して使用通常 Tcl コンソールで使用 report_timing –through [get_nets {/cpu_top/crit_net_name}] report_timing –setup –max_paths 10 # For 10 worst setup paths report_timing –hold –to [get_cells {/top/item}] # Hold on “item” XDC ファイルからのフィルターを使用して各制約をチェック set_multicycle_path –from [get_pins regA/C] –to [get_pins regB/D] report_timing –from [get_pins regA/C] –to [get_pins regB/D]

タイミングコマンドのまとめクロックを作成して検証クロックグループを確認 I/O 遅延を確認必要に応じて例外を追加 check_timing : 不足しているクロックおよび I/O 制約を確認 report_clocks : 周波数および位相をチェック report_clock_networks : クロックルートクロックグループを確認 report_clock_interaction I/O 遅延を確認 report_timing -from [input_port] -setup/-hold report_timing -to [output_port] -setup/-hold 必要に応じて例外を追加 report_timing を使用して確認

制約ファイルの管理 1 つの XDC ファイルを使用複数の XDC ファイルを使用プライマリクロックおよび I/O 遅延クロックおよび RTL オブジェクトの例外インプリメンテーション特定の XDC 物理制約物理ネットリストに基づく例外 Implementation main.xdc impl.xdc Synthesis Elaboration

IP 制約ファイルの管理一部の IP には独自の XDC 制約がある制約ファイルの順序は重要例 : Clocking Wizard 制約ファイルの順序は重要 XDC ファイルの順序をレポート : report_compile_order –constraints report_clocks を使用してクロックを常に検証 (4 手順のプロセスの手順 2) デフォルト順を変更する場合 set_property PROCESSING_ORDER early|late IP_XDC_File 必要に応じて IP の XDC ファイルをイネーブル/ディスエーブルデフォルトでは、Clocking Wizard の XDC はユーザー XDC よりも先に読み込まれる (ユーザー制約で IP で定義されたクロックを上書き可能)

クロックおよびピンの配置ピンおよびクロックの配置は通常デザインサイクルの初期段階で決定ピンとクロックの配置は一緒に考える必要があるこれらの決定がデザインのパフォーマンスに影響過剰なクロックスキュー不適切な I/O タイミングタイミングに問題のあるクロック乗せ換えロジック配置の柔軟性低下クロックリソースの選択肢が少ない過剰な配線遅延デバイス使用率の低下ピンとクロックの配置は一緒に考える必要があるクロックピンに関する決定事項がクロックタイミングおよびリソースの選択に影響データピンに関する決定事項がクロックピンの配置に影響

クロックおよびピンの配置クロックピン配置での考慮事項データピン配置での考慮事項ピンを割り当てる前に I/O インターフェイスおよびクロッキング IP を生成する可能な限りクロックおよび MMCM を統合するクロックおよび MMCM の数を少なくすると、使用されるクロックリソースおよびクロック乗せ換えが減るクロックリソースおよびピンを割り当てる前にすべての CDC を考慮するデータピン配置での考慮事項関連のデータピンを同じバンクに配置、それが不可能な場合は隣接バンクに配置可能な場合は関連の I/O クロックを同じバンクに配置データパスと共に関連の制御信号の配置も考慮するピン配置を実行するときにデータフローを考慮するデータがデバイス内を障害なく通過できるようピン配置を選択するファンアウトの大きい信号をチップの中央近くに配置するファンアウトの非常に大きい信号は BUFG リソースを使用して CCIO ピンに割り当てることを考慮配置段階ですべてのピン属性 (I/O 規格、スルーなど) を評価

クロックおよびピンの配置 Vivado のピン配置機能を使用ピンおよびクロックの割り当てを生成された IP からインポートパッケージおよびデバイスでの I/O リソース配置を表示 DRC、SSN、およびその他のチェックで検証コンフィギュレーションピンの割り当ておよびデバイスを移行した場合の考慮事項ピンの変更を Vivado で再評価 PCB ピンスワップがタイミングおよびリソースにどのように影響するかを理解

SSI に関する追加の考慮事項クロッキングピン配置参考資料ファンアウトの大きいクロックは中央の SLR に配置クロックピン/MMCM はタイミングクリティカル I/O インターフェイスと同じ SLR に配置 (タイミングクリティカル I/O インターフェイスを別の SLR から駆動しない) 上部の SLR と下部の SLR でクロックピンをバランス良く選択する上部 2 つの SLR のクロックドメインには 8 個の BUFG x 2 下部 4 つの SLR のクロックドメインには 4 個の BUFG x 4 ピン配置すべての SLR を駆動するファンアウトの大きい信号は中央の SLR に配置 I/O インターフェイスは複数の SLR にまたがらないようにする SLR をまたがるデータフローに注意ピン配置の選択により複数の SLR をまたぐことが必要になる状況を回避参考資料『高集積度 FPGA 設計手法ガイド』 (UG872)

フロアプランで配置を改善フロアプランなしで開始まず HDL、合成、制約を改善 Vivado IDE を使用配置配線アルゴリズムで達成可能な結果を確認まず HDL、合成、制約を改善簡単、フロアプランを使用しない方が一貫した結果が得られる Vivado IDE を使用モジュールごとに配置をハイライトし、ガイドとして使用クリティカルタイミングパスの配置を表示 Pblock のデータフローを理解 Pblock の影響を理解配置周辺のリソースがデータフローに影響リソース使用率を考慮して Pblock を作成フロアプランを過剰に使用しない (できるだけ少なく) デザインの重要なエリアのみをフロアプラン使用率の高い Pblock を作成しない配線の密集または新しいタイミング問題が発生する可能性あり Pblock が重ならないようにする配置およびクロックが複雑になる Baseline run with highlighted regions

UltraFast 設計手法のまとめ最適な結果を得るには、FPGA の HDL スタイルを適用基本制約を作成してクロージャを短時間で達成 BRAM、LUTRAM、DSP、SRL 推論の要件に注意通常はリセットをできるだけ使用しない、使用する場合は非同期リセットを避ける制御信号を最小限にする大型 FPGA はデータフローおよびフロアプランを考慮して設計基本制約を作成してクロージャを短時間で達成適切なタイミング制約を設定不適切な制約は実行時間が長くなり、パフォーマンスが低下し、ハードウェアエラーが発生する原因となるタイミングの作成方法および検証方法の基本を理解するピン/クロック配置のガイドラインに従うデータフローに従うファンアウトの大きいクロックおよびピンを SSIT デバイスの中央に配置する