Ibaraki Univ. Dept of Electrical & Electronic Eng. 2009. 7. 6 電子計算機工学 Ibaraki Univ. Dept of Electrical & Electronic Eng. Keiichi MIYAJIMA
今後の予定 7月6日 コンピュータシステムの信頼性 7月13日 まとめと期末試験について 7月27日 期末試験
コンピュータシステムの信頼性
信頼性と信頼度 信頼性 信頼度 信頼度の例) 素子や機器などのアイテムが正しく機能しているかどうかを定性的に表す言葉 アイテムが与えられた条件で、規定の期間中、要求された機能を満足する確率 信頼度の例) 総数 個の素子が時刻 まで正常に動作している素子数を とすると、信頼度 は
信頼性と信頼度 不信頼度 不信頼度の例) アイテムが与えられた条件で、規定の期間までに、故障する確率 時刻 までに故障した素子数を とすると、不信頼度 は
信頼性と信頼度 故障率 時刻 までに残っている素子数 のうち、単位時間に故障する確率 ここで、 は時刻 まで正常で 時刻 までに残っている素子数 のうち、単位時間に故障する確率 ここで、 は時刻 まで正常で あった素子が、時刻 で故障する確率
信頼性と信頼度 故障率のバスタブ曲線 故障率の時間変化 初期故障 偶発故障 摩耗故障 故障率 時 間
信頼性と信頼度 偶発故障期間の信頼度 この期間における故障率を (一定)とすると、 両辺を で微分すると、
信頼性と信頼度 偶発故障期間の信頼度 代入 右辺の を左辺に移すと、
信頼性と信頼度 偶発故障期間の信頼度 における信頼度を1とすると、
平均故障寿命と平均故障間隔 平均故障寿命 (mean time to failure: MTTF) 非修理アイテムの故障寿命の平均値 平均故障間隔 (mean time between failure: MTBF) 故障と故障の間の平均時間間隔 (故障率の逆数) MTBF 例) あるプロセッサが ゲートから構成され、1ゲートあたりの故障が平均 時間に1回発生すると仮定 プロセッサの故障率 個数/時間 よってMTBFは 時間
保全度と平均修理時間 保全度 (maintainability) 平均修理時間 (mean time to repair: MTTR) 与えられた時間内に故障の検出・修理を完了する確率 平均修理時間 (mean time to repair: MTTR) 修理に要する平均時間 この時間が短ければ短いほど修理が速い
アベイラビリティ = Av= (availability: Av) コンピュータシステムが特定の瞬間に機能を維持している確率。(稼働率ともいう) アップタイム MTBF Av= = アップタイム+ダウンタイム MTBF+MTTR 信頼度と保全度を総合したシステムの広義の信頼性を表す尺度 アベイラビリティの向上にはMTTR(平均修理時間)を小さくすることが、コスト的に有利である場合が多い。
直列および並列システムの信頼度 直列システム (series system) 近年のコンピュータシステムはモジュール化されている モジュール 1 モジュール 2 モジュール 3 モジュール 4 どれか一つでも故障するとシステムダウンになる。 例) 信頼度 と信頼度 の2個のモジュールからなる直列システム全体の信頼度 は
直列および並列システムの信頼度 並列システム (parallel system) モジュール 1 モジュール 2 全て故障しないとシステムダウンにならない。 モジュール 3 モジュール 4 例) 信頼度 と信頼度 の2個のモジュールからなる並列システム全体の信頼度 は
直列および並列システムの信頼度 並列システム (parallel system) 例) モジュール 1 2 3 4 例) 信頼度 と信頼度 の2個のモジュールからなる並列システム全体の信頼度 は 2個のモジュールが2つとも故障する確率は よって は
直列および並列システムの信頼度 例題 以下のシステムの全体の信頼度 はそれぞれいくらか? なお、各モジュールの信頼度は全て0.98とする。 以下のシステムの全体の信頼度 はそれぞれいくらか? なお、各モジュールの信頼度は全て0.98とする。 1) モジュール 1 2 3 4 2) モジュール 1 モジュール 2 モジュール 3 モジュール 4
解答 1) 1) 上側の信頼度は2個の直列なので 下側も同様であるから、これが二つの並列システムを作っているので、 2) モジュール 1 2 3 4 1) 上側の信頼度は2個の直列なので 下側も同様であるから、これが二つの並列システムを作っているので、 モジュール 1 2 3 4 2) 左側の側の並列システムの信頼度は これが二つ、直列に繋がっていると考えられるので、
高信頼化システムの構成 フォールトトレランス (fault tolerance: 耐故障) 一般にコンピュータシステムでは、万一、故障が発生してもシステムダウンとならないことが要求される 故障が発生してもシステムが動作を維持できる フォールトトレランス (fault tolerance: 耐故障)
代表的な耐故障システムの構成例 SW デュプレックスシステム MEM 1 CCU 1 CPU 1 CCU 2 CPU 2 MEM 2 (待機冗長システム) FILE 1 MEM 1 SW CCU 1 CPU 1 FILE 2 CCU 2 CPU 2 MEM 2 一方に故障が発生したら、すぐに予備のシステムに切り換える
代表的な耐故障システムの構成例 デュアルシステム MEM 1 CCU 1 CPU 1 CCU 2 CPU 2 MEM 2 FILE 1 (dual system) FILE 1 MEM 1 CCU 1 CPU 1 クロス チェック FILE 2 CCU 2 CPU 2 MEM 2 クロスチェックにより、信頼性を向上
代表的な耐故障システムの構成例 TMR MEM 1 CPU 1 CPU 2 MEM 2 CPU 3 MEM 3 (triple modular redundancy) MEM 1 CPU 1 Voter CPU 2 MEM 2 CPU 3 システムを三重化して多数決で決定 MEM 3
代表的な耐故障システムの構成例 MEM CCU マルチプロセッサシステム CPU 1 CPU 2 FILE 1 FILE 2 (multi-processor system) FILE 1 CCU MEM CPU 1 Channel 1 FILE 2 CPU 2 Channel 2 多数のCPUを用いて処理を分担し実行する。高信頼性と高処理効率を実現できるが、制御やプログラミングが難
本日のまとめ 「コンピュータシステムの信頼性」について 信頼性と信頼度 平均故障寿命と平均故障間隔 保全度とアベイラビリティ 信頼度の計算法 信頼性と信頼度 平均故障寿命と平均故障間隔 保全度とアベイラビリティ 信頼度の計算法 代表的な耐故障システム
本日の課題1 MTBFが1500時間、MTTRが500時間であるコンピュータシステムの稼働率を1.25倍に向上させたい。MTTRをいくらにすればよいか? (H15年春) 2.3台のコンピュータが以下の図のように接続されているとき、システム全体の信頼度はいくらか? なおコンピュータの信頼度は全て0.98とする。 A C B
本日の課題2 3.信頼度0.9の装置を用いて、全体の信頼度 0.999以上の多重化システムを作りたい。この装置を最低何台並列に接続すればよいか? (H18年秋、H14年秋、類題:H15秋)