モチベーション
全銀システムで障害が2023/10/10~12にかけて発生している。
この機会に全銀システムの全体像を図解して理解してみようと思う。
全銀システムの全体図
現在
・処理能力 3,000万件/1日
・現在代7世代
・中継コンピュータは中央のデータセンターにあるらしい
・中継コンピュータは全銀システムに合わせたデータの変換や計算処理などを行う
将来的な全銀システム
将来的には中継コンピュータ(RC)の廃止を検討しており、次世代ではRCとAPI Gatewayが併用され、さらに次のアップデートにて完全廃止される予定。(※3)
全銀システムの物理的な配置と構成
大阪と東京で冗長化されており、各RC(中継コンピュータ)は両方に接続されている。
どのシステムも待機系と正系の2つから構成されている。
日銀ネットとの違い
日銀ネットは日銀のシステムであり、全銀システムから1日の終わりに最終結果を受け取り処理する。
こちらは24/365運用ではない。
2023/10/10~12まで続いた障害ポイント
中継コンピュータのアップデートのタイミングで不具合が起こった。
内国為替制度運営費の計算プログラムで不具合が発生したとのこと(※3)
内国為替制度運営費とは、全銀システム加盟店からシステムベンダーに支払われる運用費用(参照)
なぜ中継コンピュータのアップデートのタイミングで不具合が起こったのか?(2023/12/03追記)
① 金融機関名生成テーブルプログラムを32bit環境のプログラムのままコンパイル後実行
② ①で生成されたインデックステーブルがメモリ不足により破損
③ RCに展開された破損したインデックステーブルが参照されたタイミングで異常終了
※5 ※6
インデックステーブル生成プログラムで必要なバイト数の計算を誤っていた可能性が高く、その計算は手動で行われていた。
おそらくアラインメントの考慮漏れであることが考えられる。※7
参考サイト
※1 全国銀行データ通信システムのシステム障害についてまとめてみた - piyolog
※3 次期全銀システムは富士通メインフレームとCOBOLから脱却へ、何が変わるのか | 日経クロステック(xTECH)
※4 【全銀ネット障害】その時システムでは何が起きたのか? 暫定版PGで12日午前8時半に復旧(更新) | Business Insider Japan
※5 全銀システム障害の詳細を報告、64ビット化でテーブルサイズが増えて作業領域が不足 | IT Leaders
※6 全銀システム障害の原因はテーブル生成プログラムの不具合、新旧稼働環境の違いを吸収できず─NTTデータ | IT Leaders
※7 https://twitter.com/ockeghem/status/1730754578570985646?s=46&t=i61zzLbodagfIcHQLkRYtw