オフィスを移転したところ、複合機が想定通りに動かないトラブルが生じた。VXLANを使って新たに構築したネットワークと、VXLANを使わないネットワークを併用したことが影響していると考えられた。MTUの違いから、真の原因を探った。
ネットワーク構成を柔軟に変更できたり、大量の仮想ネットワークを提供できたりするメリットがあるSDN(Software Defined Network)。SDNを実現する中核技術が、VXLAN(Virtual eXtensible Local Area Network)だ。
VXLANを使うと便利であることは確かだが、一方で物理的なネットワークと仮想的なネットワークが異なるプロトコルで動作するなど、特有の難しさもある。今回のトラブルは、表層としてはVXLANにおける物理と仮想の動作の違いによって生じた。
年末のオフィス移転で複合機にトラブル
トラブルに見舞われたのは、ユニアデックスがネットワーク構築を支援したA社だ。A社は2018年の年末から2019年の年始にかけて、オフィスを移転する計画だった。年末休業中、新オフィスで構築したネットワークでトラブルが起こった。
新たに構築したネットワークは、社員のパソコンや複合機などが接続するネットワークにVXLANを使っている。一方で業務サーバーは、VXLANを使っていないネットワーク(以下レガシーネットワークと呼ぶ)に接続している。
VXLANのネットワークとレガシーネットワークは、2台のコアスイッチを介して接続している。コアスイッチはアクティブ−アクティブの冗長構成だ。
ユニアデックスのネットワークエンジニアである木村衣生里さんがA社のトラブルを認識したのは、2018年12月26日のこと。「複合機でIDカードを認証しようとすると、タイムアウトすることがある」「パソコンから複合機の管理画面にアクセスすると、画面が表示されないことがある」。A社の担当者からこう問い合わせがあったのだ。
木村さんはすぐ現地に赴き、原因究明に着手した。まず疑ったのが、複合機の認証周りだ。構築したネットワークはAD(Active Directory)の情報やMAC(Media Access Control)アドレスなどを使って端末を識別し、通信を制御する。木村さんは複合機のMACアドレス認証を外したが、状況は改善しなかった。
そこで、試験用のパソコンと複合機をLAN(Local Area Network)ケーブルで直接つないで動作を確かめた。すると問題なく複合機の管理画面が表示された。木村さんは「複合機ではなく、ネットワークに問題があるのでは」と考えた。
ではネットワークで何が起こっているのか。ネットワークの数カ所でパケットをキャプチャーしたところ、ネットワーク全体でTCP(Transmission Control Protocol)の通信はできていると分かった。ただ、なぜ複合機でトラブルが発生しているのかまでは原因を突き止められなかった。
ネットワークに問題があるとにらんだ時点で木村さんは、VXLANに問題があるのではと考えていた。そこでVXLANネットワーク側のフロアスイッチに接続していた複合機を、レガシーネットワークのスイッチに接続してみた。すると試験用のパソコンに管理画面が表示された。これにより複合機に問題はなく、VXLANに問題があると切り分けできた。
以上の結果を踏まえ、12月31日に木村さんはスイッチのベンダーに調査を依頼した。ベンダーからは年が明けた2019年1月4日に、パケットをキャプチャーする箇所を増やすよう指示があった。木村さんは1月5日に指示通りに作業したところ、レガシーネットワークのサーバー集約スイッチとコアスイッチとの間でパケットがドロップしていると突き止めた。

