|
真夏の月曜日は恐ろしい。
ウチのサーバは土曜日の深夜から日曜日の朝方にかけてバックアップやらサーバメンテの自動スクリプトが起動するので、非常に負荷が掛かっている。
特に夏場は締め切った事務所の中はおそらく40℃以上にはなっているはず。
もし熱暴走でもしようものなら・・・ あぁ、恐ろしい〜
かと言ってサーバのために一晩中エアコンをかけておくのもためらってしまうこのご時世。
心の中で「耐えろ〜!」と祈ることが関の山である。
と、前置きはこの辺にして、今日の午前中にサーバが不調を訴えた。
クライアントのWindowsマシンからsambaで構築されたファイルサーバへのアクセスが非常に重く、Excelの小さなファイルでも普段なら瞬時に開くのが今日は1分以上かかっている。
とりあえずSWATからsanbaの状態を確認したが、正常であった。
正常であったがとりあえずsambaを再起動して様子を見る事にした。
そうこうしているうちに症状はどんどん悪化して、とうとうマウントしているネットワークボリュームが切断されてしまった。
ちょっと冷や汗が出てきた。
自分のPCからサーバにSSHでログインしようとするが、いつもより反応が遅い。
サーバの負荷を確認したところ、ロードアベレージはわずかMAX0.2だった。
カーネルの吐き出すログを確認すると、クライアントからのセッション開始要求がきても応答でタイムアウトになっている。
なぜタイムアウトになるのか? ん〜 ますますわからん。
その内インターネットにも繋がらなくなったのでコンソールからログインし、あちこちにpingを叩いてみたところ、ローカルは全部通じているようであったが、外側のルータからはunreachableになっていた。
疑わしきは外側のNIC もしくはルータのI/Fか。
とそのときふと2年前の出来事(DNSが遅い!)を思い出した。
まさか? と思いながらも2枚のNICに刺さっているケーブルを入れ替えてみた。
しかし結果は同じ。
もしかしてNICが暑さでイカれたか?
ひとまず再起動してdmesgで各NICに割り当てられたMACアドレスを確認して、modprobe.confで設定している値と見比べてみたらきっちり入れ替わっていた。
一体何が原因でどのタイミングでこんなことになるのかは全くわからないが、ネットで調べると勝手に入れ替わってしまう現象はよくあるそうだ。
それと、今回の不調で再起動したが、uptimeを見たら今日まで465日間稼動していた。
いくら安定稼動しているからと言ってもやはり1年に1度ぐらいは再起動してやるほうがよさそうだ。
話を元に戻すと、勝手に入れ替わってしまうことはこの先も発生する可能性は十分あるので、その対処法とやらをここに記す。
前回は modprobe.conf に alias を指定するのみだったが、コレは起動時における入れ替わりを防止するための策に過ぎず、恒久的に固定する方法ではない。
恒久的に固定するためには、/etc/sysconfig/network-scripts/以下の、
ifg-eth* にMACアドレスを書き加えておけばデバイスマッピングが固定されることになる。
一連の手順をおさらいも含めて書いておく。
まずターゲットとするNICがどの位置に刺さっているのかを
lspci -v で確認する。
/etc/modprobe.confでNICとデバイスをマッピングする。
ifconfig eth* でNICのMACアドレスを確認し、ifcfg-eth* の設定ファイルで
HWADDR=00:11:22:33:44:55
の行を追加してNICにMACアドレスを固定する。
ちなみに商用のUNIXではこれが当たり前の設定だそうな。
設定ファイルを書き換えたらリブートして疎通を確認する。
ふぅ〜 結局今日は午後からこれに掛かりっきりになってしまった。
|

- >
- コンピュータとインターネット
- >
- コンピュータ
- >
- UNIX





ゴルフ明けにこのトラブル、
ですが
お疲れ様でした
私には専門的すぎてよく
わかりませーん
いつも穏やかなたけさんが
ヒートアップしてるのが
わかりました。。
2011/7/14(木) 午前 8:57 [ 赤毛のアン ]
おはようございます、アンさん。
サーバのトラブルは業務に支障を来たすので、そりゃもう必死です。
もう若くないので徹夜はかなり堪えますわ^^;
2011/7/14(木) 午前 9:23 [ たけサク ]