ネットワーク停止/悪夢再び?
今朝、起きて作業用Wikiにちょっと書き込んでたりしてたら、いきなりサーバに繋がらなくなった。mailもsshも何も繋がらない。急いで有馬に居る担当の人に連絡を取ったが、内部からもアクセスできず、サーバは見たところ(ハード的な)異常はなく、内部の人はインターネットにアクセスできるとのこと。つまりサーバのネットワークが切れている…。もう一連の過去の悪夢しか思い出せないが、とりあえず再起動してもらったら無事復帰した。
急いでlogを確認したら、messagesに
NETDEV WATCHDOG: eth0: transmit timed out
とかいうのが残ってた。やっぱネットワークカードか…。暗い気持で駄目元で検索してみたら、なんと似たような例が引っかかった!なんで前は見つからんかったんやろう…?
- http://supli.x0.com/archives/2005/10/netdev_watchdog.html
- http://pierre.vg/x/modules/wordpress/index.php?p=126
どうもe1000ドライバでTSOがonだとよくない、とかいう未確認情報だが、おそらくほぼ同じ症状なのでethtoolをインストールしてtsoを切った。これで安定してくれ!
とりあえず今のところ再発はしてへんが、前は半日越しくらいで再発したこともあったから油断はできん。が、多分大丈夫な予感。