
クラウド利用が増え、オンプレミスでのサーバ管理するシーンも少なくなってきました。
ただ中小企業では、なかなか過去のオンプレサーバから脱却できないケースも多いと思います。
また社内に設置はしていなくても、データセンターにハウジングしている場合もあります。
これらの場合、サーバの管理は情シスがやらなければなりません。
サーバ障害は二次的ダメージが大きい
サーバ管理としては、まずアカウント作成などのルーティン作業があると思います。当然情シスの仕事となります。
もう1つ大事なのは、サーバやネットワークの障害対応です。
ハード故障などのサーバ障害は、影響が全社に及ぶことが多いため、対応が最優先になります。
障害が起こること自体は仕方ないことです。
それよりも痛いのは、その日予定していた仕事ができなくなってしまうことです。
それによってまた仕事が遅れる悪循環。
代わりにやってくれる人がいない情シスにはサーバ障害はダメージが大きいのです。
やりたい仕事を邪魔されないために
情シスにとって、予期せぬサーバ障害は、不意に後頭部を殴られるかのような精神的に辛いダメージです。ユーザからの連絡で障害を知った場合がまた辛いです。
情シスとして先に検知できなかったのは、恥ずべきことだと思います。
障害の予兆を察知したり、障害が起きてもすぐに対応すれば、被害は最小限に抑えられます。
そのため、サーバは毎朝必ずチェックします。
サーバで提供しているサービスが稼動しているかどうか、はもちろん確認します。
それ以外に、私がやるべきだと思う最低限のチェック項目は、
・ディスク空き容量
・イベントビューア(ディスクエラーがあると「システム」にアラートが上がります)
・RAID(マネージャソフトでの確認・ディスクランプの目視確認)
・バックアップの成否
・Pingの応答速度(データセンターにある基幹システムなどへ)
です。
下のようなチェックシートを作るのも良いと思います。

気づいたことや、設定変更したことなどもメモしておくと、後で助かります。
毎日見ることのメリット
毎日チェックをしていると、以下のようなメリットがあります。・ベースラインがわかる
「ディスクの空き容量が圧迫されてきた!」となっても、
それが昨日今日で急に起こったことなのか、それともこの1年ずっとギリギリでやってきたのか。
それによって対応が違ってくるでしょう。
今の値が異常値かどうかの判断基準ができます。
・普段との違いに気づく
毎日見ていると、何か違いがあると気づくようになります。
画面が何か違うな、と。
それが障害のサインだったりします。
・今日やるべき仕事に安心して取り掛かれる
ユーザから「サーバ使えないんだけど」と突然言われることは、精神衛生上も良くないです。
作業中の仕事を途中で止めて障害対応していると、両方が気になって、どちらも失敗しそうになります。
朝にサーバをチェックして、今のところ障害がないとわかれば、後顧の憂い無く、今日やるべき仕事に着手できます。
・何故か安定稼動するようになる
根拠はありません(笑)
サービスが勝手に落ちて困っていたサーバも、毎日見るようになると、何故か安定稼動するようになります。
サーバの台数が多ければ、チェックを自動化するのも一つの手です。
ただ、私は今までの会社では、監視対象がほぼ10台以内だったので、その仕組みを作るのが面倒で、リモートデスクトップで入ってみたり、目視したりしてきました。
自動化するとちゃんと通知が来るかどうか気になってしまって、結局見てしまいそうだというのもあります(笑)
今後は、クラウドへの移行などで、自動化というよりは、管理対象を減らす方向で行きたいと思っています。
これまで見てきた会社を思い返すと、中小企業の情シスはハードに苦手意識を持つ人が多いです。
そんな人たちもサーバの機能はしっかり利用します。
でもハードやOSの状況は見て見ぬふりで、サーバは放置され、ほこりまみれになっていました。
関連記事:
ほこりまみれになると、余計故障の確率が高まります。
会社の移転で、いざサーバを移動しようとしたときに、ディスクのエラーランプが点灯していることに気づいたこともありました。
監視すべきサーバは、毎日少しずつでも見たほうが良いです。
ディスクのランプを目視するだけでも良いと思います。
大抵のサーバはRAID構成になっているので、1台ディスクが壊れただけなら、余裕を持って対応できます。
いくらRAIDでも1台目の故障に気づかなければ意味がありません。
盆休みで長期休暇を取っている間に、ディスクエラーが出ていることもありました。
ハードベンダーへ飛ぶはずの通知メールも、設定ミスで飛んでいませんでした。
休み明けの出社時に気づき、大事には至りませんでしたが、肝を冷やしました。
皆で時期をずらして休みを取っていたので、会社には同じ部門の人が出ていました。
でもひとり情シスなので、誰も対応してくれなかったのです。
事情を説明すると、普段は、「IT?よくわからん」という上司ですら、さすがに想像できたようです。
それ以降、ディスクランプの確認の仕方と、ベンダーの連絡先だけは、周りの人と共有するようになりました。
情シスの他の仕事もこれくらい理解があると助かるのですが・・・