women-with-surveillance-cameras_925x


クラウド利用が増え、オンプレミスでのサーバ管理するシーンも少なくなってきました。


ただ中小企業では、なかなか過去のオンプレサーバから脱却できないケースも多いと思います。
また社内に設置はしていなくても、データセンターにハウジングしている場合もあります。

これらの場合、サーバの管理は情シスがやらなければなりません。

サーバ障害は二次的ダメージが大きい

サーバ管理としては、まずアカウント作成などのルーティン作業があると思います。
当然情シスの仕事となります。

もう1つ大事なのは、サーバやネットワークの障害対応です。

ハード故障などのサーバ障害は、影響が全社に及ぶことが多いため、対応が最優先になります。


障害が起こること自体は仕方ないことです。

それよりも痛いのは、その日予定していた仕事ができなくなってしまうことです。
それによってまた仕事が遅れる悪循環。

代わりにやってくれる人がいない情シスにはサーバ障害はダメージが大きいのです。

やりたい仕事を邪魔されないために

情シスにとって、予期せぬサーバ障害は、不意に後頭部を殴られるかのような精神的に辛いダメージです。

ユーザからの連絡で障害を知った場合がまた辛いです。
情シスとして先に検知できなかったのは、恥ずべきことだと思います。


障害の予兆を察知したり、障害が起きてもすぐに対応すれば、被害は最小限に抑えられます。

そのため、サーバは毎朝必ずチェックします。

サーバで提供しているサービスが稼動しているかどうか、はもちろん確認します。
それ以外に、私がやるべきだと思う最低限のチェック項目は、

・ディスク空き容量
・イベントビューア(ディスクエラーがあると「システム」にアラートが上がります)
・RAID(マネージャソフトでの確認・ディスクランプの目視確認)
・バックアップの成否
・Pingの応答速度(データセンターにある基幹システムなどへ)
です。


下のようなチェックシートを作るのも良いと思います。

サーバ監視1

気づいたことや、設定変更したことなどもメモしておくと、後で助かります。

毎日見ることのメリット

毎日チェックをしていると、以下のようなメリットがあります。


・ベースラインがわかる
「ディスクの空き容量が圧迫されてきた!」となっても、
それが昨日今日で急に起こったことなのか、それともこの1年ずっとギリギリでやってきたのか。
それによって対応が違ってくるでしょう。

今の値が異常値かどうかの判断基準ができます。


・普段との違いに気づく
毎日見ていると、何か違いがあると気づくようになります。
画面が何か違うな、と。

それが障害のサインだったりします。


・今日やるべき仕事に安心して取り掛かれる
ユーザから「サーバ使えないんだけど」と突然言われることは、精神衛生上も良くないです。
作業中の仕事を途中で止めて障害対応していると、両方が気になって、どちらも失敗しそうになります。

朝にサーバをチェックして、今のところ障害がないとわかれば、後顧の憂い無く、今日やるべき仕事に着手できます。


・何故か安定稼動するようになる
根拠はありません(笑)

サービスが勝手に落ちて困っていたサーバも、毎日見るようになると、何故か安定稼動するようになります。



サーバの台数が多ければ、チェックを自動化するのも一つの手です。

ただ、私は今までの会社では、監視対象がほぼ10台以内だったので、その仕組みを作るのが面倒で、リモートデスクトップで入ってみたり、目視したりしてきました。

自動化するとちゃんと通知が来るかどうか気になってしまって、結局見てしまいそうだというのもあります(笑)


今後は、クラウドへの移行などで、自動化というよりは、管理対象を減らす方向で行きたいと思っています。



これまで見てきた会社を思い返すと、中小企業の情シスはハードに苦手意識を持つ人が多いです。

そんな人たちもサーバの機能はしっかり利用します。
でもハードやOSの状況は見て見ぬふりで、サーバは放置され、ほこりまみれになっていました。

関連記事:


ほこりまみれになると、余計故障の確率が高まります。
会社の移転で、いざサーバを移動しようとしたときに、ディスクのエラーランプが点灯していることに気づいたこともありました。


監視すべきサーバは、毎日少しずつでも見たほうが良いです。
ディスクのランプを目視するだけでも良いと思います。

大抵のサーバはRAID構成になっているので、1台ディスクが壊れただけなら、余裕を持って対応できます。

いくらRAIDでも1台目の故障に気づかなければ意味がありません。


盆休みで長期休暇を取っている間に、ディスクエラーが出ていることもありました。
ハードベンダーへ飛ぶはずの通知メールも、設定ミスで飛んでいませんでした。
休み明けの出社時に気づき、大事には至りませんでしたが、肝を冷やしました。

皆で時期をずらして休みを取っていたので、会社には同じ部門の人が出ていました。
でもひとり情シスなので、誰も対応してくれなかったのです。


事情を説明すると、普段は、「IT?よくわからん」という上司ですら、さすがに想像できたようです。
それ以降、ディスクランプの確認の仕方と、ベンダーの連絡先だけは、周りの人と共有するようになりました。


情シスの他の仕事もこれくらい理解があると助かるのですが・・・