「サーバー監視とは…?」
「自社でサーバー監視はできるのだろうか…」
「サーバー監視は外注化できないのか…できれば費用をかけたくない…」
などサーバー監視についてお悩みの方も多いでしょう。この記事ではサーバー監視について解説します。
サーバー監視とは?
サーバー監視とは、サーバーにトラブルが起きないよう、また正常に稼働しているのかを監視する業務です。サーバーにトラブルが発生してしまった場合、ユーザーはアクセスできなくなるため注意しなければなりません。
サーバーは24時間稼働しているため、深夜にトラブルが発生した場合は、直接現場に駆けつけるか、リモートでアクセスしログを解析しながら復旧作業を行うことになります。
社内システムの場合、アクセスが集中するとサーバーが処理できなくなり、ダウンしてしまうこともあります。またダウンはせずとも、サーバーに負荷がかかっている状態で業務をしていると、レスポンスが低下することもあるため注意しなければなりません。
サーバーがダウンしてしまうと、進行している業務がほとんど進まなくなるため、大きな損失に繋がります。
サーバー監視は大きく分けて「異常監視」と「正常監視」の2種類があり、適切に運用する体制を整えることが必要です。サーバーのログ等を監視し、異常が起きた際のマニュアルを事前に用意し、異常事態が発生した際にすぐに対応できる準備をしておきましょう。
そもそも正常に稼働している状態を見極めることも重要です。これができなければ、サーバーの異常事態に気づくことすらできなくなってしまいます。
そもそも監視とは
監視とは、システムを構成するネットワーク、サーバー、アプリケーション、リソースの枯渇状況を監視し、システムの稼働状況をチェックすることです。
アプリケーションにて毎日行われるファイルの転送に失敗した場合や、リソースの枯渇により新しいシステムを構築できない場合など、トラブルを未然に察知することが重要です。ほとんどのシステムはログが常時出力されるため、ログを監視することになるでしょう。
サーバー監視業務とは?
サーバー運用監視の基本は、文字通り「サーバーの運用状態を監視すること」です。サーバーの監視にはさまざまな種類・方法があります。詳細については後述します。原則としてリアルタイムにサーバーが正常稼働しているかどうかを監視する業務全般を「サーバー運用監視」と呼んでいます。
サーバー監視が必要な理由
サーバー監視が必要な3つの理由について解説します。
障害の早期検知
サーバー障害の原因は様々です。ダウンしたサーバーを素早く復旧させるには、可能な限り早く障害発生を検知し、どこに原因があるのかを解析する必要があります。
サーバー監視により常に稼働状態をチェックしておくことで、現状を把握し、どのような経緯で障害が発生したのかを確認することができます。また、サーバー監視ツールのログを確認することにより素早い原因の特定が可能になります。
予防・予知
サーバーがダウンする原因は様々ですが、そもそもサーバーがダウンする前に対策を打てば、大きな損失を回避することができます。
サーバー監視を行うことでリソース不足をアラートで知ることができ、サーバーのダウンを未然に防ぐことができます。ログを確認するとエラーだけでなく警告も確認することができるため、警告のログも日頃からチェックすることが求められます。
障害の原因を特定する
サーバー障害の原因を突き止めなければ、再度同じ内容の障害が起きてしまいます。また、障害が発生した場合、ログがなければ原因を特定することができません。つまりサーバーがダウンした原因を素早く特定するためにも日頃からサーバー監視を行いログをためておく必要があるのです。
例えば、長期休暇中誰も現場にいない間に障害が発生した場合、ログをたどるしか原因を特定する手段がありません。いざという時に備えてサーバー監視を導入することは必要であると言えるでしょう。
監視の種類と項目
サーバー監視にも様々な種類が存在します。ここからは監視についての目的別の種類、および必要となる監視項目とその目的について解説します。
監視の種類
先述した通り、サーバー監視の種類は2つあります。「正常監視」と「異常監視」です。ここからはそれぞれの監視について解説していきます。
異常監視
サーバーに何らか異常が起きている場合に管理者へ通知する監視方法です。
メールやツールといったオンラインの通知や音声・ランプ点滅といったオフラインでの通知があります。例えば、サーバーのリソースが不足している場合やサーバーとの通信が切れて応答しなくなった場合など、あらかじめ指定されたメールなどに通知される仕組みです。
正常監視
正常なサーバーの稼働を常に監視する監視方法です。ピンポイントで発生する異常監視に対して、正常監視は常時行います。稼働状態のチェックには、サーバーの監視ツールが使用されています。
監視項目
正常監視、異常監視をするにあたって、必要となる項目について解説していきます。
ログ監視
ログ監視とは、サーバーで実施された全ての挙動を記録したログを監視することをいいます。
ログの多くは決められた記述形式で指定された期間、指定されたフォルダにテキスト形式のファイルとして保存されます。保存されたログを確認することで「いつ、誰が、何をしたか」を確認することができます。一定期間たつと自動的に消去されたりする場合もあるため注意が必要です。
ハードウェア監視
サーバーを構成するハードウェアを対象に監視する機能です。
主に温度や電圧、ファンに異常がないかなど、故障の監視を行います。ハードウェアの状態に変化があった場合はその情報をログに出力したり、事前に設定した宛先にメールが届くようにします。ハードウェアに関する障害をいち早く検知することでデータの損傷を防ぐことができます。
死活監視
死活とはサーバーが停止している状態のことを指します。
死活監視とは、サーバーが停止せずに正常に稼働しているか監視する機能の事です。死活監視では主にPing値が使用されます。Ping値とは通信にかかる時間を表す数値のことで、よくPingが通る、通らないなどと言われます。Pingが通る状態というのはネットワークに繋がっている状態のことを指します。
確認したい機器やサーバーにパケットを送信し、対応機器からリターンが帰って来ればPingが通っており問題ありません。しかし帰ってこなければPingが通っておらず、問題ありと判断されます。
トラフィック監視
通信回線上に流れる単位時間あたりのデータ量をトラフィックといいます。
例えば、Webの分野ではサイトへのアクセス数が増えることを「トラフィックが増える」と表現します。チケットの販売サイトやライブ配信など特定の時間にアクセスが集中する際にトラフィックが集中しやすくなります。
トラフィック監視では、トラフィック転送量を把握するだけではなく、状態の帯域幅で十分か、サーバーリソースの拡張や設備増強は必要かなどについて判断できます。また、Webサイトのサーバーに対して大量のトラフィックを送りつけるDos攻撃の検知も可能です。
アプリケーション監視
サーバー内で動作するアプリケーションを監視します。異常終了や応答時間などアプリケーションの稼働状態に関する監視を行います。アプリケーションを運用していく上で問題が発生した場合は、出力されたログを確認します。
ログ監視
サーバー監視ツールの中には、ログ監視機能が実装されているツールもあります。しかしあくまでも監視するだけの機能です。ログを収集して細かく分析したり、グラフにする機能等は備わっていないため、ログ管理ツールの導入を検討してみてください。
パフォーマンス監視
サーバーのCPU、ディスク、メモリの使用率などを監視する機能です。
リソースにどれくらい余裕があるのかを正確に把握しておかないと、高負荷状態を引き起こし、やがてサーバーダウン、システムダウンに繋がってしまいます。パフォーマンス監視を行うことでリソース不足になる前にリソースの容量を確保し、大きなトラブルに発展することを防ぐことができます。
オンプレミスとクラウド:監視手法や項目の違いは?
オンプレミス型のサーバーとクラウド型のサーバーの監視における大きな違いは物理的な障害の有無です。オンプレミス型のサーバーであれば、ハードであるサーバーに熱がこもってしまったり、地震などで倒れてしまったりすると当然サーバーの障害が発生します。それに対してクラウド型のサーバーであればそのようなハードウェアの障害を考える必要がありません。
またクラウド型サーバーでは、ハードウェアの保守はクラウド事業者が行うため、ハードの監視をする必要がありません。
※関連記事
オンプレミスとは?メリット・デメリットやクラウドとの違いを解説!
クラウド移行とは?その種類やメリット、デメリットを徹底的に解説
サーバー監視の主な手法
サーバー監視は、監視を自社で行う手法と、監視を外部委託する2つの手法があります。それぞれの特徴について説明していきます。
自社で行う方法
サーバー監視を担当する人材を自社に確保し、社内で監視を完結させる方法です。専用の監視サーバーを用いるのが一般的。
サーバー監視は専門知識が必要であるため、自社で確保したサーバー監視担当者の経験が乏しい場合は可能な限りシンプルで使いやすい監視ツールを選ぶことが重要となります。
外部委託
サービスは基本24時間365日稼働していますが、その監視を自社で完結させるのは容易ではありません。しかし、サーバーの監視はサービスを提供している企業にとって必要不可欠な業務です。現在多くの企業は自社のシステムで使用しているサーバーの監視を専門的な事業者に外部委託しています。
自社にサーバー監視の専門知識がなくても、人員をさかなくてもシステムを運用できるのが魅力です。また、業者によっては監視だけではなく障害発生時のトラブル対応を行なっているケースもあります。
複雑化しているサーバー監視は外部委託がおすすめ
専門知識を持たない未経験の人員が24時間365日サーバーを監視するのは危険ですし、コストとリターンが釣り合っていません。
現にサーバー監視は専門性がある外部に委託することが主流になってきています。もし自社サービスのサーバー監視を外部に委託せずに自社で行なっている場合は、外部に業務を依頼することをおすすめします。業者によってサービス内容も費用も変わってきますので、よく調べてから依頼するようにしてください。
まとめ
この記事で説明してきた内容をまとめると以下のとおりです。
-
- サーバー監視の概要について
- サーバー監視の種類
- サーバー監視の主な手法
サーバー監視は重要な業務であるため、確実に行う必要があります。サーバー監視を専門的に行なっている企業にサーバー監視を外注化すれば、安全確実なサーバー運用を実現させることができるでしょう。
株式会社エイチビーラボでは、ベトナムに特化したオフショア開発サービスを提供しております。サーバー監視には豊富な実績があります。クラウドやITインフラ、システム関連でお困りの方は、ぜひお気軽にお問い合わせください。ご相談から、開発、運用まで親身にサポートいたします。