システムの安定稼働は現在の企業活動において欠かせない要素となっています。複雑なシステムでは人による監視が難しい場合もあり、システムの状態監視には監視ツールの導入がおすすめです。
この記事では、人気の監視ツールであるDatadogをわかりやすく解説します。機能やメリット、プランについても説明しているため、ぜひ最後までお読みください。
2014年 大学在学中にソフトウェア開発企業を設立
2016年 新卒でリクルートに入社 SUUMOの開発担当
2017年 開発会社Jiteraを設立
開発AIエージェント「JITERA」を開発
2024年 「Forbes 30 Under 30 Asia 2024」に選出
Datadogとはシステム監視用のSaaS
出典:Datadog公式サイト
Datadogとは2010年にアメリカで設立されたDatadog社が提供するSaaS型のシステム監視サービスです。2019年には日本法人も設立されています。
同様のサービスにはNew RelicやPrometheusがありますが、Datadogは監視できるサービスの多さや豊富な機能で人気のサービスとなっています。
Datadogの監視対象は幅広く、アプリケーションやネットワーク、サーバーに至るまでリアルタイムなパフォーマンスの監視が可能です。また、問題発生時のアラート通知やログ分析機能も備えており、システム運用の効率化の観点でも有用なツールと言えるでしょう。
何ができる?Datadogの主な機能
Datadogは監視や分析に役立つさまざまな機能を搭載しています。ここでは、各機能の具体的な仕組みや活用方法を見ていきましょう。
サーバーの監視機能
リアルタイムなサーバー監視はDatadogの主要機能の一つです。
監視対象のホストにはDatadog Agentというソフトウェアが配置されます。AgentからAPIキーを使いイベントやメトリクスがDatadogに送信され、メトリクスと基準値を照らし合わせてサーバーの状態確認がおこなわれます。
メトリクスはサーバーの応答時間や発生エラー数、負荷状況など多岐にわたり、幅広い観点での監視が可能です。
もしサーバーに異常が発生した場合、サーバー上で動くシステムにも影響し、システムが利用不可となる場合もあります。サーバー監視機能を活用すると、異常時にはアラート通知が出され即座に調査やリカバリを開始できるので、システムの安定稼働に有効です。
アプリケーションの監視機能
アプリケーションの監視にはDatadog APMと呼ばれるパフォーマンス監視ツールが使われます。ツールを使い監視対象のメトリクスが収集され、メトリクスと基準値を照らし合わせて正常に稼働しているか確認がおこなわれます。
この監視により、アプリケーション異常がすぐに検知され即座のリカバリが可能となるため、影響を小さくとどめることができるのです。
監視機能は障害検知のほかにも応用ができます。Datadog APMでは処理をトレースして応答を出力する機能があり、アプリケーションの処理を細分化して稼働状況の確認が可能です。
活用例としては異常が発生した際の原因特定やボトルネック調査が挙げられ、障害対応やパフォーマンスチューニングにも有効な機能と言えるでしょう。
リソースの監視機能
DatadogではCPU稼働状況、メモリ使用率、ディスク使用状況といったリソースの監視機能もあります。
監視にはアプリケーション監視と同様にメトリクスが用いられます。リソース監視の場合、CPUに関してだけでも稼働時間やアイドル時間、IO待機時間など豊富なメトリクスが定義され、リソースについて深い観点での情報収集と監視が可能です。
サーバーのCPU使用率が高すぎると、処理がおこなわれずシステムがクラッシュする危険性もあります。障害の閾値を低めに設定して障害を未然に防ぐなど、監視機能を活用してリソースの枯渇を防ぎましょう。
ログデータの分析・調査機能
DatadogにはDatadog logsと呼ばれるログ管理機能があり、ログ収集や管理、分析などさまざまなログに関するタスクを支援します。
クエリに基づき分析対象のログを抽出し、ログ情報を可視化して分析するなど、Datadog logsにてログ関連の一連の作業を完結できます。
また、Datadog APMではJavaやPython、Rubyなど主要言語のトレーサーが配布されており、トレーサーを有効化するとアプリケーションのトレース情報のログ出力が可能です。
Datadog logsは日常的なログ管理や障害時の原因調査、アプリケーションのトレース情報の記録などメリットが多い機能です。ログの数やボリュームが大きい大規模システムを使っている場合は特に役に立つため、ぜひ活用を検討してください。
ダッシュボード機能
ダッシュボード機能を使うと、収集したデータを分かりやすく可視化できます。
サーバーリソースやアプリケーションのパフォーマンスなど、自分が表示したい情報をダッシュボードに表示しておくと一目で状況を把握できます。カスタマイズは簡単で、ダッシュボード画面に自分が表示したい情報をドラッグ&ドロップするだけです。
ダッシュボード機能はさまざまな活用法があります。たとえばアプリケーションやサーバーの稼働状況をグラフとして表示すれば、異常があってもリアルタイムに検知できます。
表示できる情報は多岐にわたるため、アプリケーション担当やリソース担当などの担当業務に沿ってカスタマイズすると、業務効率の向上にもつながるでしょう。
お気軽にご相談ください!
何がすごい?Datadogのメリット
Datadogのメリットはシステム監視だけではありません。アラートや分析、他サービスとの連携など、Datadogの具体的なメリットを見ていきましょう。
あらゆるシステムを横断的に監視できる
Datadogはオールインワンで知られる監視ツールであり、異なるシステムやアプリケーション、サーバーを横断して監視できます。
オールインワンを実現するのが対応するインテグレーション数です。数は年々増加しており、2024年6月現在で700以上のインテグレーションに対応しています。
豊富なホストやシステムに対応するため、基本的に階層やアプリケーションごとに監視ツールを分ける必要がありません。そのため、ツールの導入コストやスタッフの教育コストを削減できる効果があります。
また、Datadog一つで複数サーバーやシステムを横断して調査ができ、障害時の原因調査も進めやすい特徴があります。
リアルタイムに状況が把握できる
リアルタイムな状況把握ができる点もDatadogのメリットの一つです。
サーバーの稼働状況やアプリケーションのレスポンスをダッシュボードにリアルタイム表示しておくと、サーバー異常やレスポンス遅延があった際に一目で異常が分かります。
また、障害の発生を予測できる点もメリットです。CPU使用率などをリアルタイム表示しておくことで「CPU使用が間もなく閾値を超える」と、問題が大きくなる前に気がつけます。
障害件数の減少やユーザー利便性の向上にもつながるため、うまくリアルタイムデータを活用していきましょう。
相関的にデータ分析ができる
Datadogsはシステムを横断的に監視できる特性を活かし、複数のデータを関連づけて相関的にデータ分析が可能です。
たとえば突発的にCPU使用率が上昇した原因を調べる場合、ユーザーオペレーションやプロセス異常など多くの原因が浮かびます。何から調査を始めればよいのか分からず、原因究明に時間がかかることも珍しくありません。
Datadogではサーバーやアプリケーションのログをそれぞれのメトリクスと相関付けて解析し、同時間帯に異常値を示したインフラやプロセスを特定できます。
一般的に、規模が大きいシステムほど見るべきログの数は増え、相関的な分析には時間を要します。システムが大規模である場合は特に有効な機能と言えるでしょう。
監視データの可視化ができる
Datadogではシステム使用率やログ情報など監視データを見やすく表示できます。表形式や棒グラフ、円グラフなど、情報に応じた分かりやすい表示形式を選択可能です。
データを可視化することで、その領域のエンジニア以外でも監視対象の異常を一目で察知できます。
ダッシュボードにサーバーパフォーマンス数値を表示する場合、ただ数字が表示されるよりも折れ線グラフで可視化した方がわかりやすく、利便性が向上します。
誰でも分かりやすい表示としておけばシステム異常に気づきやすくなり、システムの安定稼働につながるでしょう。
Datadogsでは大量のデータを取得できますが、見やすくなければデータは利用されません。データを有効活用するためにも、積極的に可視化の工夫をしていきましょう。
異常があった場合に通知できる
Datadogは監視対象に異常が発生した際、アラート通知で関係者に異常を知らせてくれます。
アラートの重要度は自由にカスタマイズ可能です。優先度低の障害の場合は通知せず、高の場合は緊急としてスタッフに通知するような使い方ができます。
また、Datadogでは障害検知の精緻化とノイズ削減のため機械学習が用いられています。たとえば障害の判断基準としてよく閾値が設定されますが、閾値超過が発生しやすい時間帯であったり、すぐ標準値に戻ったたりする場合は通知しないような調整が可能です。
障害が発生したが実は調査不要であった、といった誤検知は運用担当にとっては避けたいもの。機械学習によるアラート通知の活用は、誤検知の防止に役立ちます。
他社サービスとの連携ができる
Datadogはさまざまな種類の他社サービスと連携ができます。
Microsoft Teamsと組み合わせてアラート発生時にチャットで通知したり、Slackとの連携で監視対象のメトリクスグラフを確認したりできます。
他にもDatadogとMySQLとの連携によるデータベース管理、Elasticsearchとの連携によるログ管理の強化が可能です。
コミュニケーション促進やアプリケーション監視強化などサービスの種類は豊富にあります。Datadogで実現したい機能や強化したい機能がある場合は、連携可能なサービスを確認してみましょう。
運用コストを抑えられる
Datadogはクラウド上で提供されるSaaS型の監視サービスです。SaaS型のためメンテナンスや運用を自社でおこなう必要がなく、運用コストを低く抑えられる特徴があります。
また、Datadogの対応サービスの多さも運用コスト削減につながる理由です。プラットフォームや階層に関わらず幅広い監視が可能なため、場合によっては他のツールが必要なくDatadog一つで監視作業が完結します。マニュアル整備や学習コストの抑制にも効果的です。
上記の特徴から、総合的に見てDatadogは運用コストを低く抑えられる監視ツールと言えるでしょう。
Datadogの費用と機能選びのポイント
Datadogのインフラストラクチャープランには、無料・有料を含み5種類のプランがあります。表形式で各プランの費用と機能を解説するので、プラン検討の参考にしてください。
プラン | 最小料金 | 主な機能 |
Free | $0 | ・基本的なデータ収集 ・収集データの可視化 ・700以上のインテグレーションに対応 ・ダッシュボード機能 |
Pro | $18.75 | Freeプランに加え、下記機能を搭載 ・アラート ・カスタムメトリクス ・外れ値の検出 |
DevSecOps Pro | $27.50 | Infrastructure Proに加え、下記機能を搭載 ・リソース全体の継続的な構成モニタリング ・脆弱性管理 ・設定ミスの継続的スキャン |
Enterprise | $28.75 | Infrastructure Proに加え、下記機能を搭載 ・機械学習に基づいたアラート ・ライブプロセス ・高度な管理ツール ・予測モニタリング |
DevSecOps Enterprise | $42.50 | Infrastructure Enterpriseに加え、下記機能を搭載 ・インフラストラクチャ権限管理 ・ファイル整合性モニタリング ・コンテナイメージおよびホストの脆弱性管理 |
料金は1ホストあたりの月額料金で、フリープランでは最大5ホストの制限があります。
プランがアップグレードするにつれてより高度な機能が使用可能になりますが、プランを検討するにあたり注意点があります。
ここからは2つの注意点を詳しく見ていきましょう。
必要な機能に絞って選ぶ
Datadogを導入する場合、導入の目的を明確にし、何の機能が必要かを整理してからプランを選びましょう。
Datadogは機能やホストごとに費用が発生する料金体系となっているため、多くを契約しすぎると想定よりも高い料金となる可能性があります。
たとえばProで十分にもかかわらずEnterpriseを契約すると、1ホストあたり月額10ドル、日本円にして1,500円(1ドル=150円の換算レート)を余分に支払うことになってしまいます。
多岐にわたるプランがあり、プランごとに料金もさまざまです。最適なプランを選ぶためにも、必要な機能を整理してから検討しましょう。
無料トライアルを活用する
Datadogでは多くのプランに14日間の無料トライアルが用意されています。「契約後に使ってみたがイメージと違った」というギャップを避けるため、また使用する機能に見合った料金体系で契約するためにも、ぜひ無料トライアルを活用しましょう。
Datadogの特徴として、監視や分析について非常に多機能な点があります。選択肢が多くある一方、監視さえできれば良い場合には機能が過剰になってしまいます。
不要な機能が含まれると画面や操作が複雑になりシステムが使いにくくなってしまうため、無料トライアルで機能の過不足を確認して契約へ進みましょう。
不必要な機能を契約すると月額料金も高くなってしまうため、機能の過不足を確認することは適切な料金設定につながります。
Datadogは必要?システム監視サービスが求められる理由
Datadogのメリットを解説してきましたが、手動で監視をする場合など「そもそもシステム監視サービスは必要か?」と疑問を持つ方もいるのではないでしょうか。
ここでは、システム監視サービスが企業に求められる理由を解説します。
企業活動の遅延や停滞を防ぐため
メールやチャットのコミュニケーションツール、営業支援システム、会計システムなど、企業活動では多くの種類のサービスやシステムが使われています。
仮にシステムに不具合があった場合、企業活動が遅延または停止しかねません。システム監視サービスを導入すると、不具合を迅速に検知・リカバリができるため、多くのリスクを回避できます。
企業活動が停止してしまった場合、その期間の経費や人件費、成約機会の損失など損害は深刻です。安定してビジネスを継続するためにも監視サービスは必要なツールと言えるでしょう。
関係者の負担を軽減するため
システム監視サービスを導入すると、システム担当者、特に運用担当の負担を軽減できます。
具体的には、サーバーやアプリケーションをシステムが監視するため、サーバーの稼働状況やディスク容量確認など運用担当による手動の監視作業を大幅に削減できます。また、障害時にはログ分析機能を使いメトリクスが異常値のログのみ抽出するなど、効率的に原因分析ができる点もメリットです。
監視、障害リカバリ、原因調査など運用担当のタスクは幅広くあります。特に障害時は負荷が高くなりタスクが追いつかないこともあるため、Datadogのような監視サービスは負荷軽減に非常に有効でしょう。
機会損失や顧客満足度の低下を回避するため
昨今はECやデジタルコンテンツの販売、サブスクなどシステム上で成り立つビジネスが多くあります。
システムに異常があると成約機会を逃す恐れがあるほか、顧客がシステムの利用を諦めるなど、機会損失や顧客満足度の低下につながりかねません。
BtoCの場合は24時間利用が求められる場合も多く、システムが常に安定して稼働することの重要性は高まっています。システム障害時にスピーディーにリカバリでき、障害の事前検知の効果もある監視サービスは、ビジネス観点で必要なサービスと言えるでしょう。
まとめ:Datadogでセキュアなシステム環境を整備!機能や費用は慎重に検討を
本記事ではシステム管理ツール「Datadog」の機能や導入メリット、費用について解説してきました。現在のビジネスではシステムの安定稼働が重要であり、システム監視ツールの必要性も増しています。
Datadogはサーバーやアプリケーション監視だけでなく、ダッシュボード機能による分かりやすい状況把握、ログ分析による原因調査が可能です。運用業務の効率化につながるメリットが多いため、ぜひ導入を検討してみてください。
Datadogの機能や導入について質問や相談がある場合は株式会社Jiteraにご連絡ください。ITのエキスパートが回答し、貴社のビジネスを支援します。
株式会社Jiteraへ相談する