Datadog のアプリケーションパフォーマンス監視 | Datadog

Datadog のアプリケーションパフォーマンス監視

外形監視、分散トレース、一元的なログ管理、細かな粒度のメトリクスのすべてを単一のプラットフォームで使用でき、エンドユーザーに影響を与える問題を、すばやく検出、診断、解決します。

登録にかかる時間はわずか30秒。クレジットカードは不要です。

登録にかかる時間はわずか30秒。クレジットカードは不要です。

case-studies/resources_nttdocomo_casestudy

「クラウドでの開発と運用を進めるなか、Datadogを導入した目的 は統合監視ツールで様々な事象を関連付けて分析することです。 可観測性が上がり、問題の切り分けから対応までが迅速化するだ けでなく、開発者はAPMでただちに性能試験もできて、ボトルネ ックをすぐ発見できる。我々はビジネスロジックに集中し、アジ リティを高めたい。そうした要件があるなかDatadogはSaaSで提 供されているので運用負荷が低く、マルチクラウドにも対応し ているところがよかった。」

株式会社NTTドコモ

サービスデザイン部 第三クラウド推進

担当部⻑ 三井 力 氏


課題

かつて現場では、開発と運用間のコミュニケーションに課題があった。トラブルの切り分けに時間が かかっていた。運用で問題が起きたらすぐに解 決したかった。

Datadog による効果

Datadogは様々な事象を関連付けて分析ができて、可観測性が高まり、対処までの時間を短縮できる。ダッシュボードの表現力、使い勝手、人気ランキングが表示されるなどの機能がメンバーを魅了し、有益なダッシュボードが次々と生まれた。DatadogがSaaS型で運用負荷が低く、マルチクラウド対応しているところもよかった。

case-studies/resources_ikyu_casestudy

「システムの健全性を把握するために必要な情報(メトリクスやログ)が散在していたため、異常発生時には複数のツールにまたがり原因を探す必要があり、職人技と運が必要でした。また、リリースのタイミングでパフォーマンスが落ちることがあり、クエリーやロジックをレビューするなど試行錯誤していました」

植竹 剛人 氏

CISO 兼データサイエンス部 部⻑ 兼CTO室 エンジニア

株式会社 一休


課題

メトリクスやログなどあちこちに情報があり、障害が起きたときにどこに問題があるのか職人技で探す必要があった。リリースのタイミングでパフォーマンスが落ち、サイトがタイム・アウトしてユーザーから見えないこともある。最優先の課題は、リアルタイムな統合モニタリングでエンドユーザーが気づく前に問題を解決可能になることでした。

Datadog による効果

システムのクラウド移行に伴い、SaaS型で運用負荷が少ない監視ツールを探したところ、Datadogが目についた。メトリクスが豊富で、ダッシュボードから必要な情報を一覧できて、Slackとの連携しやすいさなどが魅力だった。【問題対処を迅速化】プロダクト開発が責任をもって運用までおこなっている。インフラや外形監視でほぼリアルタイムで通知を受け、APMで問題解決とシームレスに対応ができるようになった。【デプロイが10倍以上に】2週間に1度だったデプロイをDatadog導入とともに自動化を進めた結果、1日数回へと大幅に頻度を上げられた。

case-studies/resources_softbank_casestudy

「Datadogを活用したDevOps基盤が構築できて、豊富なモニタリングとコスト最適化が実現できました。Datadogはマルチクラウドを意識することなく可視化できて、アプリとインフラ担当の共通言語となっています。今後はセキュリティ強化にも役立てていきたいと考えています」

ソフトバンク株式会社

コアネットワーク本部

クラウド基盤R&D統括部 クラウドネイティブ技術部

担当部⻑

山根 武信 氏


課題

ビジネスニーズの変化はめまぐるしく、開発現場は度重な る仕様変更に翻弄されていた。 そこで2018年、仕様変更に柔軟かつ素早く対応するため、アジャイル開発とDevOps環境構築に乗り出した。開発サイクルを加速させるためには、 DevOps環境における運用監視作業の省力化はもちろん、開発の様々な場面で可視化を実現する必要があった。

Datadog による効果

新たに構築したアジャイル開発 とDevOps基盤はクラウドのコン テナ Kubernetes環境なので、そ れまで使用していた監視ツール では不向きだった。コンテナに 対応した監視ツール各種で比較 したところ、Datadogは構築工 数やオンプレ連携、必要な機能 が揃い管理工数を低く抑えられ る統合ツールだったため採用。 開発から運用まで、あらゆる段 階で幅広く可視化できるのも大 きなメリットとなった。

case-studies/resources_assetforce_casestudy

「取れる指標でなく、「人」を中心に通知を設計したことがDatadogの導入成功の鍵でしょう。適切な人に、次のアクションに繋がる情報を緊急度に応じた媒体で伝えることが重要です。通知が多すぎると、人は慣れて無視されて、肝心なときに役に立ちません。」

三井住友ファイナンス&リース株式会社

デジタル開発室 リードスペシャリスト 森本 悠太 氏


課題

三井住友ファイナンス&リースグループは、短期間でモニタリング環境を構築して、開発と運用を一体化し、システムの稼働を安定させる必要がありました。

Datadog による効果

三井住友ファイナンス&リースグループは、短期間でのモニタリング環境導入のため、シンプル、必要な機能を最初から使える、初期設定のまますぐに使えるダッシュボード、APIで細かくTwillioの通知フローを設定できる、機密性が高いログの除外に対応しているという 5つの理由からDatadogを選定しました。

多くの企業で愛用され信頼を得ています

Samsung logo Ubisoft logo Deloitte Cloud logo Cybozuinc logo sansan logo Nginx logo Chef logo Nasdaq logo DreamWorks Animation logo Nikon logo Zynga logo Evernote logo Sonos logo Monotaroco logo

製品のメリット

エンド・ツー・エンド・モニタリングで複雑なITをシンプルに

  • ユーザーとのインタラクションからバックエンドのストレージまで、アプリケーション・アーキテクチャのあらゆる側面を1つのプラットフォームで監視
  • エンドツーエンドのアプリケーショントレース、レイテンシーブレイクダウン、継続的なプロファイリング、リアルユーザーモニタリングにより、ボトルネック、エラー、高トラフィック問題、動作の遅いクエリなどを容易に特定可能
  • 可用性、応答時間、信頼性、エラー率、スループットなど、粒度の高いデータやカスタムメトリクスをリアルタイムに自動収集、監視、可視化。

アプリケーションのパフォーマンス問題をより迅速に解決

  • リアルタイムのサービスマップ、AIを活用した外形監視モニター、レイテンシー、例外、コードレベルのエラーなどのアラートで、重要な問題を迅速に特定
  • トレースIDの自動インジェクションにより、ログやトレースをコンテクストで表示
  • アプリケーションのイベントを時間同期されたメトリックスグラフに重ね合わせて、数秒で仮説を検証

コードレベルのパフォーマンスを容易に最適化

  • 使いやすく常時稼働する軽量な次世代プロファイラーにより、アプリケーションで最もリソースを消費するメソッドやクラスを数秒で検出します。
  • CPU、ガベージコレクション、ロックコンテンション、I/Oに費やされた時間のメソッド別内訳からコードの問題の根本原因を特定し、CPU使用率、メモリ割り当て、ユーザーレイテンシーを改善します。
  • クエリ言語を習得または使用せずに、すべてのログを分析できます。
  • スレッドのデッドロック、ガベージコレクション、メモリリークなど、ランタイム性能の問題を表面化させます。
apm/gif-3-code-level-visibility.png

ツールのスケーリングとメンテナンスの時間を短縮

  • スタックが複雑化するにつれて増大するオープンソースツールのスケーリングとメンテナンスの時間を短縮します。
  • 一般的なフレームワークおよびライブラリについて、アプリケーションを自動的に計測します。
  • プラットフォーム全体でタグ付けが自動化および統合されるため、あらゆる視点で問題を効率的に分析できます。

分散アーキテクチャの可視性を高める

  • リアルタイムのサービスマップを使用して、すべてのサービス、サーバーレス関数、アプリケーションの相互依存性の現在の状態を重要な可視性として把握できます。
  • ワンクリックで単一サービスのビューを分離して、サービス障害を簡単に調査
  • コードレベルとサービスレベルのパフォーマンスの問題に対してカスタマイズ可能なアラートで、すべてのサービスの健全性を効率的に監視し、可視化します。

重要な問題のみアラートを受信し、誤検出を排除

  • 日・週・季節の変動を考慮した異常値・異常値のアラート設定
  • 指標予測に基づくアラートにより、障害やエラーを未然に防止
  • ブーリアンロジックに基づく複合アラートを作成し、偽のアラートへの対応時間を短縮
  • Watchdogで予期せぬ異常値、アノマリー、エラーを自動検知
products/alerts/watchdog-machine-learning-alerts.jpeg

Datadogを始める5つのステップ

ステップ1
トライアル登録フォームに入力 わずか30秒で無料でアカウントを作成。クレジットカードは不要
ステップ2
技術スタックに関する基本的な質問に回答 約1分で完了
ステップ3
Datadog エージェントをインストール システムレベルのメトリクスをDatadogプラットフォームに送信
ステップ4
API経由で追加のメトリクスを取得するための認証情報を提供 AWS、Azure、GCPなどのクラウド環境を完全に可視化
ステップ5
すぐに使えるダッシュボードでパフォーマンスを視覚化 環境全体のパフォーマンスをリアルタイムで確認可能

クラウド時代に不可欠なモニタリングとセキュリティのプラットフォーム

Datadogは、エンドツーエンドのトレース、メトリクス、ログを統合し、アプリケーション、インフラストラクチャ、サードパーティ・サービスを完全に可観測にします。

Platform Diagram

なぜDatadogなのか?

すぐに使えるダッシュボード

セットアップ後すぐに、データがロードされ調査がはじまります


Watchdogによる異常の自動検出

Watchdogを利用することで設定や操作なしに、自動で環境の異常を発見します


800以上の統合機能

Datadogがサポートする統合機能で、任意のテクノロジーを幅広くカバーします。


各業界大手で実証済み

様々な業界のFortune 100の大企業が、Datadogを信頼しています