本日、Dash 2020 で、私たちは Datadog プラットフォームの新製品と新機能を発表しました。これにより、エンジニアリングチームは分散アプリケーションとインフラストラクチャーの可視性をさらに深めることが可能になります。これらの追加により、Datadog は、CI/CD パイプラインでのシフトレフトテストから本番環境でのコードのプロファイリングまで、リリースサイクルのすべてのステップをさらに合理化します。また、オンコールを簡単にする Datadog モバイルアプリ、強化されたクラウドセキュリティのための Compliance Monitoring、Partners 向けのコラボレーションプラットフォームとしての Marketplace もローンチしました。こちらのまとめでは、これらの開発、そして Dash で発表したその他すべての詳細をご覧いただけます。
Incident Management
Incidents
Datadog Incident Management の登場により、チームは Datadog を使用してインシデントを簡単に作成し、通知から解決および事後分析までを追跡できるようになりました。新しい Incidents UI は、すべてのインシデントのステータスを 1 か所でレポート、監視できる場所です。重大度、顧客への影響、インシデントコマンダー、影響を受ける環境などの重要な情報を各インシデントにタグ付けします。インシデントのタイムラインは新しい情報やステータスの変更を自動的に反映し、誰でも Datadog 内からマークダウンやインタラクティブなグラフを追加できます。Incidents は、オンコールエンジニアが外出先でアラートの優先順位を付けることを可能にするモバイルアプリや、インシデント後の共同レビューのためのマルチユーザーによるライブ編集をサポートする強化された Notebooks など、他の新機能ともシームレスに連携します。Datadog がインシデントレスポンスワークフローの改善にどのように役立つかについての詳細は、こちらのブログ投稿をご覧ください。
モバイルアプリケーション
Datadog モバイルアプリが登場しました!iOS と Android のどちらのデバイスでも利用できるこのアプリがあれば、オンコールエンジニアは、どこからでも Datadog ダッシュボードとアラートに瞬時にアクセスできます。これで、PagerDuty や OpsGenie などの統合されたオンコールサービスによってページングされると、通知には関連するアプリ内 Datadog アラートへのリンクが含まれ、ここに最近の環境アクティビティの概要とインタラクティブなメトリクスグラフが表示されるため、すぐにコンテキストを読み取ることができます。ユーザーは、メトリクス相関とサービスの健全性を簡単に確認できるすべてのダッシュボードのモバイルネイティブバージョンにアクセスできます。また、アラートに関連するイベントを表示して、トリガーされた理由の全体像を把握できるため、問題の重大度をすばやく切り分け、次のアクションを簡単に決定できます。これらがすべて、ラップトップにアクセスすることなく可能なのです。
Security Monitoring と Compliance Monitoring
Security Monitoring: 調査ダッシュボード
Datadog Security Monitoring を使用すると、潜在的なセキュリティの問題と環境に対する脅威をリアルタイムで検出できます。こうした問題とそれらが発生する状況をより効果的に調査できるように、Security Monitoring 用のすぐに使える調査ダッシュボードを導入しています。このダッシュボードは、IP アドレスやユーザーなどの主要エンティティによって分類された、環境内のセキュリティの傾向を視覚化します。また、IP またはユーザーに関連付けられた HTTP アクティビティなど、より豊富なコンテキストの相関可観測性データも含まれます。このダッシュボードを使用すれば、セキュリティ状況を一目で確認できます。単一の IP に関連するいくつかのセキュリティシグナルのような異常に気づいた場合、ダッシュボードを簡単にフィルタリングして、そのエンティティの動作をさらにドリルダウンできます。
Security Monitoring: 脅威インテリジェンスの強化
私たちは、Datadog Security Monitoring に脅威インテリジェンスの強化を追加しています。脅威インテリジェンスは、取り込まれたログイベントに貴重な外部コンテキストを提供するため、セキュリティシグナルをより迅速にトリアージできます。脅威インテリジェンスは、特定のログ属性 (IP、ファイルハッシュ、URL など) が悪意のあるものか無害なものかを識別し、関連する根拠を提供します。たとえば、Datadog が潜在的な攻撃に関連する IP アドレスが既知の脆弱性を悪用していることが観察されたことを検出した場合、Datadog は結果のセキュリティシグナルに悪意ありとフラグを付けるため、この調査を優先することができます。逆に、IP が無害であることがわかっている場合は、スキャナーが収集するインテリジェンス (shodan.io など) である可能性が高く、関連するセキュリティシグナルを安全に無視できるため、アラート疲れを軽減できます。Datadog は信頼できるプロバイダーによってキュレーションされた脅威インテリジェンスフィードを維持および更新するため、ログは最新かつ正確なコンテキストで強化されます。
Compliance Monitoring
4 月に、私たちは Datadog Security Monitoring を発表しました。これを利用すると、インフラストラクチャー全体のセキュリティの脅威をリアルタイムで検出、追跡できるため、開発、運用、セキュリティチームは環境を保護するために必要な情報を得ることができます。そして、今回の Datadog Compliance Monitoring のリリースにより、本番環境の誤構成を継続的に監視し、PCI DSS、SOC 2、CIS などの厳格な業界標準およびフレームワークへのコンプライアンスを維持することができるようになりました。Compliance Monitoring は、セキュリティグループ、ストレージバケット、ロードバランサーなどの主要なクラウドリソースの状態を自動的に監視し、スタックのすべてのレベルで潜在的な誤構成とコンプライアンス違反を検出します。Datadog Agent は、サーバー、コンテナ、Kubernetes クラスターのローカルコンフィギュレーションを確認するようになりました。Agent はコンテナ化された環境のファイルシステムをアクティブに監視し、本番環境で使用できるファイル整合性モニタリング (FIM) ソリューションを提供します。そして、カスタム検出およびコンプライアンスルールにより、ユーザーは独自のクエリ言語を習得する必要なく、すぐに使用できる検出機能の範囲を拡大できます。こちらのブログ投稿を読み、こちらでベータ版にサインアップしてください。
APM & UX モニタリング
Continuous Profiler
Datadog Continuous Profiler を使用すると、本番環境でのアプリケーションのパフォーマンスを、コードを 1 行まで、最小限のオーバーヘッドで分析できます。Continuous Profiler は、スタック全体にわたって複数のタイプのプロファイル (CPU、メモリ割り当て、同時ロック、I/O など) を収集します。これらのプロファイルを検査することで、アプリケーションで最もリソースを消費するメソッドを特定して最適化し、エンドユーザーのレイテンシーとクラウドプロバイダーのコストを削減できます。また、ヒューリスティックなコード分析を自動的に実行し、パフォーマンス改善のための実用的な情報を共有するため、チームの誰もが主要な問題領域にすばやく対処できます。新しいバージョンのリリース、停止の調査、リクエスト遅延のトラブルシューティングなど、Continuous Profiler は、単一のリクエストから一連のアプリケーションに至るまで、あらゆるスコープでコードレベルのパフォーマンスの問題をデバッグするのに役立ちます。Continuous Profiler の詳細については、ブログ投稿をご覧ください。
Synthetic CI/CD Testing
Datadog Synthetic テストは堅牢ながらも簡単に作成できるため、チームの時間を節約し、アラート疲れを防ぎます。Synthetic CI/CD Testing を使用すると、既存の本番レベルの Synthetic テストを CI/CD パイプラインに統合して、不適切なマージを防止し、ロールバックを自動化し、カナリアデプロイと並行してテストを実行できます。このシフトレフトアプローチのテストは、柔軟な API エンドポイントと CLI の両方で実現できるため、すでにセットアップしたツールにシームレスに Synthetic テストを組み込むことができます。Synthetic CI/CD Testing の詳細については、ブログ投稿をご覧ください。
Error Tracking
エラーは、意味のあるコンテキストがないとトラブルシューティングが難しい場合があります。Datadog Error Tracking は、エラーを問題にインテリジェントにグループ化するため、エラーがいつ発生し、どのバージョンのコードが影響を受け、何が原因であるかを簡単に理解できます。Error Tracking では、ソースマップを使用してフロントエンド JavaScript コードを縮小し、調査すべき行を示すことで解決までの平均時間を短縮します。Error Tracking は Datadog Real User Monitoring に含まれているため、SDK をインストールしたり、コードを変更したりする必要はありません。Error Tracking の詳細については、こちらをご覧ください。
Mobile Real User Monitoring
Web 開発者やバックエンド開発者と同様に、モバイル開発者もアプリケーションのパフォーマンスとユーザーエクスペリエンスをリアルタイムで可視化する必要があります。しかし、モバイルアプリケーションはインフラストラクチャーのエッジで実行されるため、全体像を把握するのはさらに難しくなります。ところが Datadog Mobile RUM があれば、モバイル開発者はこの複雑さを乗り越え、自信を持ってアプリケーションをデプロイすることができます。Mobile RUM を使用すると、アプリのバージョン、OS、またはデバイス全体の使用状況情報を分析し、エラーやクラッシュを調査するためのエンドツーエンドの可視性を得ることができます。Mobile RUM は Datadog APM と緊密に統合されているため、チームは、問題がアプリケーション、バックエンドサーバー、またはネットワークのレベルで発生したかどうかをすばやく理解し、ユーザーのモバイルエクスペリエンスを改善するために必要な情報を得ることができます。Mobile RUM の詳細については、こちらをご覧ください。
APM Live Search
Datadog APM Live Search を使用すると、過去 15 分間のあらゆるスパンのあらゆるタグで、取り込まれたトレースを 100% 検索できます。トレースは、ユーザーが Web サイトやモバイルアプリケーションをナビゲートするときにライブでストリーミングされるため、停止またはパフォーマンス調査中にユーザーリクエストに完全にアクセスできます。インフラストラクチャー、アプリケーション、またはカスタムタグに一致するトレースをフィルタリングして、新しいバージョンのコードを本番環境にデプロイするときに、リクエスト、エラー、レイテンシーパーセンタイルのリアルタイム分析を監視します。
エコシステム
Marketplace
新しい Datadog Marketplace により、Datadog Partners は、Datadog を開発およびコラボレーションプラットフォームとして使用して、サードパーティのインテグレーションや監視ツールを含むカスタムアプリを構築し、 それを顧客や Datadog コミュニティ全体に提供できるようになりました。厳格な審査基準とフルマネージド型の請求システムに支えられた Marketplace は、Partners が監視ソリューションのスコープを拡大し、顧客に独自のインテグレーションを提供するための新しい方法を切り開きます。詳細については、こちらのブログ投稿をご覧ください。
Recommended Monitors
スマートアラートは、監視ワークフローに不可欠な存在です。アラートは、システムの問題が重大になる前に注意を喚起するものです。しかし、スタックが成長し進化する中、どの監視データが最も重要であるかが常に明確であるとは限りません。そこで Datadog は、Recommended Monitors の提供を開始しました。これは事前構成済みの、カスタマイズも可能なアラートクエリとしきい値のスイートで、ボタンをクリックするだけで、お客様は依存するテクノロジーのモニタリングベストプラクティスを実行することができます。Recommended Monitors は、当社の多くのテクノロジーパートナーの専門知識、および当社独自の経験と数多の顧客の経験に基づいているため、システムの問題が検出されないことはありません。Recommended Monitors は現在非公開ベータ版です。詳細については、こちらのブログ投稿をご覧ください。
BigPanda インテグレーション
BigPanda は、監視ツールからアラート入力を受け取り、機械学習を使用してそれを関連付け、自動根本原因分析を実行するデータ分析プラットフォームです。Datadog の新しいインテグレーションにより、パターンを明らかにして原因をより迅速に特定するために、Datadog アラートを BigPanda に送信できるようになりました。インテグレーションをセットアップすれば、Datadog は構成されたすべての Datadog アラートを BigPanda に転送して処理します。BigPanda はそれを他のアプリデータと関連付けて、サービスの変更の原因を特定します。BigPanda が相関を識別してインシデントを作成すると、イベントも Datadog にプッシュバックされます。
ログ管理
Amazon Kinesis Data Firehose
Datadog のお客様は、Amazon Kinesis Data Firehose 配信ストリームを使用して AWS サービスログを直接 Datadog に送信できるようになりました。この簡単に構成できるプロセスを通じて、ユーザーはサービスログを探索、分析して、AWS インフラストラクチャーおよびアプリケーションの状態についてより深く理解することができます。Kinesis Data Firehose からストリーミングされるログには、ソースなどの主要なメタデータが自動的に含まれるため、ユーザーはログを生成した AWS サービスをすばやく特定できます。また、Logging without Limits™ などの機能を使用して、ユーザーはすべてのログからメトリクスを分析、生成でき、必要なログのみを保存しながら、AWS サービスの傾向を明らかにして警告することができます。 開始方法の詳細については、こちらをご覧ください。
サーバーレス
ゼロインスツルメンテーションサーバーレス可観測性
Datadog は、AWS Serverless Application Model (SAM) および AWS Cloud Developer Kit (CDK) と統合して、ゼロインスツルメンテーションサーバーレス可観測性を提供できるようになりました。これらの新しいインテグレーション (および既存の Serverless Framework プラグイン) を使用すると、チームは選択した開発者向けツールを使用して、サーバーレスアプリケーションの構築、管理、トラブルシューティングの方法を合理化できます。Datadog の新しい CloudFormation マクロは、コードを変更することなく、拡張された Lambda メトリクス、トレース、ログを自動的に取り込みます。Datadog を使用してサーバーレスインフラストラクチャーを監視すると、タグによる関数の検索とフィルタリング、コールドスタートのアラート、Lambda 関数とその依存関係全体でのリクエストのフローの視覚化などを簡単に行うことができます。マクロを使い始めるには、ブログ投稿をお読みください。
スケールアップとスピードアップ
Dash 2020 では、リーダーや開発者のグローバルコミュニティが集まり、チーム、インフラストラクチャー、アプリケーションのスケールとスピードを新たなレベルに引き上げました。この仮想イベントをお見逃しの場合は、基調講演やテクニカルトークの動画をご覧になり、Zillow、Nextdoor、Wayfair などの企業が観測可能性の文化をどのように発展させているかをご確認ください。Datadog を初めて使用する場合は、14 日間の無料トライアルにサインアップすれば、今すぐすべての最新機能と製品をご利用いただけます。