約1,100万人の会員が利用する日経ID基盤速やかなエラー検知でトラブルを解消
同社では、日経ID基盤のアプリケーション監視においてもDatadogを活用している。日経IDは日経電子版をはじめ、日経グループのサービスを利用する際に利用するIDのことで、会員数は約1,100万人の規模。当初はオンプレミス環境で日経ID基盤を運用していた。監視ルールの追加設定においてアプリケーションチームが管理チームに申請する必要があったため、対応に時間を要していた。
ハードウェアの更新を機に日経ID基盤のAWS移行が決まり、監視環境もクラウドネイティブなDatadogに移行することになった。プラットフォーム推進室 プラットフォームグループの奥田和史氏は「別のチームで利用していたメンバーから使いやすいという話があり、日経ID基盤の開発者の中にも利用したことがあるメンバーがいたことからDatadogの採用が決まりました。AWSとの連携機能が豊富なことも評価が高かったようです」と語る。
AWSへの移行後、Datadogによる日経ID基盤のアプリケーション監視は2020年よりスタート。現在は、日経ID基盤の開発メンバー約10名が、ログの収集、モニタリング、PagerDutyやSlackと連携したエラー検知、パフォーマンス監視で活用している。
「監視対象がWeb APIのアプリケーションサーバーということもあり、Datadogの標準ログにユーザーIDやアクセスログなどを紐付け、APIで実行する一連のトランザクションを追跡できるようにしています。パフォーマンス監視はエラー検知時が中心で、大きなニュースでアクセスが急増した際にも利用しています」(奥田氏)
BtoB向けサービスと日経ID基盤でDatadogを活用している同社において、ともに導入メリットとして複数のプロダクトの少人数監視、統合監視による生産性の向上、障害検知から対応までの時間短縮を挙げている。村田氏は「BtoB向けサービスが急成長していく中で、SREチームのメンバーを増やすことなく複数のサービスの運用が可能となり、コストと負荷の増加を抑えながら安定的な運用が実現しています」と語る。奥田氏は「日経ID基盤はオンプレミスの時代と比べて、エラーへの対応が圧倒的に早くなりました。PagerDutyやSlack経由で通知が届き、Datadogを確認することでほぼすべての原因調査ができるため、早いものであれは5分程度で対応が完了します。監視のルール設定も外部に依頼することなくエンジニアが主導権を持ってスピーディーに対応できるようになりました」と語る。
今後について、BtoB向けサービスについては、開発チーム全体で活用レベルを高め、さらなる運用の高度化を目指す考えだ。「SREチームはDatadogの新しい機能を試したりしながら、積極的に活用している一方、サービス開発チームは、チームによって温度差があるため、全体のレベルを底上げできるように環境の整備を進めていきます」(村田氏)
日経ID基盤については、Datadogで安定運用を図りながら、ユーザー体験の向上に向けてフロントエンドのアプリケーションにも監視範囲を拡大していく方針だ。「ここ1年で開発範囲がフロントエンドまで拡大していることもあり、リアルユーザーの視点からアプリケーションのパフォーマンスを把握するDatadog RUMを活用してUXをモニタリングしていきます」(奥田氏)
Datadogのサポートについては、日本語ドキュメントや最新機能の提供を評価した。今後についてはユーザーの利便性を高めるための機能整理や新人開発メンバー向けの教育プログラム等にも期待を寄せている。
エラーへの対応が圧倒的に早くなりました。 PagerDutyやSlack経由で通知が届き 、 Datadogを確認することでほぼすべての原因調査ができるため、 早いものであれは5 分程度で対応が完了します。
奥田 和史 氏
株式会社日本経済新聞社
プラットフォーム推進室
プラットフォームグループ