Douglas

Douglas の DevOps チームが Akamai DataStream でほぼリアルタイムの可視性とモニタリングを実現

DataStream は当社の DevOps が俊敏性を獲得するために足りないものを補ってくれました。当社のように変化の激しい E コマース開発ショップには俊敏性が不可欠です。

テクノロジースペシャリスト , e コマース IT , Douglas

オンラインビジネスの拡大を目指す

1821 年に創設された Douglas は、24 か国にまたがるヨーロッパの小売市場に美容製品および化粧品を提供している大手サプライヤーです。2,400 店の実店舗に加え、オンラインショップやモバイルアプリケーションを通じて 50,000 点を超える商品を提供しています。

売上は数十億ドル規模にのぼりますが、ここ数年は、高級化粧品チェーンや、割引価格で販売する安売り店、ドラッグストア、オンライン小売店との激しい競争に直面しています。多くの小売店と同様、実店舗の運営費が大きいため、価格低下による利ざやの圧縮が始まっています。店舗の賃料と人件費に莫大な費用がかかることが大きな問題であり、売上が縮小していけば、この問題はすぐに悪化する可能性があります。そのため、Douglas はオンライン収益を戦略的に拡大する必要に迫られていました。

ダウンタイムがもたらす大きな損失

オンラインビジネスの拡大に伴い、Douglas は毎日数回、新しいコードと設定のプッシュが必要となっていました。高速での処理には中断がつきものです。あるとき、コードリリースによっていくつかの社内リンクが破損し、サイトへの訪問者と検索エンジンクローラーに HTTP 404 エラーが発生しました。

不運なことに、この状態を運用チームが発見するのには時間がかかりました。リアルタイムのデータ取得ができていなかったためです。このようなダウンタイムは、SEO や検索エンジンの表示にマイナスの影響を及ぼすため、収益とブランドの両面で大きな損失となります。

DevOps チームは、エンドユーザーのブラウザーアクティビティとトラフィックを監視するために、分散型の追跡および顧客分析ツールとしてアプリケーションパフォーマンス監視(APM)ツールを使用しています。ただし、このデータはビジネスに関する知見を対象としたものか、または JS タグを使用した選択的なページ計測に制約されます。DevOps チームはもう 1 つ深いレイヤーの HTTP ログにより、エラーを迅速に発見、追跡、修正する必要がありました。また、CDN に対応したミドルマイルなど、同社のテクノロジースタックのあらゆるレイヤーをリアルタイムで可視化することも必要でした。

Douglas のような企業は、ネットワークのエッジで発生していることをリアルタイムに把握し、その情報を包括的なシステム健全性モニタリングビューに取り込み、スタックの他のレイヤーからのログフィードと統合する必要があります。企業がコンテンツとアプリケーションのロジックを、輻輳が生じるオリジンからエッジへと移動していくにつれ、このような可視性と制御能力はますます不可欠なものとなります。

リアルタイムの可視化の獲得

Akamai の DataStream を使用することで、Douglas の DevOps チームはエラーを即座に追跡し、修正できるようになりました。具体的に言えば、リアルタイムのログデータにプログラムでアクセスできるようにして、開発および運用のワークフローの高速化と合理化を実現したのです。DataStream は、エラーの迅速な発見と平均回復時間の短縮を可能にするだけでなく、Douglas が徐々に導入しようとしている俊敏な DevOps モデルの基盤も提供します。

継続的なモニタリング

Douglas は、Push API を活用し、拡張可能な低コストのサーバーレスアーキテクチャを運用することで、データ用の API を永続的にポーリングするサーバーが不要になりました。ログの収集は DataStream を使用し、処理パイプラインを通じて 6 つの生ログストリームをそれぞれのクラウド・ストレージ・バケツにプッシュする方法で自動的かつ定期的に実行されます。Douglas はこれと同時に、データストリームのオンとオフを個別に切り替えるために必要な制御機能も手に入れました。ログが事前処理され、HTTP ステータスコードが 300、400、500 のレベルで集約されると、オペレーターは異常について通知を受けることができます。

事前および事後のモニタリング

新たなデプロイ後は特にコード破損のリスクが高くなります。DataStream、または Kinesis などのサードパーティの分析システムからの集約ログは CloudWatch、Athena、Grafana などのダッシュボードやアラートツールに接続されます。集約指標が通常とは異なるエラーパターンを示したり、異常アラートがトリガーされると(エラー数が、事前定義されたしきい値を超えた場合など)、ほぼリアルタイムにオペレーターに通知されます。オペレーターは生のログを取得して原因を調査し、スタックの他のレイヤーの異常前のデータと関連付けます。異常スコアリングやパターン検知も可能です。生ログと集約ログの両方が短期のデータバッファとして、および履歴分析用の長期ストレージとして保存されます。

部門の枠を超えた可視性

Douglas は、ログに便利な修飾子(つまり URL パターン ID または User Agent)を付加する方法で詳細なカスタムダウンストリーム集約を可能にする独自の分析エンジンを使用しています。これらの修飾子は、ページグループ別のログの分類に役立つため(商品ページ、検索ページ、カテゴリーページなど)、ログは開発チームの該当するコードオーナーに渡すことができ、適切な人に意味のあるアラートを提供できるようになっています。現在は、開発と運用の両方のチームが同じくほぼリアルタイムの可視性を得ることで、DevOps の俊敏性が増しています。

エンドツーエンドの可視性

Douglas は、DataStream からのデータを APM や顧客分析システムと結合し、相関させる方法を模索しています。そうすることで、同社のチームはサイト訪問者のブラウザーアクティビティを、バックエンドシステムがそれにどのように応答したか、またはしなかったのかということと関連付けることが可能になります。このケースでは、DataStream はキャッシュから何が提供されたかと、オリジン、エッジ、エンドユーザー間のレイテンシーを示します。この知見によって、運用チームは即座に効率的にエラーを修正し、ビジネス価値を最大化するように CDN パフォーマンスを調整できます。

Douglas のオンライン小売 IT テクノロジースペシャリストは、「開発と運用の両方のチームがほぼリアルタイムにエラーを確認し、すぐに対応して緩和できるので、ダウンタイムの発生を最小限に抑えられるようになりました」と結論付けています。

Douglas について

ヨーロッパの大手高級美容小売企業である Douglas は、ヨーロッパ 24 か国で 2,400 店の実店舗を展開し、オンライン店舗も急成長中です。2017/2018 会計年度の売上は、33 億ユーロでした。約 20,000 人の Douglas の美容アドバイザーは日々、お客様がより美しく幸せになるよう努めています。Douglas は、香水、化粧品、スキンケア、栄養補助食品、アクセサリーの分野で、650 を超えるブランドから約 50,000 点の質の高い商品を提供しています。同社にはヨーロッパ最大規模の顧客ロイヤルティプログラムがあり、ビューティーカードを持つ顧客は約 4,000 万人にのぼります。Douglas は、その的確なアドバイスと独自のサービスにより、実店舗もオンラインサイトもビューティ市場で高い知名度を確立しています。

Akamai について

Akamai は世界中の企業に安全で快適なデジタル体験を提供しています。Akamai のインテリジェントなエッジプラットフォームは、企業のデータセンターからクラウドプロバイダーのデータセンターまで広範に網羅し、企業とそのビジネスを高速、スマート、そしてセキュアなものにします。マルチクラウドアーキテクチャの力を拡大させる、俊敏性に優れたソリューションを活用して競争優位を確立するため、世界中のトップブランドが Akamai を利用しています。Akamai は、意思決定、アプリケーション、体験を、ユーザーの最も近くで提供すると同時に、攻撃や脅威は遠ざけます。また、エッジセキュリティ、ウェブ/モバイルパフォーマンス、エンタープライズアクセス、ビデオデリバリーによって構成される Akamai のソリューションポートフォリオは、比類のないカスタマーサービスと分析、365 日/24 時間体制のモニタリングによって支えられています。世界中のトップブランドが Akamai を信頼する理由について、www.akamai.comblogs.akamai.com および Twitter の @Akamai でご紹介しています。全事業所の連絡先情報は、www.akamai.com/locations をご覧ください。