拝啓 日頃は格段のご愛顧を賜り、厚く御礼申し上げます。
2020年9月11日(金)の16時頃から2020年9月14日(月)12時頃まで一部サイトIDと一部のセグメントIDでコミュニケーション施策配信が実行されていないことが判明しました。
■ 障害発生期間
2020年9月11日(金)16時ごろ ~ 2020年9月14日(月)12時4分
■ 障害の原因
2020年9月11日(金)の16時にコミュニケーション配信バッチのログ出力ファイル名を変更しました。
この改修は、ランダム文字列を取得してログファイル名に使用するという修正です。
ログファイル名は、ランダム文字列で取得していますが、ファイル名に利用できない文字列が含まれるケースが存在しました。
このケースに当たると、ログファイルが出力されずにエラーで配信自体が実行されないバグが存在しておりました。
※ログファイルのランダム文字列は各バッチ(メール、LINE、Webpush、SMS)ごとに作成されます。
■ 障害時の対処
原因の修正を12時に修正し、12時4分台のバッチは正常に動作していることを確認しました。
現在は問題なく配信されております。
■ 影響範囲
- コミュニケーション全般(メール、LINE、Webpush、SMS)
- 1ショット配信およびデイリー以上のリピート配信
※リアルタイム系のリピート配信では、次回配信時に該当エラーが発生しない場合は配信が実行されます。
■ お客様側で確認頂きたい事項
障害期間中に1ショット配信またはデイリー以上のリピート配信では配信実行されていない可能性が存在します。
お手数ではございますが、配信履歴をご確認ください。
■ 障害の検知が遅れた理由
通常、改修したプログラムを適用した場合、一定期間対象機能のモニタリングを行います。
今回も修正プログラム適用後にモニタリングして問題なく動作することを確認しておりますが、モニタリング期間中に該当のエラーが発生しませんでした。
このため、障害の発見が遅れました。
この度の障害により、ご迷惑をお掛けしましたことお詫び申し上げます。
以上