- Authors
- Name
- 들어가며
- 장애 대응 핵심 용어 정리
- 장애 발생 시 긴급 커뮤니케이션
- 격식체 vs 일상체 비교
- 장애 대응 실전 대화 시나리오
- 포스트모템(振り返り) 회의 표현
- 장애 보고서 작성 표현
- 한국인이 자주 하는 실수
- 운영 시 주의사항
- 장애 대응 시 유용한 정형 표현 모음
- 실전 연습 체크리스트
- 참고자료

들어가며
일본 IT 기업에서 근무하는 엔지니어에게 **장애 대응(障害対応)**은 피할 수 없는 핵심 업무다. 장애가 발생하면 기술적 역량만큼이나 일본어로 신속하고 정확하게 상황을 공유하고 보고하는 능력이 요구된다. 한국어로는 자연스럽게 할 수 있는 장애 보고도, 일본어로 하려면 적절한 경어와 전문 용어를 구사해야 하므로 한국인 엔지니어에게는 큰 부담이 된다.
특히 장애 상황에서는 시간에 쫓기면서 에스컬레이션 보고, 상태 업데이트, 복구 보고 등을 해야 하므로, 미리 핵심 표현과 템플릿을 익혀두는 것이 필수적이다. 또한 장애 해결 후에는 振り返り(ふりかえり, 회고) 회의에서 원인 분석 결과를 발표하고 재발 방지책을 논의해야 한다.
이 글에서는 장애 발생 감지부터 에스컬레이션, 상황 보고, 복구, 그리고 포스트모템 회의까지 IT 장애 대응의 전 과정에서 사용하는 일본어 표현을 체계적으로 다룬다.
장애 대응 핵심 용어 정리
장애 발생 단계 용어
장애 대응 과정에서 각 단계별로 사용되는 핵심 일본어 용어를 정리한다.
| 일본어 | 읽기 | 한국어 | 사용 맥락 |
|---|---|---|---|
| 障害(しょうがい) | しょうがい | 장애 | 시스템 장애 전반을 가리키는 표현 |
| 障害検知(しょうがいけんち) | しょうがいけんち | 장애 감지 | 모니터링 시스템이 이상을 감지한 상태 |
| 障害発生(しょうがいはっせい) | しょうがいはっせい | 장애 발생 | 장애가 발생했음을 공식적으로 선언 |
| 一次対応(いちじたいおう) | いちじたいおう | 1차 대응 | 초기 대응 단계를 가리키는 표현 |
| エスカレーション | エスカレーション | 에스컬레이션 | 상위 담당자나 관리자에게 보고·이관 |
| 切り戻し(きりもどし) | きりもどし | 롤백 | 이전 버전으로 되돌리는 작업 |
| 暫定対応(ざんていたいおう) | ざんていたいおう | 임시 대응 | 근본 해결 전의 임시 조치 |
| 恒久対応(こうきゅうたいおう) | こうきゅうたいおう | 항구 대응 / 영구 대응 | 근본 원인을 해결하는 영구적 조치 |
| 復旧(ふっきゅう) | ふっきゅう | 복구 | 서비스를 정상 상태로 되돌림 |
| 正常稼働(せいじょうかどう) | せいじょうかどう | 정상 가동 | 시스템이 정상적으로 작동하는 상태 |
원인 분석·포스트모템 용어
| 일본어 | 읽기 | 한국어 | 사용 맥락 |
|---|---|---|---|
| 原因究明(げんいんきゅうめい) | げんいんきゅうめい | 원인 규명 | 장애의 근본 원인을 조사하는 과정 |
| 根本原因(こんぽんげんいん) | こんぽんげんいん | 근본 원인 (Root Cause) | RCA에서의 근본 원인 |
| 影響範囲(えいきょうはんい) | えいきょうはんい | 영향 범위 | 장애가 영향을 미친 범위 |
| 再発防止策(さいはつぼうしさく) | さいはつぼうしさく | 재발 방지책 | 동일 장애 재발을 막기 위한 대책 |
| 振り返り(ふりかえり) | ふりかえり | 회고 | 포스트모템 회의 |
| 障害報告書(しょうがいほうこくしょ) | しょうがいほうこくしょ | 장애 보고서 | 공식 장애 보고 문서 |
| タイムライン | タイムライン | 타임라인 | 장애 발생부터 복구까지의 시계열 기록 |
| 是正措置(ぜせいそち) | ぜせいそち | 시정 조치 | 문제를 바로잡기 위한 조치 |
장애 발생 시 긴급 커뮤니케이션
장애 발견·보고 표현
장애를 처음 발견했을 때 Slack이나 전화로 보고하는 표현이다.
【Slack 긴급 보고 예시 - 격식체】
@channel 【障害発生】本番環境のAPIサーバーにて異常を検知しました。
発生時刻:2026-03-11 14:30 JST
事象:APIレスポンスタイムが通常の10倍以上に悪化
影響範囲:全ユーザーのログイン機能
現在、一次対応として原因調査を開始しております。
状況は随時アップデートいたします。
(@channel [장애 발생] 본번 환경의 API 서버에서 이상을 감지했습니다.
발생 시각: 2026-03-11 14:30 JST
사상: API 응답 시간이 통상의 10배 이상으로 악화
영향 범위: 전체 사용자의 로그인 기능
현재 1차 대응으로서 원인 조사를 개시하고 있습니다.
상황은 수시로 업데이트하겠습니다.)
【Slack 긴급 보고 예시 - 간결체(팀 내)】
@here やばい、本番のAPIが死んでる。
レスポンスタイムが爆上がりしてて、ログインできない状態。
今から調査入るから、手空いてる人ヘルプ頼む!
(@here 큰일이다, 본번 API가 죽었어.
응답 시간이 폭증해서 로그인이 안 되는 상태야.
지금부터 조사 들어갈 테니, 손 비는 사람 도움 부탁해!)
에스컬레이션 표현
상위 관리자에게 에스컬레이션할 때의 표현이다.
【전화/긴급 에스컬레이션 예시】
A: 「お疲れ様です。○○チームの金です。
本番環境で重大な障害が発生しましたので、ご報告いたします。
14時30分頃より、全ユーザーのログイン機能が停止しております。
影響範囲が広いため、エスカレーションさせていただきました。」
B: 「了解しました。現在の状況を教えてください。」
A: 「はい。現在、APIサーバーのレスポンスタイムが通常の10倍以上に
悪化しており、タイムアウトが多発しております。
原因としてはデータベースのコネクションプールの枯渇が疑われますが、
まだ確定しておりません。
暫定対応として、まずサーバーの再起動を検討しております。」
B: 「わかりました。暫定対応を進めてください。
30分ごとに状況をアップデートしてください。」
(A: 수고하십니다. ○○팀의 김입니다.
본번 환경에서 중대한 장애가 발생하여 보고 드립니다.
14시 30분경부터 전체 사용자의 로그인 기능이 정지되고 있습니다.
영향 범위가 넓어 에스컬레이션하게 되었습니다.
B: 알겠습니다. 현재 상황을 알려주세요.
A: 네. 현재 API 서버의 응답 시간이 통상의 10배 이상으로
악화되어 타임아웃이 다발하고 있습니다.
원인으로는 데이터베이스 커넥션 풀 고갈이 의심되지만
아직 확정되지 않았습니다.
임시 대응으로 우선 서버 재기동을 검토하고 있습니다.
B: 알겠습니다. 임시 대응을 진행해 주세요.
30분마다 상황을 업데이트해 주세요.)
경과 보고 (상황 업데이트) 표현
장애 대응 중 정기적으로 보고하는 표현이다.
【30분 경과 보고 예시】
@channel 【障害続報】14:30発生のAPI障害について続報です。
■ 現在の状態:サービス部分復旧
■ 対応状況:
- DBコネクションプールの設定値を一時的に引き上げ(50→200)
- APIサーバー2台中1台を再起動済み
■ 復旧見込み:15:30頃の完全復旧を目指しています
■ 次回アップデート:15:15予定
(@channel [장애 후속 보고] 14:30 발생 API 장애 후속 보고입니다.
- 현재 상태: 서비스 부분 복구
- 대응 상황:
- DB 커넥션 풀 설정값을 일시적으로 상향 (50에서 200)
- API 서버 2대 중 1대 재기동 완료
- 복구 예상: 15:30경 완전 복구를 목표로 하고 있습니다
- 다음 업데이트: 15:15 예정)
【복구 완료 보고 예시】
@channel 【障害復旧】14:30に発生したAPI障害は、15:25に復旧いたしました。
■ 復旧時刻:15:25 JST
■ 影響時間:約55分
■ 暫定対応内容:DBコネクションプール拡張、APIサーバー再起動
■ 恒久対応:別途、障害報告書にてご報告いたします
ご迷惑をおかけし、申し訳ございませんでした。
(@channel [장애 복구] 14:30에 발생한 API 장애는 15:25에 복구되었습니다.
- 복구 시각: 15:25 JST
- 영향 시간: 약 55분
- 임시 대응 내용: DB 커넥션 풀 확장, API 서버 재기동
- 항구 대응: 별도 장애 보고서로 보고 드리겠습니다
불편을 끼쳐 드려 대단히 죄송합니다.)
격식체 vs 일상체 비교
장애 대응 시 상황과 상대에 따라 표현 수준이 달라진다.
| 상황 | 격식체 (경어) | 일상체 (팀 내) |
|---|---|---|
| 장애 발생 보고 | 「障害が発生いたしました」 | 「障害が起きた」 |
| 원인 조사 중 | 「原因を調査しております」 | 「原因を調べてる」 |
| 영향 범위 확인 | 「影響範囲を確認中でございます」 | 「影響範囲を確認中」 |
| 복구 완료 | 「復旧が完了いたしました」 | 「復旧した」 |
| 도움 요청 | 「ご対応いただけますでしょうか」 | 「対応お願いできる?」 |
| 사과 표현 | 「ご迷惑をおかけし申し訳ございません」 | 「すみません、迷惑かけました」 |
| 보고 약속 | 「追ってご報告いたします」 | 「後で報告するね」 |
| 확인 요청 | 「ご確認のほどよろしくお願いいたします」 | 「確認よろしく」 |
| 대응 진행 중 | 「現在対応を進めております」 | 「今対応してる」 |
| 원인 특정 | 「原因が特定できました」 | 「原因わかった」 |
사용 분류 기준
- 격식체: 에스컬레이션 보고, 경영진 보고, 고객 대응, 타 부서 연락, 공식 장애 보고서
- 일상체: 팀 내 Slack, 장애 대응 War Room, 동료 간 실시간 소통
장애 대응 실전 대화 시나리오
시나리오 1: 장애 감지 직후 War Room 소통
【War Room 긴급 소통】
リーダー: 「皆さん、本番環境で障害が発生しています。
まず状況を整理しましょう。
モニタリング担当の方、現在の状況を教えてください。」
SRE担当: 「はい。Grafanaのダッシュボードを確認したところ、
14:28頃からAPIのエラーレートが急増しています。
現在、5xxエラーが全リクエストの約40%を占めています。
Podのメモリ使用率も90%を超えている状態です。」
リーダー: 「わかりました。影響範囲を教えてください。」
SRE担当: 「影響範囲はログインAPI全体です。
ユーザーの新規ログインができない状態になっています。
既にログイン済みのユーザーには影響ありません。」
バックエンド: 「ログを確認しましたが、DBへのコネクションが
タイムアウトしているようです。
slow queryが大量に発生していて、
コネクションプールが枯渇している可能性があります。」
リーダー: 「了解です。暫定対応として、まずDBのスロークエリを
killして、コネクションプールのサイズを一時的に
引き上げましょう。それと並行して根本原因の調査を
進めてください。」
(리더: 여러분, 본번 환경에서 장애가 발생했습니다.
우선 상황을 정리합시다.
모니터링 담당분, 현재 상황을 알려주세요.
SRE 담당: 네. Grafana 대시보드를 확인한 결과
14:28경부터 API의 에러율이 급증하고 있습니다.
현재 5xx 에러가 전체 요청의 약 40%를 차지하고 있습니다.
Pod의 메모리 사용률도 90%를 넘는 상태입니다.
리더: 알겠습니다. 영향 범위를 알려주세요.
SRE 담당: 영향 범위는 로그인 API 전체입니다.
사용자의 신규 로그인이 불가능한 상태입니다.
이미 로그인한 사용자에게는 영향이 없습니다.
백엔드: 로그를 확인했는데 DB 커넥션이
타임아웃되고 있는 것 같습니다.
slow query가 대량 발생하여
커넥션 풀이 고갈되었을 가능성이 있습니다.
리더: 알겠습니다. 임시 대응으로 우선 DB의 slow query를
kill하고, 커넥션 풀 사이즈를 일시적으로 올립시다.
그와 병행하여 근본 원인 조사를 진행해 주세요.)
시나리오 2: 롤백 판단 논의
【롤백(切り戻し) 판단 논의】
リーダー: 「原因の特定に時間がかかりそうですね。
切り戻しを検討しましょう。
直近のデプロイはいつでしたか?」
デプロイ担当: 「今朝の10時に認証モジュールのアップデートを
デプロイしています。
このデプロイ以降に障害が発生した可能性があります。」
リーダー: 「切り戻しのリスクを教えてください。」
デプロイ担当: 「認証モジュールの切り戻し自体は5分程度で完了します。
ただし、今朝のデプロイにはDB migrationが含まれているため、
DBの切り戻しも必要になります。
DB切り戻しには追加で10分程度かかる見込みです。」
リーダー: 「了解しました。影響時間を考慮すると、
切り戻しを実行した方がよさそうです。
切り戻し手順を確認して、実行してください。
実行前に私に一報ください。」
(리더: 원인 특정에 시간이 걸릴 것 같네요.
롤백을 검토합시다.
최근 배포는 언제였습니까?
배포 담당: 오늘 아침 10시에 인증 모듈 업데이트를
배포했습니다.
이 배포 이후에 장애가 발생했을 가능성이 있습니다.
리더: 롤백의 리스크를 알려주세요.
배포 담당: 인증 모듈의 롤백 자체는 5분 정도면 완료됩니다.
다만 오늘 아침 배포에는 DB 마이그레이션이 포함되어 있어
DB 롤백도 필요합니다.
DB 롤백에는 추가로 10분 정도 걸릴 전망입니다.
리더: 알겠습니다. 영향 시간을 고려하면
롤백을 실행하는 것이 좋을 것 같습니다.
롤백 절차를 확인하고 실행해 주세요.
실행 전에 저에게 한 번 연락 주세요.)
포스트모템(振り返り) 회의 표현
포스트모템 회의 진행 표현
【포스트모템 회의 오프닝】
ファシリテーター:
「それでは、3月11日に発生した本番API障害の振り返りを始めます。
本日のアジェンダは以下の通りです。
1. タイムラインの確認
2. 根本原因の共有
3. 対応の振り返り(良かった点・改善点)
4. 再発防止策の検討
5. アクションアイテムの整理
まずはタイムラインの確認からお願いします。」
(진행자: 그러면 3월 11일에 발생한 본번 API 장애의 회고를 시작하겠습니다.
오늘의 아젠다는 다음과 같습니다.
1. 타임라인 확인
2. 근본 원인 공유
3. 대응의 회고 (잘된 점, 개선점)
4. 재발 방지책 검토
5. 액션 아이템 정리
우선 타임라인 확인부터 부탁드립니다.)
【근본 원인 발표】
SRE担当:
「根本原因についてご報告します。
今回の障害の直接原因は、認証モジュールのアップデートに含まれていた
新しいクエリが、インデックスを適切に使用していなかったことです。
このクエリがフルテーブルスキャンを発生させ、
DBの負荷が急増しました。
その結果、コネクションプールが枯渇し、
全体のAPIレスポンスが悪化しました。
根本原因としては、以下の3点が挙げられます。
1. コードレビューでクエリのパフォーマンスが検証されていなかった
2. ステージング環境のデータ量が本番と大きく異なり、
パフォーマンス問題が検知できなかった
3. デプロイ後のパフォーマンス監視体制が不十分だった」
(SRE 담당: 근본 원인에 대해 보고 드립니다.
이번 장애의 직접 원인은 인증 모듈 업데이트에 포함된
새 쿼리가 인덱스를 적절히 사용하지 못한 것입니다.
이 쿼리가 풀 테이블 스캔을 발생시켜
DB 부하가 급증했습니다.
그 결과 커넥션 풀이 고갈되어
전체 API 응답이 악화되었습니다.
근본 원인으로는 다음 3가지가 꼽힙니다.
1. 코드 리뷰에서 쿼리 퍼포먼스가 검증되지 않았다
2. 스테이징 환경의 데이터량이 본번과 크게 달라
퍼포먼스 문제를 감지할 수 없었다
3. 배포 후 퍼포먼스 모니터링 체제가 불충분했다)
【재발 방지책 논의】
ファシリテーター: 「再発防止策について議論しましょう。
皆さんのご意見をお聞かせください。」
SRE担当: 「まず、デプロイパイプラインにクエリパフォーマンステストを
追加することを提案します。
本番相当のデータ量を持つテスト環境で、
新規クエリのEXPLAIN ANALYZEを自動実行する仕組みです。」
バックエンド: 「コードレビューのチェックリストに、
クエリパフォーマンスの確認項目を追加すべきだと思います。
特にWHERE句のインデックス使用状況の確認は必須です。」
リーダー: 「デプロイ直後のカナリアリリースの導入も検討したいですね。
全台に一気にデプロイするのではなく、
まず1台にデプロイして問題がないことを確認してから
全台展開する形にしましょう。」
ファシリテーター: 「ありがとうございます。
それでは、今の議論をアクションアイテムとして
整理しましょう。」
(진행자: 재발 방지책에 대해 논의합시다.
여러분의 의견을 들려주세요.
SRE 담당: 우선 배포 파이프라인에 쿼리 퍼포먼스 테스트를
추가할 것을 제안합니다.
본번 상당의 데이터량을 가진 테스트 환경에서
신규 쿼리의 EXPLAIN ANALYZE를 자동 실행하는 구조입니다.
백엔드: 코드 리뷰 체크리스트에
쿼리 퍼포먼스 확인 항목을 추가해야 한다고 생각합니다.
특히 WHERE절의 인덱스 사용 상황 확인은 필수입니다.
리더: 배포 직후의 카나리 릴리스 도입도 검토하고 싶네요.
전 대에 한 번에 배포하는 것이 아니라
우선 1대에 배포하여 문제가 없는 것을 확인한 후
전체 전개하는 형태로 합시다.
진행자: 감사합니다.
그러면 지금의 논의를 액션 아이템으로 정리합시다.)
장애 보고서 작성 표현
장애 보고서 템플릿 일본어 표현
【障害報告書テンプレート】
■ 障害概要
障害名:本番API認証障害
発生日時:2026年3月11日 14:30 JST
復旧日時:2026年3月11日 15:25 JST
影響時間:約55分
障害レベル:Severity 1(サービス全体に影響)
■ 影響範囲
- 対象サービス:ユーザー認証API
- 影響ユーザー数:推定約50,000人
- 影響内容:新規ログインが不可能な状態
■ タイムライン
14:28 モニタリングアラート発報
14:30 障害検知、一次対応開始
14:35 エスカレーション実施
14:45 暫定対応(コネクションプール拡張)
15:10 根本原因特定(インデックス未使用クエリ)
15:15 切り戻し実行開始
15:25 サービス復旧確認
■ 根本原因
認証モジュールのアップデートに含まれた新規クエリが
インデックスを使用せずフルテーブルスキャンを実行し、
DB負荷が急増。コネクションプールが枯渇し、
API全体のレスポンスが悪化した。
■ 再発防止策
1. デプロイパイプラインにクエリパフォーマンステスト追加
2. コードレビューチェックリストの強化
3. カナリアリリースの導入
4. ステージング環境のデータ量を本番相当に拡充
(장애 보고서 템플릿
- 장애 개요
장애명: 본번 API 인증 장애
발생 일시: 2026년 3월 11일 14:30 JST
복구 일시: 2026년 3월 11일 15:25 JST
영향 시간: 약 55분
장애 레벨: Severity 1 (서비스 전체에 영향)
- 영향 범위
대상 서비스: 사용자 인증 API
영향 사용자 수: 추정 약 50,000명
영향 내용: 신규 로그인이 불가능한 상태
... 이하 생략)
한국인이 자주 하는 실수
실수 1: 장애를 「事故(じこ)」로 표현
한국어에서 "사고"는 IT 장애에도 사용하지만, 일본 IT 업계에서는 「事故」보다 「障害」를 사용하는 것이 일반적이다. 「事故」는 교통사고나 물리적 사고의 뉘앙스가 강하다.
❌ 「本番環境で事故が発生しました」
✅ 「本番環境で障害が発生しました」
실수 2: 「直す(なおす)」와 「復旧する(ふっきゅうする)」 혼용
「直す」는 "고치다"에 해당하지만, 장애 상황에서는 보다 공식적인 「復旧する」를 사용한다.
❌ 「サーバーを直しました」 (서버를 고쳤습니다 - 캐주얼)
✅ 「サーバーを復旧いたしました」 (서버를 복구했습니다 - 공식적)
실수 3: 시제 혼동 - 완료와 진행 중 구분
한국어에서는 "-하고 있습니다"로 진행과 완료를 모두 표현하는 경우가 많지만, 일본어에서는 구분이 중요하다.
❌ 「対応しています」 (대응하고 있습니다 - 진행인지 완료인지 모호)
✅ 진행 중: 「現在対応を進めております」 (현재 대응을 진행하고 있습니다)
✅ 완료: 「対応が完了いたしました」 (대응이 완료되었습니다)
실수 4: 보고 시 주어 누락
일본어에서도 장애 보고 시에는 주어(누가)를 명확히 해야 한다.
❌ 「調査しています」 (조사하고 있습니다 - 누가?)
✅ 「SREチームにて原因を調査しております」 (SRE 팀에서 원인을 조사하고 있습니다)
실수 5: 한국식 표현 직역
한국어의 "서버가 터졌다"를 직역하면 부자연스럽다.
❌ 「サーバーが爆発しました」 (서버가 폭발했습니다 - 부자연스러움)
✅ 「サーバーがダウンしました」 (서버가 다운되었습니다)
✅ 「サーバーが落ちました」 (서버가 떨어졌습니다 - 일상체)
운영 시 주의사항
장애 대응 커뮤니케이션 원칙
- 사실과 추측을 구분하라: 확인된 사실은 「確認されています」, 추측은 「可能性があります」로 명확히 구분
- 영향 범위를 먼저 전달하라: 기술적 상세보다 비즈니스 영향을 먼저 보고
- 다음 업데이트 시간을 명시하라: 「次回アップデートは15:15予定です」처럼 구체적 시간 제시
- 감정적 표현을 피하라: 「やばい」등의 표현은 팀 내에서만, 에스컬레이션에서는 절대 사용 금지
- 타임라인을 기록하라: 장애 대응 중 실시간으로 시각과 조치 내용을 기록
포스트모템에서의 원칙
- 비난하지 않는다(Blameless): 「誰が悪い」ではなく「何が原因か」に焦点を当てる
- 개선점에 집중한다: 잘된 점도 반드시 언급하되, 개선 가능한 점에 무게를 둔다
- 구체적인 액션 아이템을 도출한다: "주의한다"가 아닌 "자동화한다"처럼 측정 가능한 대책
장애 대응 시 유용한 정형 표현 모음
【장애 감지】
- 「異常を検知しました」 (이상을 감지했습니다)
- 「アラートが発報しました」 (알림이 발보되었습니다)
- 「モニタリングで異常値を確認しました」 (모니터링에서 이상값을 확인했습니다)
【상황 보고】
- 「現在、調査中です」 (현재 조사 중입니다)
- 「影響範囲を確認しております」 (영향 범위를 확인하고 있습니다)
- 「原因を特定中です」 (원인을 특정 중입니다)
【대응 진행】
- 「暫定対応を実施します」 (임시 대응을 실시합니다)
- 「切り戻しを実行します」 (롤백을 실행합니다)
- 「スケールアウトで対応します」 (스케일 아웃으로 대응합니다)
【복구 보고】
- 「サービスが復旧しました」 (서비스가 복구되었습니다)
- 「正常稼働を確認しました」 (정상 가동을 확인했습니다)
- 「全機能の動作確認が完了しました」 (전 기능의 동작 확인이 완료되었습니다)
【포스트모템】
- 「根本原因は〇〇でした」 (근본 원인은 ○○이었습니다)
- 「再発防止策として〇〇を提案します」 (재발 방지책으로 ○○를 제안합니다)
- 「アクションアイテムを整理しましょう」 (액션 아이템을 정리합시다)
실전 연습 체크리스트
장애 대응 일본어 역량을 높이기 위해 다음 항목을 연습하자.
- 장애 감지 Slack 메시지를 30초 이내에 일본어로 작성할 수 있는가
- 에스컬레이션 보고를 경어체로 구두 전달할 수 있는가
- 영향 범위, 원인, 대응 상황을 구조적으로 보고할 수 있는가
- 暫定対応(임시 대응)과 恒久対応(항구 대응)을 구분하여 설명할 수 있는가
- 切り戻し(롤백) 판단 논의에 참여할 수 있는가
- 30분 단위 경과 보고를 일본어로 작성할 수 있는가
- 복구 완료 보고를 격식체와 일상체 모두로 표현할 수 있는가
- 포스트모템 회의에서 타임라인을 발표할 수 있는가
- 근본 원인을 논리적으로 설명할 수 있는가
- 재발 방지책을 제안하고 논의할 수 있는가
- 장애 보고서의 각 섹션을 일본어로 작성할 수 있는가
- 사실과 추측을 일본어로 명확히 구분하여 표현할 수 있는가
참고자료
- PagerDuty Incident Response Documentation - 인시던트 대응 프로세스 가이드
- Google SRE Book - Managing Incidents - Google의 장애 관리 방법론
- Atlassian Incident Management Handbook - 인시던트 관리 핸드북
- IT障害対応のベストプラクティス - Qiita - IT 장애 대응 모범 사례 (일본어)
- ポストモーテムの書き方 - Google Cloud Blog - 포스트모템 작성법 (일본어)
- NHK日本語発音アクセント辞典 - NHK 일본어 발음 사전
- ビジネス敬語の使い方 - マイナビ - 비즈니스 경어 사용법