Cadenza 봇 응답 지연 장애 안내
안녕하세요, Cadenza 운영팀입니다.
5월 1일, Cadenza 봇이 디스코드에서 일정 시간 동안 슬래시 커맨드(/play, /skip 등)에 정상적으로 응답하지 못한 문제가 있었습니다. 같은 시간 동안 명령어를 사용하셨다면 "애플리케이션이 응답하지 않았어요" 라는 메시지를 보셨을 수 있습니다.
이용에 불편을 드려 진심으로 죄송합니다.
무슨 일이 있었나요
Cadenza 봇이 디스코드와 실시간으로 주고받는 연결 통로가 외부 요인으로 끊긴 뒤, 자동 복구 절차가 끝까지 진행되지 못한 채 머물러 있었습니다.
봇 프로세스 자체와 음악 재생 엔진(Lavalink), 데이터베이스, 웹 대시보드는 모두 정상 동작 중이었기 때문에, 외부에서는 평소와 다름없어 보였지만 디스코드 쪽으로 명령이 전달되지 않는 형태의 무성 장애였습니다.
쉽게 말해 "전화기는 켜져 있는데 신호가 한 방향만 끊긴 상태" 였다고 이해해주시면 됩니다.
영향 범위
- 명령어 무응답: 장애 시간 동안 모든 디스코드 길드에서 슬래시 커맨드가 응답하지 않음
- 이미 재생 중이던 음악: 음성 채널의 음원 자체는 끊기지 않고 계속 흘러나오던 경우가 많았습니다 (재생 엔진은 별도로 동작하기 때문)
- 저장된 데이터(좋아요 / 플레이리스트 / 최근 재생): 모두 안전합니다. 어떤 데이터도 손상되거나 삭제되지 않았습니다
- 웹 대시보드: 정상 동작 (장애 영향 없음)
현재는 정상입니다
봇 컨테이너 재시작을 통해 디스코드와의 연결이 정상 복구되었습니다. 모든 길드에서 슬래시 커맨드와 봇 상호작용이 다시 잘 동작합니다.
장애 시점에 진행 중이던 세션은, 다시 /play 같은 명령어를 한 번만 입력해주시면 평소처럼 이어집니다.
재발 방지를 위해 이렇게 합니다
이번과 같은 봇이 살아있는 채로 조용히 멎는 형태의 장애가 다시 일어나지 않도록 다음을 적용 중입니다.
-
즉시 알림 체계 도입
디스코드 연결이 끊기거나 에러가 발생하면 운영팀에 즉시 알림이 가도록 합니다. 운영자가 사용자 신고를 통해 처음 알게 되는 일이 더 이상 없도록 하기 위함입니다. -
자가 복구 로직 추가
일정 시간 이상 디스코드 쪽에서 신호가 오지 않으면, 봇이 스스로 연결을 재설정합니다. 사람이 개입하지 않아도 보통의 단절 상황은 수 분 안에 자동 복구됩니다. -
헬스 체크 강화
봇의 "정상 동작" 판정 기준에 디스코드 연결 상태 를 명시적으로 포함시킵니다. 이번처럼 "프로세스는 살아있는데 디스코드와 통신 불가" 인 상태가 자동 모니터링에 즉시 잡히게 됩니다.
수정 작업은 가장 높은 우선순위로 진행되며, 적용 완료 시 GitHub 릴리즈 노트와 본 공지 채널을 통해 다시 안내드리겠습니다.
마지막으로
음악과 함께하는 시간이 끊기지 않도록 만들어드리는 것이 Cadenza가 가진 가장 기본적인 약속입니다. 이번에 그 약속을 일시적으로 지켜드리지 못한 점 다시 한 번 깊이 사과드리며, 더 안정적이고 신뢰할 수 있는 서비스로 답하겠습니다.
추가로 발견된 이상이나 문의 사항은 대시보드의 버그 신고 버튼이나 공식 디스코드 서버를 통해 알려주시면 빠르게 확인하겠습니다. 사용자 분들이 보내주시는 작은 신호 하나하나가 Cadenza가 더 단단해지는 기반입니다.
— Cadenza 운영팀
2026년 5월 1일