앤트로픽 클로드, 또 멈췄다…국내 AI 스타트업 '비상'
AI 서비스 장애가 이어지며 국내 AI 기반 스타트업들이 파장을 겪고 있다. 앤트로픽의 AI 모델 Claude 가 반복적으로 서버 다운을 경험한 가운데, 한국시간으로 7일 오전 6시 26분부터 시작된 서비스 중단이 사용자들 사이에서 불만을 끌어냈다.
사건은 첫 번째 장애가 해결된 지 짧은 시간 만에 다시 발생하며 신뢰성에 물음표를 달았다. 두 번째 disruption 는 당일 저녁 11시 32분부터 다음 날 0시 12분까지 지속됐고, 추가로 8일 오전 3시 23분 전후에도 오류가 기록됐다. 오류율은 인증 시스템과 핵심 기능에서도 급증했다.
외부 서비스들 사이에서는 API 의존도의 이면이 드러났다. AI 스타트업 비즈크러시는 핵심 기능이 마비되자 사용자들에게 공지를 send , "클로드 서버 다운으로 인해 AI 기능에 오류가 발생했습니다"라고 설명했다. 회의 녹음, 캡처, 통역, 요약까지 담당하는 워크플로가 끊긴 셈이었다.
최근 한 달 사이 클로드 상태 페이지에는 수십 건의 서비스 방해가 기록됐다. 앤트로픽 측은 이를 두고 "전례 없는 수요"가 주요 원인"이라고 시인하며 infrastructure 확장에 부담이 가해졌다고 밝혔다. 하지만 반복되는 장애에 사용자들은 참을성의 한계를 느끼고 있다.
기업 입장에선 고성능 AI에 의존하는 동시에 안정성 부족에 노출된 모순된 입지에 놓였다. 제3자 도구에 전체 기능을 묶는 구조는 효율은 높이지만, one-point failure 의 위험도 키운다. 앤트로픽은 "현재 시스템은 거의 정상화됐다"고 알렸지만, 다음 장애는 언제 불쑥 나타날지 아무도 모른다.
전적으로 ~에 의존하고 있어서 갑작스러운 다운타임이 nightmare 악몽이야. 고객 미팅 요약도 실패하고, 이후 작업 할당도 정지됐어.
전례 없는 수요라지만 반복되는 장애는 변명이 더 이상 work 먹히지 않아. 클라우드 서비스인데 이렇게 불안정하면 대체될 수 밖에 없지.
우리도 고객한테 사과하면서 계속 서비스가 unavailable 이용 불가라니 몹시 상황이야. 내부적으로 백업 계획 다시 고민하고 있어.
제3자 API 연동은 편의성의 보상과 취약점의 대가를 simultaneously 동시에 치르게 만든다. 이 사례는 완벽한 경고야.
앤트로픽, 고쳐라. 유료 요금제 쓰는 사용자도 많은데 free 무료 서비스처럼 다운날 때마다 참아야 하는 건 아니잖아.
스케일링이 단순히 서버 수량 늘리는 게 아니란 걸 learn 배워야 교훈이야. 로드 밸런싱, 장애 전환, 모니터링도 핵심인데.
아니,한 회의만 망가져도 후폭풍이 huge 크거든. 어제 고객 프레젠테이션 전부 AI에 맡겼는데... 침묵.
여러 지역에 백업 서버 배포하는 건 기본인데. This frequency 이 빈도면 시스템 설계부터 재고해야 보여.