vCenter를 사용하다 보면 가끔 “Task was cancelled by an administrator”라는 오류 메시지를 만나게 됩니다. 이 오류는 생각보다 자주 발생하는데, 특히 스냅샷 작업이나 VM 마이그레이션 등 시간이 오래 걸리는 작업에서 자주 나타납니다. 많은 관리자들이 이 문제로 골머리를 앓고 있는데, 다행히 여러 가지 해결방법이 있습니다. 이번 포스트에서는 이런 상황에서 안전하고 확실하게 문제를 해결할 수 있는 방법들을 단계별로 알아보겠습니다.
“Task was cancelled by ___”작업 취소 오류가 발생하는 주요 원인
vCenter에서 작업 취소 오류가 발생하는 이유는 다양합니다:
- 시간 초과: vCenter의 기본 타임아웃 설정(15분)을 초과하는 작업
- 리소스 충돌: 동일한 객체에 대해 동시에 여러 작업이 실행될 때
- 네트워크 연결 문제: vCenter와 ESXi 호스트 간 통신 장애
- 백업 소프트웨어 간섭: 백업 프로그램이 VM 파일을 잠그고 있을 때
- 스냅샷 관련 작업: 대용량 스냅샷 생성/삭제 과정에서의 중단
원인 | 발생 빈도 | 해결 난이도 |
---|---|---|
시간 초과 | 높음 | 보통 |
리소스 충돌 | 보통 | 쉬움 |
네트워크 문제 | 낮음 | 어려움 |
백업 간섭 | 보통 | 쉬움 |
스냅샷 문제 | 높음 | 어려움 |
1. vSphere Client UI를 통한 기본 해결방법
가장 먼저 시도해볼 수 있는 방법은 vSphere Client의 사용자 인터페이스를 통한 해결입니다.
최근 작업 패널에서 직접 취소
- vSphere Client에 로그인하여 메뉴 (Menu) → 관리 (Administration) → 최근 작업 (Recent Tasks)으로 이동합니다
- 문제가 되는 작업을 찾아 상태 (Status) 열의 진행률 표시줄 옆 취소 버튼을 클릭합니다
- 작업이 정상적으로 취소되는지 확인합니다
작업 필터링으로 정확한 문제 작업 찾기
복잡한 환경에서는 작업을 필터링해서 문제를 찾는 것이 효율적입니다:
- 모니터 (Monitor) 탭 → 작업 (Tasks) 클릭
- 작업 필터 (Filter Tasks) 대화상자 열기
- 상태 (Status) 옵션에서 관련 상태 선택
- 유형 (Type) 드롭다운에서 시스템 또는 사용자 작업 선택
2. vCenter 서비스 재시작을 통한 해결방법
UI로 해결되지 않는 경우, vCenter 서비스를 재시작하는 방법이 효과적입니다.
단일 서비스 재시작
SSH로 vCenter Server에 접속한 후 다음 명령어를 실행합니다:
# vpxd 서비스만 재시작
service-control --stop vmware-vpxd && service-control --start vmware-vpxd
# vSphere UI 서비스도 함께 재시작 (권장)
service-control --stop vmware-vpxd
service-control --stop vsphere-ui
service-control --start vmware-vpxd
service-control --start vsphere-ui
전체 서비스 재시작
더 확실한 방법으로는 전체 vCenter 서비스를 재시작하는 것입니다:
service-control --stop && service-control --start
⚠️ 주의사항: 서비스 재시작은 일시적으로 vCenter에 접속할 수 없게 만들므로, 업무 시간 외나 점검 시간에 진행하시기 바랍니다.
3. MOB(Managed Object Browser)를 이용한 해결방법
UI나 서비스 재시작으로도 해결되지 않는 경우, MOB를 사용해 작업 상태를 직접 변경할 수 있습니다.
MOB 접속 및 작업 검색
- 웹 브라우저에서
https://vCenter서버FQDN/mob/?moid=TaskManager
접속 - SSO 관리자 자격증명 입력 (예: administrator@vsphere.local)
- recentTask 필드에서 문제가 되는 작업 ID 찾기
- 작업 ID 클릭 → info의 TaskInfo 속성 클릭해서 세부 정보 확인
작업 상태 변경
문제 작업을 식별했다면 상태를 직접 변경할 수 있습니다:
- Methods 섹션에서 SetTaskState 호출
- 다음 매개변수로 설정:
- state 값: success
- result 또는 fault 매개변수는 비워두기
- Invoke Method 버튼 클릭하여 작업 상태를 성공으로 변경
4. SSH를 통한 ESXi 호스트 레벨 해결방법
VM 관련 작업이 멈춰 있는 경우, 해당 ESXi 호스트에서 직접 해결할 수 있습니다.
ESXi SSH 활성화
- vSphere Client에서 ESXi 호스트 선택
- 구성 (Configure) → 서비스 (Services) 이동
- SSH 선택 → 시작 (Start) 클릭
명령줄을 통한 작업 취소
SSH로 ESXi 호스트에 접속한 후:
# 실행 중인 VM 프로세스 확인
esxcli vm process list
# 특정 VM의 World ID 확인 후 프로세스 종료
esxcli vm process kill --type=soft --world-id=[World ID]
# 더 강제적인 종료가 필요한 경우
esxcli vm process kill --type=hard --world-id=[World ID]
vim-cmd를 이용한 작업 관리
# VM 목록 확인
vim-cmd vmsvc/getallvms
# 특정 VM의 작업 확인
vim-cmd vimsvc/task_list
# 작업 취소 (작업 ID 필요)
vim-cmd vimsvc/task_cancel [작업ID]
5. PowerCLI를 활용한 원격 해결방법
PowerCLI는 원격에서 vCenter에 연결하여 문제를 해결할 수 있는 강력한 도구입니다.
PowerCLI 연결 및 VM 상태 확인
# vCenter 연결
Connect-VIServer -Server vCenter서버주소
# 문제 VM 확인
Get-VM | Where-Object {$_.PowerState -eq "Unknown"}
# 특정 VM 강제 종료
Stop-VM -VM "VM이름" -Kill -Confirm:$false
작업 모니터링 및 관리
# 실행 중인 작업 확인
Get-Task | Where-Object {$_.State -eq "Running"}
# 특정 작업 취소
Get-Task | Where-Object {$_.Description -like "*문제작업*"} | Stop-Task
6. 타임아웃 설정 변경을 통한 예방책
근본적인 해결을 위해서는 vCenter의 타임아웃 설정을 조정하는 것이 좋습니다.
vpxd.cfg 파일 수정
vCenter Server의 /etc/vmware-vpx/vpxd.cfg
파일을 편집합니다:
<config>
<task>
<timeout>10800</timeout> <!-- 3시간으로 연장 -->
</task>
<vmomi>
<soapStubAdapter>
<blockingTimeoutSeconds>10800</blockingTimeoutSeconds>
</soapStubAdapter>
</vmomi>
</config>
ESXi 호스트 타임아웃 설정
ESXi 호스트의 /etc/vmware/vpxa/vpxa.cfg
도 동일하게 수정합니다:
<config>
<task>
<timeout>10800</timeout>
</task>
<vmomi>
<soapStubAdapter>
<blockingTimeoutSeconds>10800</blockingTimeoutSeconds>
</soapStubAdapter>
</vmomi>
</config>
7. 스냅샷 관련 특별 주의사항 및 해결방법
스냅샷 통합 작업은 특별한 주의가 필요합니다. 절대로 강제 취소하면 안 됩니다.
스냅샷 통합 작업 모니터링
스냅샷 통합이 진행 중인지 확인하는 방법:
# ESXi 호스트에서 실행
tail -f /vmfs/volumes/데이터스토어/VM이름/vmware.log | grep -i consolidate
안전한 스냅샷 문제 해결
상황 | 권장 조치 | 절대 금지 |
---|---|---|
99%에서 멈춤 | 기다리거나 VMware 지원팀 문의 | 강제 취소 |
오류로 실패 | 데이터스토어 공간 확인 후 재시도 | 프로세스 kill |
며칠째 진행 | 로그 확인 후 전문가 도움 | 임의 재부팅 |
vCenter의 “Task was cancelled by an administrator” 오류는 다양한 원인으로 발생할 수 있지만, 체계적인 접근으로 대부분 해결 가능합니다. 가장 중요한 것은 데이터 안전성을 최우선으로 고려하고, 스냅샷 통합 같은 중요한 작업은 절대 강제 중단하지 않는 것입니다. 문제가 지속되거나 복잡한 상황에서는 무리하게 해결하려 하지 마시고, VMware 지원팀이나 전문가의 도움을 받으시기 바랍니다. 정기적인 백업과 모니터링을 통해 이런 문제를 사전에 방지하는 것이 가장 좋은 방법입니다. 🙂