시스템 > Type-1 (베어메탈) > VMware ESXi > Sub Page

본문 바로가기

Type-2 (호스티드)

시스템 > Type-1 (베어메탈) > VMware ESXi

본문

SYSTEM > Type-1(베어메탈) > VMware ESXi
VMware ESXi는 서버 하드웨어 위에 직접 설치되는 베어메탈 하이퍼바이저입니다. 이 페이지는 “설치 방법”보다, 상업 운영을 위한 설계·운영 기준을 정리합니다.
목표는 하나입니다. 장애가 나도 무너지지 않는 구조, 그리고 운영이 반복 가능한 표준을 만드는 것.
vCenter/클러스터
HA/DRS 설계
Backup/DR
vSwitch/VLAN
Datastore/VMFS
MSP 운영 표준
권장 네트워크 분리(관리망/스토리지망/서비스망)
ESXi 운영에서 가장 큰 사고는 “섞여 있는 네트워크”에서 시작합니다. 최소 3~4개 영역을 분리하면 장애·보안·성능 트러블이 급격히 줄어듭니다.
① 관리망(Management)
ESXi/vCenter 접근용. VPN 또는 특정 IP만 허용하고, 일반 서비스 트래픽과 물리적으로/논리적으로 분리합니다.
포인트: 방화벽, MFA/계정정책, 감사로그, 접근 경로 표준화
② VM 서비스망(Service)
실제 서비스/업무 트래픽. VLAN 단위로 테넌트/서비스 분리하고 필요시 L3/방화벽 정책으로 제어합니다.
포인트: vSwitch 구성 표준화, 라우팅/ACL, 트래픽 모니터링
③ 스토리지망(Storage)
iSCSI/NFS/스토리지 접근 트래픽. 성능과 안정성을 위해 전용 VLAN/전용 NIC를 권장합니다.
포인트: MTU/점보프레임(환경 맞춤), 경로 이중화, 스토리지 모니터링
④ vMotion/마이그레이션
vMotion 트래픽은 순간 폭증합니다. 가능하면 분리하거나, 최소한 우선순위(QoS)·대역폭 관리로 서비스망을 보호합니다.
포인트: 대역폭 제한, 스케줄 정책, 야간 윈도우 운영
설계 체크리스트(운영형 기준)
“설치가 된다”와 “운영이 된다”는 다릅니다. 아래 항목을 기준으로 설계를 고정하면, 장애 대응 속도와 확장성이 달라집니다.
하드웨어
• CPU/메모리 여유율(피크 기준) 확보
• RAID/컨트롤러/캐시 정책(배터리/플래시) 점검
• NIC 포트 수/속도/이중화(관리/서비스/스토리지 분리)
팁: “현재”가 아니라 “6~12개월 후” 수요까지 포함해 산정
스토리지
• Datastore 설계(성능/용량/격리)
• VMFS/NFS/iSCSI 선택 기준 문서화
• 스냅샷 정책(장기 방치 금지) 확정
팁: 스냅샷은 백업이 아님(운영 규칙을 반드시 고정)
네트워크
• vSwitch/VLAN 구성 표준(포트그룹/네이밍)
• 관리망 접근 정책(VPN/허용 IP/로그)
• vMotion/Storage 트래픽 분리 또는 우선순위/QoS
팁: “누가/어디서/어떻게 접속”까지 운영 시나리오로 정의
보안·운영
• 최소권한(Role) 설계 및 계정 분리
• 패치/업데이트 윈도우(야간/주말) 정책
• 변경관리(승인/롤백/기록) 규칙
팁: 운영은 “사람”이 아니라 “절차”가 남아야 반복 가능
백업·복구 운영 규칙(추천 템플릿)
백업은 “설정”이 아니라 “복구 성공”이 기준입니다. 아래 항목을 선언하고, 실제로 복구 리허설을 반복해야 운영 품질이 올라갑니다.
핵심 원칙 5개
• RPO/RTO 목표를 먼저 숫자로 정의
• 스냅샷은 단기(임시) 용도, 장기 보관 금지
• 백업 저장소는 운영망과 분리(권한/접근 제한)
• 월 1회 이상 “복구 리허설”을 실행
• 복구 절차(런북)를 최신화하고 변경 이력을 남김
권장: 샘플 복구 테스트(파일 단위/VM 단위/서비스 단위)를 최소 3종으로 운영
운영 런북 템플릿(바로 복붙용)
아래는 “운영대행/CS 센터” 관점에서 바로 쓰는 기본 런북 틀입니다. 프로젝트 운영 게시판에 그대로 등록해도 됩니다.
1) 장애 등급(Sev) 정의
• Sev1: 서비스 중단/대규모 영향(즉시 대응)
• Sev2: 성능 저하/부분 영향(우선 대응)
• Sev3: 문의/경미 이슈(계획 대응)
2) 정기 점검(주/월)
• 호스트 상태(하드웨어 로그/온도/디스크)
• Datastore 사용률/지연(Latency) 점검
• 백업 성공률/복구 테스트 기록 확인
• 계정/권한 변경 내역 감사
3) 패치/변경관리
• 변경 전: 영향도/롤백/점검 체크리스트 준비
• 변경 중: 작업 로그 기록(시간/대상/결과)
• 변경 후: 모니터링 확인/이상 징후 점검
4) 복구 절차(요약)
• 1단계: 영향 범위 확정(무엇이/어디까지)
• 2단계: 우회/격리(확산 방지)
• 3단계: 복구(백업/스냅샷/대체 VM)
• 4단계: 재발 방지(원인/개선/문서화)
상담/협업 문의
ESXi 체크리스트 요청
ESXi 로드맵
핵심 키워드: ESXi · Type-1 · vCenter · HA/DRS · vSwitch/VLAN · Storage Network · Backup/DR · Runbook

댓글목록0

등록된 댓글이 없습니다.
게시판 전체검색
상담신청