Share
Sign In

Disaster Recovery & Migrations

1. 재난 복구 전략

RPO - 재난이 발생해서 얼마 동안 데이터를 잃었는가? (Data loss)
RTO - 재난이 발생하고 얼마 동안 서비스를 못 하는가? (Downtime)

1. Backup & Restore

주기적으로 제이터를 백업해 놓은 다음, 재난이 발생하면 해당 백업본을 복구하고 서비스를 재시작한다. RPO가 매우 크다.

2. Pilot Light

Backup & Restore과 매우 비슷하지만, AWS 인스턴스를 만들어서 정지시켜 놓는다는 차이가 있다. 이렇게 하면 추가적인 설정을 할 필요없이 빠르게 연결이 가능하다.

3. Warm Standby

모든 시스템을 동일하게 복제해 놓지만, 최소한만 실행시켜 놓는다.

4. Multi Site / Hot Site

모든 시스템을 동일하게 복제하고 실환경에서 돌아가게 한다. 한쪽 시스템이 죽으면 다른 시스템에서 하던대로 하면 된다. 가장 비싸다.

2. Migration 서비스

Database Migration Service (DMS)

데이터베이스를 AWS로 안전하게 이동하도록 도와주는 도구이다. 온프레미스→AWS 와 AWS→AWS 둘 다 가능하다. 이동을 하는 동안에서 원본 데이터베이스는 잘 동작하며, 다른 DB 엔진으로도 전환이 가능하다. 단 이경우 SCT를 써야 한다.
지속적 복제(Continuous Replication)을 하고 싶을 때는 EC2에서 CDC(Change Data Capture) 작업을 수행해 복제할 수 있다.

Schema Conversion Tool (SCT)

DB 엔진이 다를 때, 양쪽 엔진이 이해할 수 있게 스키마를 바꿔주는 서비스이다.

DataSync

방대한 데이터를 온프레미스에서 AWS로 빠르게 옮길 때 사용하는 서비스이다. S3, EFS, FSx for Windows와 호환되며, NFS나 SMB 프로토콜을 통해 통신한다. 매시간 혹은 매일 등 주기적인 복제가 가능하며, DataSync Agent를 설치해야 한다.

Backup

AWS에서 AWS로 옮길 때 사용하는 완전 관리형 서비스이다. 리전, 계정 상관없이 옮길 수 있으며 PITR(Point-in-time recovery) 서비스를 지원해 과거 시점으로 갈 수도 있다. Backup Plan을 작성해 주기적으로 백업한다.

3. 큰 데이터 전송 비교

200TB 데이터를 보내고 싶다고 가정하자
인터넷 / Site-to-Site VPN - 약 180일
Direct Connect - 약 18일
Snowball - 약 1주일