RAID 란 무엇인가? 여러 디스크를 사용하는 레이드에 대해 알아보자.

Author name

2025년 02월 15일




NAS에 관련된 포스팅을 하면서 RAID를 언급을 종종 했는데 정작 그 내용에 대해서 얘기해본 적이 없는 것 같아 블로그의 성격대로 가능하면 쉽게 다뤄보려한다. 요즘은 개인이 저장소를 관리하는 의미가 많이 퇴색된  시대이다. 클라우드 서비스가 활성화 되어 있고 컨텐츠를 단순 소비하는 데에는 굳이 데스크탑이 아니더라도 모바일로 해결이 가능해졌다. RAID라고 하면 무슨 말인지 모를 뿐 더러 알 필요도 없을지 모른다. 하지만 클라우드 서비스는 용량이 늘어남에 따라 지출은 계속 속될 것이고 데이터는 계속 증가하게 될 것이다. 결국은 작은 규모라도 저장소를 개인이 가지고 있는 것이 경제적이라 NAS 혹은 DAS를 구매하는 것이 좋다. 개인이 가진 각자의 데이터는 소실되면 단순히 웹에서 다운로드 받을 수 있는 성격의 것들이 아니기 때문에 2중, 3중의 백업이 필수적이다. 여기에서 RAID라는 기술이 필요하게 된다.

 

RAID

 

1. RAID(Redundant Array Independent Disk)

여러 디스크를 배열해서 사용한다는 대략 그런 뜻이다. 핵심은 단일 디스크가 아니고 여러 디스크라는 것이다. 우리가 일반적으로 휴대하는 외장디스크는 M2 타입이던 2.5인치 타입이던 하나의 디스크가 들어간다. 하나의 디스크가 충격을 받아 손상된다면 데이터를 복구할 수 있는 확률은 극히 낮아진다는 말이다. 그래서 최소 2개의 디스크부터 여러 개의 디스크를 조합해서 사용하면 반대로 복구할 수 있는 확률은 높아질 것이다.

 

RAID에는 대략 2가지의 목적이 있다고 볼 수 있는데 속도 혹은 안정성이다. 대표적으로 RAID 0, RAID 1 이 두 가지로 나뉘는데

 

2. RAID0, RAID1

RAID 0 은 2개의 디스크에 나눠서 기록하고 읽는 방식이다. 전문적인 수치를 들먹일 필요없이 상식적으로 생각해보자. 노트 10장을 채워야 하는 숙제를 받았다. 당연히 혼자하는 것보다 5장씩 나누어 2명이 한다면 훨씬 빨리 끝날 것이다. 단순 계산하면 2배 빠르다. 대신 노트 1장이라도 음료수를 쏟던가 해서 번져버리면 선생님께는 결국 숙제를 제출하지 못할 것이다.

 

raid0
숙제는 빨리 끝나지만 한 페이지라도 망치면 숙제를 낼 수 없다.

 

RAID 1 은 2개의 디스크에 똑같이 기록하고 읽는 방식이다. 노트 10장을 채워야 하는 숙제를 2명이 10장씩 똑같이 쓰는 것이다. 어찌보면 똑같은 내용을 2명이 10장씩 쓴다는 것은 비효율적이다. 하지만 노트 한권이 통째로 음료수에 젖어 번져버려도 나머지 한 명이 똑같은 복사본을 가지고 있기 때문에 숙제를 제출할 수 있다.

raid1
숙제가 2장이라 노트 한권을 잃어버려도 숙제를 제출할 수 있다.

 

속도냐 안정성이냐의 문제인데 요즘은 SATA 인터페이스에 비해 속도가 엄청나게 빠른 NVMe 인터페이스가 대중화 되었고 그에 맞는 디스크 또한 가격이 안정화 되고 있어 굳이 RAID0은 큰 의미가 없다. NVMe SSD를 RAID로 묶는 등의 실험적인 시도를 하는 사람도 간혹 있는데 이미 NVMe SSD 하나의 속도로도 사용하는 데에 전혀 불편함이 없기 때문에 RAID1에 초점을 맞추도록 하자.

위의 그림에서 볼 수 있듯 똑같이 생긴 똑같은 능력을 가진 사람 둘 이다. RAID를 구성하는 디스크는 가능하면 같은 브랜드의 같은 용량이면 좋다. 하지만 그럴 수 없는 상황이라면 브랜드는 다르더라도 용량은 맞추어주는 것이 좋다. 똑같이 숙제를 해야하는데 그 중 한 명이 능력이 모자라서 10페이지까지 못하고 8페이지까지만 한다면 나머지 사람은 10페이지를 할 수 있어도 8페이지까지 밖에 못할 것이다. 더불어 디스크의 물리적 수명이 동시에 다 되지 않도록 제조일의 편차가 있으면 좋다. 두 디스크 중 하나는 살아있어야 새로운 디스크에 내용을 다시 복사할 수 있기 때문이다.

 

3. RAID5, RAID6

데이터가 많아져 디스크를 2개 이상 사용해야할 때에는 RAID1을 사용할 수 없다. 이때에는 서로 똑같이 기록하는 방식으로 대응이 힘들어져 패리티 비트를 사용하는데 쉽게 답을 찾을 수 있는 ‘힌트’를 같이 노트에 기록한다고 생각하자.

raid5
노트를 하나 잃어버려도 힌트를 조합해서 노트 내용을 다시 만들어 낼 수 있다.

 

하지만 디스크가 2개 동시에 고장나면 힌트가 모자라서 노트내용을 복구해낼 수 없다. RAID1은 직접 복사를 하기에 용량이 많이 부족하겠지만 노트내용 전부가 아니라 힌트를 요약해서 저장하기 때문에 힌트의 총용량은 디스크 1개다. 예를 들어 디스크를 5개를 RAID 5로 묶었다면 실제 데이터를 저장할 수 있는 용량은 디스크4개 이다.

 

 

raid6
힌트를 하나 더 추가했다. 노트를 2개 잃어버려도 힌트가 더 많기에 내용을 복구할 수 있다.

 

디스크가 2개 고장나도 복구를 할 수 있다. 대신에 총 디스크 중 2개가 힌트를 저장하는 데에 이용된다. 만일 6개의 디스크를 사용하고 있다면 총 데이터를 저장할 수 있는 용량은 4개 뿐이다. RAID5보다 안정성을 더 보장 받는 대신 디스크를 하나 더 손해 본다.

필자는 8베이의 NAS를 RAID6으로 묶어 결과적으로 총 6개의 디스크 공간을 사용할 수 있다.




4. RAID를 고려한 NAS, DAS 선택

하드웨어 RAID, 쉽게 말해 기판에 RAID를 설정하는 전담 칩이 박혀있는 형태가 예전에는 가격이 저렴하지 않았다. 그래서 소프트웨어 RAID, 쉽게 말해 프로그램으로 RAID를 설정하는 형태가 있었다. Windows에서 지원하기도 하고 따로 RAID 소프트웨어도 있었지만 안정적인 것은 당연히 전담하는 부품이 있는 하드웨어 RAID일 것이다. 요즘 출시 되는 DAS는 하드웨어 RAID를 대부분 다 지원하기 때문에 DAS를 구입한다면 상세설명에서 쉽게 지원되는 RAID를 찾아볼 수 있다.

owc

wd
대부분 이렇게 하드웨어 RAID가 지원된다.

 

따라서 DAS를 구입한다면 디스크를 몇개 넣을 수 있는지 베이(bay) 수와 연결 인터페이스(USB타입) 정도를 따져보면 될 것이다. 개인이 사용하는 데에는 2bay 정도만 되어도 크게 문제가 없을 것이다.

 

5. JBOD, SPAN

외장 하드케이스(2베이 이상)를 살펴보면 이런 용어들을 보게 된다. JBOD는 디스크(용량이 서로 달라도 가능)를 논리적(소프트웨어적)으로 붙여서 마치 하나의 디스크 처럼 사용할 수 있게 만드는 것이다. 다만 RAID0과는 다르게 파손된 디스크에 담겨있는 데이터만 소실된다. 반면 RAID0은 둘 중 하나만 파손되도 모두 소실된다. 당연히 그저 하나의 디스크로 보이게 만들어 사용하는 것이기 때문에 RAID0의 속도를 기대할 수 없다. SPAN 또한 하나의 디스크로 합쳐서 사용하나 파일을 조각내어 나누어 저장하는 방식이라 속도가 떨어진다.

 

6. 맺음

NAS나 DAS나 결국 최종 목적은 데이터의 안전 보관 및 소실 시 복구, 즉 안정성이라고 생각한다. 웹에서 쉽게 다운로드 받을 수 있는 데이터는 소실되어도 상관없지만 본인만이 소유한 데이터는 소실되면 복구할 수 없다. 그렇기에 마치 보험에 가입하는 처럼 디스크를 더 추가하는 것이다. 사고가 안나면 가장 좋은 일이고, 만에 하나 사고가 났을 경우 이를 복구할 수 있는 여지를 만드는 것. 이것이 목적이다.

SSD와 HDD에 대한 포스팅에 다룬 적이 있는데 가능하면 데이터는 복구확률이 높은 HDD를 사용하도록 하자. SSD는 반도체에 전기신호로 데이터를 저장하는 것이라 HDD에 비해 물리적 충격에는 강할지라도 전기적 충격(정전기 등)을 받게 되면 거의 다 소실되어 복구할 수 없을 가능성이 높다.

그럼 이제 본인의 소중한 데이터를 위해 RAID로 보험에 가입하도록 하자.

Leave a Comment