Administrator Guide

이 여러 개 있을 경우에 효과적입니다. 이는 데이터를 구성하고 있는 데이터의 실제 시퀀스(0s 및 1s)를 검토하기

때문입니다.

문서가 반복적으로 백업될 때마다 파일이 중복되기 때문에 0s 및 1s 가 동일하게 유지됩니다. 0s 및 1s 시퀀스가

동일하게 유지되므로 블록 중복 제거를 사용하여 두 파일 간의 유사성을 쉽게 식별할 수 있습니다. 이와는 반대

로, 온라인 데이터에는 차이점이 있습니다. 온라인 데이터는 정확히 동일한 중복 항목이 거의 없습니다. 그 대신

각 파일 간에 유사성이 많은 파일이 포함되어 있습니다. 예를 들어, 증가되는 데이터 스토리지 요구사항에 영향

을 주는 대다수의 파일은 기본 응용프로그램에서 다음과 같이 미리 압축되어 제공됩니다.

• 이미지 및 비디오(예: JPEG, MPEG, TIFF, GIF, PNG 형식)

• 복합 문서(예: .zip 파일, 이메일, HTML, 웹 페이지 및 PDF)

• Microsoft Office 응용프로그램 문서(Powerpoint, MS-Word, Excel 및 Sharepoint 포함)

노트: DR Series 시스템이 통합하는 데이터에 기본 데이터 소스가 이미 압축을 사용되고 있으면 시

스템에서 저장량 비율이 감소됩니다. 특히, 처음으로 백업하는 경우에는 데이터 소스에 사용되는

데이터 압축을 비활성화하는 것이 바람직합니다. 저장량을 최적화하기 위해서는 기본 데이터 소스

가 데이터를 원래의 통합 상태로 DR Series 시스템에 전송해야 합니다.

기존에 압축된 파일의 경우 파일 압축의 특성 상 0s 및 1s 가 원래 형식에서 변경되기 때문에 블록 중복 제거가 효

율적으로 작동되지 않습니다. 데이터 중복 제거는 다수의 중복 데이터를 없애는 특수한 데이터 압축 형태입니

다. 압축 기술은 스토리지 사용률을 향상시키며 네트워크 데이터 전송에 사용하면 링크 간에 전송해야 하는 바

이트 수를 줄일 수 있습니다. 중복 제거 사용, 데이터의 고유 청크 또는 바이트 패턴은 분석 중에 식별되어 저장

할 수 있습니다. 분석이 계속 진행됨에 따라, 기타 청크는 저장된 사본과 비교되어 일치하는 항목이 있을 경우 저

장된 청크를 나타내는 작은 참조 항목으로 중복 청크가 대체됩니다. 따라서 저장하거나 전송해야 하는 데이터의

양을 줄여 네트워크 저장량을 개선합니다. 네트워크 저장량은 중복 제거가 이미 적용된 데이터의 복제 프로세스

를 통해 실현됩니다.

반면에, 표준 파일 압축 도구는 개별 파일 내에서 단기적으로 반복되는 서브스트링을 식별하며 스토리지 기반

데이터 중복 제거는 대규모 데이터 볼륨을 검사하고 전체 파일 또는 파일 내의 대규모의 동일한 섹션 등과 같은

대규모 데이터를 식별합니다. 이 작업이 완료되면 시스템은 특정 데이터의 사본 하나만 저장할 수 있습니다. 이

사본은 단일 파일 압축 기술을 통해 자동으로 압축됩니다. 예를 들어, 이메일 시스템에 100 개 이상의 메일이 포

함되어 있고 동일한 1MB 파일이 첨부 파일로 전송되는 경우 다음과 같이 처리됩니다.

• 데이터 중복 제거를 사용하지 않으면 이메일 시스템이 백업될 때마다 동일한 첨부 파일의 100 개 인스턴

스가 모두 저장되므로 100MB 의 스토리지 공간이 필요합니다.

• 데이터 중복 제거를 사용하면 중복 제거 비율이 약 100 대 1 로 첨부 파일의 인스턴스 하나만 실제로 저장

됩니다(이후의 모든 인스턴스는 저장된 하나의 사본에 다시 참조됨). 첨부 파일을 나타내는 데이터의 고

유 청크는 블록 청크 레벨에서 중복 제거됩니다.

노트: DR Series 시스템은 암호화된 데이터의 중복 제거는 지원하지 않으므로, 암호화된 데이터 통

합에서 파생된 중복 제거 저장량이 없습니다. DR Series 시스템은 이미 암호화된 데이터를 중복 제

거할 수 없습니다. 암호화된 데이터는 고유하여 중복 제거할 수 없다고 판단하기 때문입니다.

자체 암호화 드라이브(SED)가 사용되는 경우, 백업 응용프로그램에서 데이터를 판독할 때 SED 또는 임호화 레이

어에 의해 암호가 해독됩니다. 이는 SED 에 저장된 MS-Word 문서를 열었을 때와 동일한 방식으로 작동됩니다.

즉, SED 에 저장된 모든 데이터를 판독하여 중복 제거할 수 있음을 의미합니다. 백업 소프트웨어에서 암호화를

활성화하면 데이터가 암호화될 때마다 DR Series 시스템이 이를 고유한 데이터로 인식하기 때문에 중복 제거 저

장량이 유실됩니다.

복제: 복제는 데이터 스토리지 환경에서 중복 리소스 간에 일관성을 유지하기 위해 여러 스토리지 장치에서 동

일한 키 데이터를 저장하는 프로세스입니다. 데이터 복제 기능은 내결함성 수준을 향상시키므로 저장된 데이터

유지 관리의 안정성을 개선하고 동일한 저장 데이터에 액세스할 수 있도록 합니다. DR Series 시스템은 활성 복

제 형태를 사용하므로 기본 백업 스키마를 구성할 수 있습니다. 복제가 진행되는 동안, 시스템은 지정된 소스에

서 지정된 대상(원래 소스 데이터의 복제 역할)으로 데이터 스토리지 요청을 처리합니다.