Administrator Guide

여러 있을 경우에 효과적입니다. 이는 데이터를 구성하고 있는 데이터의 실제 시퀀스(0s 1s) 검토하기
때문입니다.
문서가 반복적으로 백업될 때마다 파일이 중복되기 때문에 0s 1s 동일하게 유지됩니다. 0s 1s 시퀀스가
동일하게 유지되므로 블록 중복 제거를 사용하여 파일 간의 유사성을 쉽게 식별할 있습니다. 이와는 반대
, 온라인 데이터에는 차이점이 있습니다. 온라인 데이터는 정확히 동일한 중복 항목이 거의 없습니다. 대신
파일 간에 유사성이 많은 파일이 포함되어 있습니다. 예를 들어, 증가되는 데이터 스토리지 요구사항에 영향
주는 대다수의 파일은 기본 응용프로그램에서 다음과 같이 미리 압축되어 제공됩니다.
이미지 비디오(: JPEG, MPEG, TIFF, GIF, PNG 형식)
복합 문서(: .zip 파일, 이메일, HTML, 페이지 PDF)
Microsoft Office 응용프로그램 문서(Powerpoint, MS-Word, Excel Sharepoint 포함)
노트: DR Series 시스템이 통합하는 데이터에 기본 데이터 소스가 이미 압축을 사용되고 있으면
스템에서 저장량 비율이 감소됩니다. 특히, 처음으로 백업하는 경우에는 데이터 소스에 사용되는
데이터 압축을 비활성화하는 것이 바람직합니다. 저장량을 최적화하기 위해서는 기본 데이터 소스
데이터를 원래의 통합 상태로 DR Series 시스템에 전송해야 합니다.
기존에 압축된 파일의 경우 파일 압축의 특성 0s 1s 원래 형식에서 변경되기 때문에 블록 중복 제거가
율적으로 작동되지 않습니다. 데이터 중복 제거는 다수의 중복 데이터를 없애는 특수한 데이터 압축 형태입니
. 압축 기술은 스토리지 사용률을 향상시키며 네트워크 데이터 전송에 사용하면 링크 간에 전송해야 하는
이트 수를 줄일 있습니다. 중복 제거 사용, 데이터의 고유 청크 또는 바이트 패턴은 분석 중에 식별되어 저장
있습니다. 분석이 계속 진행됨에 따라, 기타 청크는 저장된 사본과 비교되어 일치하는 항목이 있을 경우
장된 청크를 나타내는 작은 참조 항목으로 중복 청크가 대체됩니다. 따라서 저장하거나 전송해야 하는 데이터의
양을 줄여 네트워크 저장량을 개선합니다. 네트워크 저장량은 중복 제거가 이미 적용된 데이터의 복제 프로세스
통해 실현됩니다.
반면에, 표준 파일 압축 도구는 개별 파일 내에서 단기적으로 반복되는 서브스트링을 식별하며 스토리지 기반
데이터 중복 제거는 대규모 데이터 볼륨을 검사하고 전체 파일 또는 파일 내의 대규모의 동일한 섹션 등과 같은
대규모 데이터를 식별합니다. 작업이 완료되면 시스템은 특정 데이터의 사본 하나만 저장할 있습니다.
사본은 단일 파일 압축 기술을 통해 자동으로 압축됩니다. 예를 들어, 이메일 시스템에 100 이상의 메일이
함되어 있고 동일한 1MB 파일이 첨부 파일로 전송되는 경우 다음과 같이 처리됩니다.
데이터 중복 제거를 사용하지 않으면 이메일 시스템이 백업될 때마다 동일한 첨부 파일의 100 인스턴
스가 모두 저장되므로 100MB 스토리지 공간이 필요합니다.
데이터 중복 제거를 사용하면 중복 제거 비율이 100 1 첨부 파일의 인스턴스 하나만 실제로 저장
됩니다(이후의 모든 인스턴스는 저장된 하나의 사본에 다시 참조됨). 첨부 파일을 나타내는 데이터의
청크는 블록 청크 레벨에서 중복 제거됩니다.
노트: DR Series 시스템은 암호화된 데이터의 중복 제거는 지원하지 않으므로, 암호화된 데이터
합에서 파생된 중복 제거 저장량이 없습니다. DR Series 시스템은 이미 암호화된 데이터를 중복
거할 없습니다. 암호화된 데이터는 고유하여 중복 제거할 없다고 판단하기 때문입니다.
자체 암호화 드라이브(SED) 사용되는 경우, 백업 응용프로그램에서 데이터를 판독할 SED 또는 임호화 레이
어에 의해 암호가 해독됩니다. 이는 SED 저장된 MS-Word 문서를 열었을 때와 동일한 방식으로 작동됩니다.
, SED 저장된 모든 데이터를 판독하여 중복 제거할 있음을 의미합니다. 백업 소프트웨어에서 암호화를
활성화하면 데이터가 암호화될 때마다 DR Series 시스템이 이를 고유한 데이터로 인식하기 때문에 중복 제거
장량이 유실됩니다.
복제: 복제는 데이터 스토리지 환경에서 중복 리소스 간에 일관성을 유지하기 위해 여러 스토리지 장치에서
일한 데이터를 저장하는 프로세스입니다. 데이터 복제 기능은 내결함성 수준을 향상시키므로 저장된 데이터
유지 관리의 안정성을 개선하고 동일한 저장 데이터에 액세스할 있도록 합니다. DR Series 시스템은 활성
형태를 사용하므로 기본 백업 스키마를 구성할 있습니다. 복제가 진행되는 동안, 시스템은 지정된 소스에
지정된 대상(원래 소스 데이터의 복제 역할)으로 데이터 스토리지 요청을 처리합니다.
14