빅데이터는 이제 새로운 이슈가 아닙니다. 이미 모든 기업에서 인정하고 있는 패러다임입니다. 뿐만아니라 클라우드, 모바일, 사물인터넷, 소셜, 어날리틱스는 데이터의 급속한 성장을 견인하고 있습니다. 이러한 데이터 성장에는 비정형 데이터가 있으며 이를 필요로 하는 모든 기업과 조직은 새로운 데이터 에코시스템이 필요합니다. 이 포스트에는 이러한 비정형 데이터의 효과적인 백업과 아카이빙에 대해서 알아봅니다.

1

1. 백업과 아카이빙의 차이

백업과 아카이빙은 얼핏 비슷한 것 같지만, 근본적으로 다른 목적을 가지고 있습니다. 백업은 복구 목적으로 사용하는 데이터의 2차 또는 3차 사본으로 문제가 발생할 경우 특정 시점으로 복구를 가능하게 하며 일반적인 보존 기간은 단기간 입니다. 즉, 백업은 접근 시기에 따라 정도의 차이가 있기는 하지만, 원본과 시점 차이가 있는 사본입니다. 아카이빙은 정보의 1차 소스로 사본이 아닌 원본입니다. 그러나 접근 빈도가 낮아 향후 접근이 필요한 데이터를 대상으로 하며 주로 장기간 보존합니다. 또한 이를 위한 보관 주기나 폐기를 위한 정책이 필요합니다.

2. 백업과 아카이빙의 도전

백업과 아카이빙은 원본 데이터의 형태나 그 크기에 따라 많은 도전을 받습니다. 데이터의 양이 통제가 어려울 만큼 늘어남에 따라 그것을 백업, 아카이빙하기 위해 투자되어야 하는 시간과 저장장치는 점점 더 짧은 시간과 더 많은 공간을 필요로 하게 됩니다. 이는 단순이 높은 성능과 더 큰 용량의 저장장치를 도입하는 것으로 해결할 수 없습니다. 높은 성능과 많은 공간은 필연적으로 높은 비용과 연결되며, 확장성이나 보안 등에 대해서도 많은 도전을 받을 수 있습니다. 전통적인 방식의 백업과 아카이빙 솔루션은 새로운 시대에 걸맞는 저장장치를 지원할 수 있도록 빠르게 변화하고 있습니다. 오브젝트 스토리지는 모든 데이터를 평면상에 펼쳐서 저장합니다. 정보 분산 알고리즘(IDA)를 이용하여 보안성도 매우 우수합니다. 늘어나는 데이터에 대한 부담을 쉽게 덜어줄 수 있는 효율적인 저장장치 입니다. 이러한 오브젝트 스토리지를 백업 아카이빙에 사용할 수는 없을까요?

2

3. 오브젝트 스토리지를 이용한 효율적인 백업과 아카이빙

시장에는 매우 많은 백업과 아카이빙 솔루션이 경쟁하고 있습니다. 이들 솔루션 중 대부분이 오브젝트 스토리지를 그들의 저장장치로 활용할 수 있도록 지원하고 있습니다. 즉 다시 말해서 기존의 백업 아카이빙 저장장소를 오브젝트 스토리지로 변경하는 것 만으로 백업 아카이빙의 효율화를 위한 한 걸음을 내딛을 수 있습니다.

그 예로, IBM에서 제공하는 Spectrum Protect(a.k.a TSM) 솔루션은 오브젝트 스토리지를 효율적으로 사용할 수 있도록 변화하였습니다. Spectrum Protect는 S3와 같은 프로토콜을 별도의 변환 장치 없이 지원할 수 있으며, on-prem/off-prem/hybrid 모두를 동시에 지원하는 IBM Cloud Object Storage를 백업 저장소로 활용할 수 있습니다. 이는 VTL방식에 비해 저렴하며, 데이터 분산 저장 알고리즘(IDA) 적용으로 2, 3차 백업의 요구사항을 원천 제거합니다. 기본적으로 제공되는 암호화 기능은 백업 데이터의 보안성을 향상시킬 수 있습니다. 무엇보다 중요한 것은 이러한 백업 데이터를 on/off-prem을 아울러 hybrid형태로 보관할 수 있다는 것입니다. 그리고 IBM Spectrum Protect 뿐 아니라 Netbackup, Commvault 등과 같은 엔터프라이즈 백업 솔루션 모두를 지원할 수 있도록 설계되었으므로 사용중인 백업 솔루션과도 호환성이 뛰어납니다.

3


앞서 설명했듯, 아카이빙의 경우에는 원본 데이터의 2, 3, 4차의 사본이 아닌 원본 그 자체입니다. 따라서 아카이빙은 복구를 위함이 아닌 낮은 접근 빈도로 인해 값비싼 Primary 저장장치에서 제거하여 보다 비용 효율적인 저장장치에 보관하는 것이 목적입니다. 백업에 비해 데이터의 더욱 높은 안정성이 요구되는 이유는 아카이빙 데이터가 원본 그 자체인 것이 이유입니다. 많은 기업들은 일반적으로 아카이빙에 콜드 아카이빙을 적용 해 왔습니다. 접근 빈도가 매우 낮은 데이터의 경우에는 테이프가 적합하기 때문입니다. 과연 이 방법이 모든 고객에게 적합할까요?

사내에 임직원이 사용하는 e메일 서버용 스토리지에서 1-2년이 지난 e메일을 아카이빙 한다고 가정 해 봅시다. 자주 찾아보지는 않지만, 언제 누가 어떤 e메일에 접근할 지 알 수 없습니다. 십수년 전에 비해 e메일의 크기는 비교할 수 없을 만큼 커졌습니다. 미디어는 어떨까요? 미디어 사업자의 경우, 송출을 완료한 미디어 컨텐츠를 값싼 저장장치에 아카이빙 해 두었습니다. 빈도수는 매우 낮겠지만, 꺼내 써야 하는 경우가 발생할 경우, 단위 컨텐츠당 방대한 크기로 인해 접근 용이성이 매우 떨어집니다. 이러한 이유로 다시 온라인 아카이빙의 필요성이 대두되고 있습니다. 아무리 아카이빙이라 할 지라도, 원하는 데이터를 즉시 꺼내올 수 없다면 필연적으로 생산성의 저하로 이어지기 때문입니다. 부가적으로, 데이터의 성격, 활용방안, 컨텐츠의 종류 등에 따른 메타데이터를 활용할 수 있다면 생산성 향상은 물론이고 이를 통한 부가가치를 창출할 수 있기 때문입니다.

4


이러한 온라인 아카이빙을 위해서 NAS 스토리지를 고려하는 대신 오브젝트 스토리지를 고려할 수 있습니다. 아카이빙만을 위한 저장장치에 수십가지나 되는 NAS 기능은 짐이 됩니다. 이는 비용 상승을 가져올 수 있으며, 오브젝트 스토리지에 비해 낮은 확장성과 어플리케이션 호환성은 온라인 아카이빙으로 적합하지 않습니다.

더군다나 하나의 오브젝트 스토리지로 백업과 아카이빙 모두를 지원할 수 있으며, 이러한 스토리지를 on/off-prem 어디든 원하는 곳에 구축할 수 있으며, 한국 뿐 아니라 Asia를 거쳐 전 세계에 아우르는 IBM Cloud 데이터센터를 이용하여 데이터에 대한 접근 용이성과 안전성을 매우 손쉽게 확보할 수 있습니다.

4. 마치며

IBM Cloud Object Storage는 이미 오랜 기간 시장에서 검증을 받은 바 있습니다. 최근 Gartner에서 발표한 Critical Capabilities for Object Storage, March 2016 에서 백업 및 아카이빙, 클라우드 스토리지 등을 아울러 전체 1위로 평가되었으며, MarketScape Worldwide Object-Based Storage Vendor Assessment, Dec. 2016 에서 Capabilities and Strategy 모든 측면에서 리더로 평가 받았습니다. 명실공히 오브젝트 스토리지에서는 시장의 리더로 그 입지를 공고히 하고 있으며, 최근 한국에서도 클라우드 서비스를 런칭하는 등 그 영역을 크게 확대하고 있습니다.

5


데이터 증가에 따라 필연적으로 도전받게 되는 백업과 아카이빙을 IBM Cloud Object Storage를 통해 보다 비용 효율적이면서 높은 생산성 유지, 보안성과 유연성을 확보하면서, 나아가 새로운 부가가치를 창출할 수 있는 형태로 설계할 수 있습니다.