본문 바로가기
기술자료/기타

Dell ObjectScale 아키텍처 심층 분석 - S3 프로토콜 구조부터 RDMA 가속까지

by JCH AI Server 2026. 4. 14.

 

01 Intro

안녕하세요.
기가바이트 서버(GCT) 국내 공식 총판 제이씨현시스템(주) AI Server 솔루션입니다.

오브젝트 스토리지라는 단어는 이제 꽤 익숙해졌지만, 실제로 "그래서 어떻게 구성하냐"는 질문 앞에서 막히는 경우가 많다. Dell ObjectScale X560을 직접 검토하면서 정리한 내용을 공유해 보려고 합니다.


02 ObjectScale이 뭔가요? NAS랑 다른가요?

결론부터 말씀드리면 완전히 다른 유형의 스토리지입니다.

NAS는 파일을 폴더 구조로 저장하고, NFS나 SMB 프로토콜로 접근합니다. 
우리가 윈도우 탐색기에서 네트워크 드라이브를 연결해 사용하는 방식입니다.

오브젝트 스토리지는 파일 대신 오브젝트(Object) 단위로 저장하고 S3 API로 접근합니다. 
AWS S3를 사용해 보셨다면 PutObject, GetObject 같은 방식이 바로 그것입니다. 
폴더 계층 구조가 없고, 버킷(Bucket) 안에 오브젝트가 평면 구조로 저장되는 방식입니다.

ObjectScale은 이러한 S3 호환 오브젝트 스토리지를 온프레미스로 구현한 Dell의 엔터프라이즈 어플라이언스입니다. 
퍼블릭 클라우드(AWS S3)의 확장성을 자사 데이터센터 내부에서 구현한 개념이라고 이해할 수 있습니다.


S3 API — REST로 파일을 다루는 방식

S3 API는 HTTP 기반의 REST 인터페이스입니다. NAS가 탐색기에서 파일을 클릭하는 방식이라면, S3는 애플리케이션이 코드로 HTTP 요청을 보내 데이터를 올리고 내리는 방식이다. 주요 오퍼레이션은 다음과 같습니다.

 

오퍼레이션 설명
PutObject 오브젝트 업로드
GetObject 오브젝트 다운로드
ListObjectsV2 목록 조회
DeleteObject 삭제
HeadObject 메타데이터만 조회

 

endpoint_url만 ObjectScale 주소로 바꾸면 AWS S3용 코드가 그대로 동작한다. 이게 S3 호환성의 핵심입니다 .

 

import boto3 s3 = boto3.client('s3', endpoint_url='https://objectscale주소') s3.upload_file('dataset.tar', 'my-bucket', 'training/dataset.tar') s3.download_file('my-bucket', 'training/dataset.tar', 'local.tar')

 

온프레미스 S3를 쓰는 이유 — 데이터 주권과 레이턴시

금융, 의료, 공공처럼 데이터 국내 보관 의무가 있는 환경에서는 퍼블릭 클라우드 사용이 제한됩니다. ObjectScale은 자사 데이터센터 안에서 동일한 S3 인터페이스를 제공하므로 이 문제를 해결합니다. 내부 25GbE 네트워크로 접근하기 때문에 인터넷을 경유하는 퍼블릭 클라우드보다 레이턴시도 낮습니다.


S3 over RDMA — 차세대 가속 기술

기존 S3는 TCP/IP 기반이라 데이터 전송 시 CPU가 중간에서 모든 복사 작업을 처리합니다. GPU 수백 개가 동시에 데이터를 요청하면 CPU가 병목이 됩니다. Dell은 NVIDIA와 협업해 S3 API를 RDMA로 가속하는 기술을 ObjectScale에 통합했습니다.

 

CPU를 거치지 않고 스토리지에서 GPU 메모리로 데이터를 직접 전송하는 방식으로, Dell 내부 테스트 기준 기존 S3 대비 처리량 230% 향상, 레이턴시 80% 감소, CPU 부하 98% 감소 수치가 나옵니다.


모델별 지원 여부는 다음과 같습니다.

모델 RDMA 지원
ObjectScale X560 ✅ 지원 예정 (Tech Preview)
ObjectScale XF960 ✅ 지원 예정 (Tech Preview)
ECS EX5000 ❌ 미지원

 

현재는 Tech Preview 단계로 곧 정식 지원 예정입니다. ECS EX5000은 이전 세대 플랫폼이라 지원 대상에서 제외됩니다.


03 제품 라인업 한 눈에 보기

Dell ObjectScale은 현재 세 가지 모델로 나뉩니다.

 

(왼쪽) ObjectScale X560 / (중앙) ObjectScale / (오른쪽) ECS EX5000

 

ObjectScale X560 - 이번 포스트의 주인공. HDD 기반 범용 모델로, 대용량 데이터를 비용 효율적으로 담는 게 목적입니다. AI 학습 데이터셋, 미디어 아카이브, 백업 타겟에 적합합니다.

ObjectScale XF960 - 올플래시(NVMe SSD) 모델. 고성능이 필요한 AI 추론, 실시간 분석 워크로드용입니다.

ECS EX5000 - 초대형 아카이브용. 노드당 최대 100개 드라이브를 탑재할 수 있어 엑사바이트 스케일의 장기 보관에 쓰입니다.

X560은 이 중에서 가장 범용적인 포지션이고, Gen3였던 ECS EX300/EX500의 직접적인 후속 모델입니다.


04 X560 하드웨어 구조 이해하기

X560을 이해하는 핵심은 "단일 박스가 아니라 클러스터" 라는 점입니다.

기반 서버는 Dell PowerEdge R760xd2다. 2U 폼팩터에 드라이브 슬롯이 노드당 6개, 12개, 24개 세 가지 옵션으로 나온다. 탑재 가능한 HDD 용량은 2TB부터 최대 24TB까지 선택할 수 있습니다. (모든 드라이브는 동일 용량으로 구성.)

최소 구성 단위는 5노드입니다(서버 5대). 이 5대가 하나의 클러스터를 이뤄야 ObjectScale이 동작합니다. 이는 아래에서 설명할 Erasure Coding 구조와 관련이 있습니다.

최대 구성으로 가면 노드당 24개 × 24TB = 576TB Raw를 탑재할 수 있고, 랙 단위에서는 최대 약 9PB Raw까지 구성 가능합니다.


05 핵심 개념: Erasure Coding과 실제 사용 가능 용량

ObjectScale을 검토할 때 가장 많이 혼동하는 부분이 바로 이 부분입니다.  Raw 용량과 실제 사용 가능(Usable) 용량은 다릅니다.

ObjectScale은 RAID 대신 Erasure Coding(EC) 방식으로 데이터를 보호합니다. 기본 구성인 EC 12+4를 예로 들면, 데이터를 12개 조각으로 나누고 4개의 패리티 조각을 추가로 만들어 각 노드에 분산 저장합니다. 최대 4개 노드가 동시에 장애가 나도 데이터를 복구할 수 있습니다.

다만 패리티로 인해 일정한 오버헤드가 발생합니다. 16개 청크 중 4개가 패리티이므로 오버헤드는 25%, 즉 실제 쓸 수 있는 용량은 Raw의 75%입니다.

실제 계산 예시는 다음과 같습니다.

5노드 × 12드라이브 × 20TB = 1,200TB Raw
1,200TB × 75% = 약 900TB 실사용 가능

 

만약 실사용 870TB를 목표로 한다면, 역으로 계산하면 870 ÷ 0.75 = 1,160TB Raw가 필요합니다.. 5노드 × 12드라이브 × 20TB(= 1,200TB Raw)가 가장 근접한 최소 구성이 됩니다.

견적서를 받을 때 Raw 기준인지 Usable 기준인지 반드시 명시 요청해야 하는 이유가 바로 여기에 있습니다.


06 네트워크 구성: FE / BE 이중 분리

X560은 네트워크를 두 개로 분리해서 운영합니다.

FrontEnd(FE) 네트워크는 클라이언트에서 스토리지로 들어오는 S3 트래픽을 처리합니다.

BackEnd(BE) 네트워크는 노드 간 내부 복제, EC 처리, 클러스터 통신 전용이다. 둘 다 25GbE가 기본입니다.

이 분리 구조 덕분에 대규모 데이터 인제스트가 일어날 때도 클러스터 내부 통신이 영향받지 않습니다. 업링크는 최대 8×100GbE까지 지원해 랙 전체 기준 최대 800Gbps 대역폭을 낼 수 있습니다.


07 소프트웨어 측면에서 주목할 기능들

하드웨어만큼 소프트웨어도 중요합니다. ObjectScale이 단순 스토리지를 넘어 플랫폼으로 불리는 이유가 여기 있습니다.

S3 호환성은 업계 최고 수준이다. S3 API 커맨드 지원 범위 기준으로 경쟁 제품 대비 가장 높다고 Dell이 밝히고 있다. 기존에 AWS S3를 쓰던 애플리케이션을 엔드포인트 URL만 바꿔서 그대로 붙일 수 있습니다.

글로벌 네임스페이스는 멀티사이트 환경에서도 모든 데이터를 하나의 네임스페이스로 통합 관리할 수 있게 해줍니다. 서울 DC와 부산 DR이 있어도 단일 S3 엔드포인트로 접근 가능합니다.

Smart Rebalancing은 노드를 추가하거나 교체할 때 데이터를 자동으로 재분산한다. 운영자가 수동으로 데이터를 옮기지 않아도 됩니다.

Tech Refresh 기능은 기존 ECS(Gen2/Gen3) 환경에서 X560(Gen4)으로 전환할 때 데이터를 현장에서 논스톱으로 이관해주는 자동화 프로세스이며 ECS 운영 중인 환경이라면 굉장히 중요한 기능입니다.


08 어떤 워크로드에 쓰나?

X560의 HDD 기반 대용량·비용 효율 특성이 빛을 발하는 유스케이스는 다음과 같습니다.


AI/ML 데이터 레이크 - 학습용 이미지, 영상, 텍스트 코퍼스 같은 수백TB~수PB 데이터셋을 S3 API로 직접 접근. PyTorch DataLoader, TensorFlow tf.data 등과 바로 연동됩니다.

미디어 & 엔터테인먼트 - 방송사, OTT, 광고 회사처럼 원본 영상을 대량으로 수집·저장하는 환경. 인제스트 속도와 대용량이 동시에 필요한 경우입니다.

엔터프라이즈 백업 타겟 - Veeam, Commvault가 공식 인증(Ready 인증)한 S3 백업 타겟으로 활용. 테이프 아카이브를 오브젝트 스토리지로 전환하는 프로젝트에도 많이 쓰입니다.


09 도입 전 반드시 확인할 것들

검토 단계에서 빠트리면 나중에 문제가 되는 항목들입니다.

  • 견적서 TB 수치가 Raw인지 Usable인지 명시 받을 것
  • 네트워크 스위치(FE/BE 이중화)가 랙 구성에 포함됐는지 확인
  • ObjectScale OS 소프트웨어 라이선스 별도 여부 확인 (용량 기반 과금)
  • ProSupport 등급 선택 — 24×7 필요 여부 사전 결정
  • 기존 ECS 운영 중이라면 Tech Refresh 경로 별도 협의
  • 향후 용량 확장 시 노드 추가만으로 가능한지 드라이브 업그레이드 로드맵도 함께 확인

10 포스팅을 마치며

ObjectScale X560은 퍼블릭 클라우드 S3의 편의성을 온프레미스로 가져오면서, 대규모 데이터 환경에서의 TCO 효율을 챙기려는 기업에 적합한 선택지입니다

특히 AI 인프라 구축이 본격화되면서 "GPU 서버 옆에 놓을 고속 대용량 스토리지"에 대한 수요가 커지고 있는데, X560은 그 포지션에 잘 맞는다. 올플래시가 필요하다면 XF960으로 넘어가면 되고, 두 모델 모두 동일한 ObjectScale 소프트웨어 스택을 공유하는 점도 장점입니다.



앞으로도 제이씨현시스템은 AI 및 첨단 기술 연구를 수행하는 대학·연구기관·기업이 보다 안정적이고 효율적인 환경에서 연구에 집중할 수 있도록 최적의 GPU 서버 및 워크스테이션 솔루션을 제공하며, 전문적인 컨설팅부터 납품, 설치, 구축 지원까지 원스톱으로 제공하고 있습니다.

GPU 서버, 워크스테이션 및 연구용 시스템 구축에 대한 문의는 언제든지 편하게 연락 주시기 바랍니다.

끝까지 긴 글을 읽어주셔서 감사드립니다.

감사합니다.