본문 바로가기
기술자료/기타

GPU 수천 개를 하나로 묶는 비결: NVIDIA ConnectX와 RDMA 기술 총정리

by JCH AI Server 2026. 4. 9.

 

01 Intro

안녕하세요.
기가바이트 서버(GCT) 국내 공식 총판 제이씨현시스템(주) AI Server 솔루션 입니다.

AI 서버 이야기를 하면 대부분 GPU만 떠올립니다.

하지만 실제 AI 서버에서는
네트워크 속도도 매우 중요합니다.

왜냐하면 AI 학습은 여러 서버가 데이터를 계속 주고받으며 진행되기 때문입니다.

이때 사용하는 장비가 바로
NVIDIA ConnectX Ethernet Adapters 입니다.

 

세 가지 주요 GPU 통신 경로를 강조하는 기존(왼쪽) 및 최적화된(오른쪽) 서버 설계와 ConnectX-8 SuperNIC의 비교.

 


쉽게 말하면 👉 AI 서버용 초고속 랜카드입니다.

아래에서는 서버의 구체적인 구성과 핵심 기술 포인트를 간략히 소개해 드립니다.


02 NVIDIA Ethernet Adapter는 무엇인가

일반 PC 랜카드 속도

  • 1Gb
  • 2.5Gb
  • 10Gb

AI 서버 랜카드 속도

  • 25Gb
  • 50Gb
  • 100Gb
  • 200Gb
  • 400Gb
  • 800Gb
  • 1600Gb (1.6Tb)

즉, 엄청 빠른 네트워크 카드입니다.
이 장비는 서버를 초고속 네트워크 스위치와 연결합니다.


03 왜 AI 서버에서 필요할까

 

AI 학습은 보통 GPU 여러 대가 함께 계산합니다.

예를 들어

 


ㆍGPU 서버1
GPU 서버2
GPU 서버3
GPU 서버4

 

이 서버들은 계속 데이터를 교환합니다.

 

데이터 흐름


GPU → 네트워크 카드 → 스위치 → 다른 서버 → GPU

⚠️ 일반적인 데이터 흐름 (CPU 경유 방식)

단계 주요 구성 요소 역할 및 데이터 형태
Step 1 Source GPU Memory 화물(데이터) 생산 및 대기
Step 2 CPU / System Memory [병목 발생] GPU 데이터를 CPU 메모리로 1차 복사
Step 3 Standard NIC CPU로부터 데이터를 전달받아 네트워크 송신
Step 4 Ethernet Switch 일반 네트워크 경로를 통한 데이터 전송
Step 5 Dest. CPU / Memory [지연 발생] 수신된 데이터를 다시 CPU 메모리에 복사
Step 6 Dest. GPU Memory CPU가 GPU 메모리로 데이터를 최종 전달

 

네트워크가 느리면

  • GPU가 기다림
  • 학습 속도 감소

그래서 초고속 네트워크 카드가 필요합니다.


04 NVIDIA ConnectX 주요 제품 비교 (ConnectX-6 ~ 9)

NVIDIA는 여러 종류의 서버용 NIC을 제공합니다.
대표 제품을 쉽게 정리하면 다음과 같습니다.

ConnectX-9 SuperNIC
ConnectX-8 InfiniBand SuperNIC
ConnectX-7

 

📊 NVIDIA ConnectX 시리즈 세대별 비교

제품 최대 속도 주요 특징 주요 사용 환경
ConnectX-6 최대 200GbE PCIe 4.0 기반, RDMA 지원 AI 서버, HPC
ConnectX-6 Dx 최대 200GbE 보안 가속 (TLS/IPsec) 클라우드 데이터센터
ConnectX-7 최대 400GbE GPUDirect Storage 지원 AI 데이터센터
ConnectX-8 최대 800Gb/s SuperNIC 아키텍처 AI 학습 클러스터
ConnectX-9 최대 1.6Tb/s 차세대 SuperNIC 차세대 AI 팩토리

 

NVIDIA ConnectX 시리즈는 10Gb부터 최대 1.6Tb(1600Gb) 초고속 대역폭을 제공하는 데이터센터용 네트워크 인터페이스 카드(NIC)입니다. 특히 최신 ConnectX-9은 PCIe Gen 6.0 지원과 초당 16억 개의 패킷 처리 성능을 바탕으로, 극도로 낮은 지연 시간의 RDMA 및 네트워크 가속 기능을 통해 차세대 AI 팩토리, 하이퍼스케일 클라우드, 대규모 스토리지 플랫폼의 성능을 극대화하도록 설계되었습니다.

📚 AI 서버 네트워크 핵심 용어 정리

용어 기술 설명 왜 중요한가? (핵심 이점)
RDMA
(Remote Direct Memory Access)
CPU를 거치지 않고 서버 간 메모리 데이터를 직접 전송 지연시간·CPU 부하 감소,
전송 속도 극대화
RoCE
(RDMA over Converged Ethernet)
범용 Ethernet 네트워크에서 RDMA를 구현하는 표준 기술 일반 네트워크 환경에서도
초고속 데이터 전송 가능
GPUDirect GPU와 네트워크 카드(NIC) 간 직접 데이터 교환 (GPU ↔ NIC) 데이터 이동 속도 향상,
GPU 연산 활용률 증가
SuperNIC
(Super Network Interface Card)
AI 데이터센터의 대규모 워크로드에 최적화된 초고성능 NIC 수만 개의 GPU 클러스터
연결 및 처리 성능 보장
In-Network Computing 데이터 처리의 일부를 서버가 아닌 네트워크 장비에서 직접 수행 서버 부하 감소 및
시스템 전체 처리 효율 향상

 

NVIDIA ConnectX 네트워크 구조

AI 서버는 보통 이렇게 연결됩니다.

 


서버1 GPU → NIC(ConnectX 네트워크 카드) → 스위치 → NIC → 서버2 GPU

✅ 최신 데이터 흐름 (RDMA/GPUDirect 방식)

단계 주요 구성 요소 역할 및 데이터 형태
Step 1 Source GPU Memory 화물(데이터) 생산 및 대기
Step 2 ConnectX NIC (RDMA) [하이패스] CPU 부하 없이 GPU 메모리에서 직접 화물 상차
Step 3 InfiniBand/Ethernet Switch [초고속 고속도로] 목적지 서버로 최단 경로 배정 및 전송
Step 4 ConnectX NIC (RoCE) 도착한 화물(데이터) 수신 및 하차 준비
Step 5 Dest. GPU Memory [다이렉트 배송] CPU 부하 없이 상대방 GPU 메모리에 직접 화물 꽂기

 

이 구조로

  • 분산 학습
  • 데이터 공유
  • 모델 학습

이 이루어집니다.


05 핵심 정리

AI 서버 환경에서는 여러 서버에 장착된 GPU들이 서로 데이터를 주고받으며 함께 연산을 수행합니다. 이때 GPU 간 데이터 전송 속도가 AI 학습 성능에 큰 영향을 미치며, NVIDIA ConnectX는 서버 간 GPU 통신을 가속하는 초고속 네트워크 인터페이스 카드(NIC)입니다.



앞으로도 제이씨현시스템은 AI 및 첨단 기술 연구를 수행하는 대학·연구기관·기업이 보다 안정적이고 효율적인 환경에서 연구에 집중할 수 있도록 최적의 GPU 서버 및 워크스테이션 솔루션을 제공하며, 전문적인 컨설팅부터 납품, 설치, 구축 지원까지 원스톱으로 제공하고 있습니다.

GPU 서버, 워크스테이션 및 연구용 시스템 구축에 대한 문의는 언제든지 편하게 연락 주시기 바랍니다.

끝까지 긴 글을 읽어주셔서 감사드립니다.

감사합니다.

 

#NVIDIA #ConnectX-5 #ConnectX-6 #ConnectX-7  #ConnectX-8 #ConnectX-9 #SuperNIC  #인피니밴드 #InfiniBand #SmartNIC #GPU네트워킹 #AI서버 #데이터센터 #HPC #인공지능 #차세대네트워크 #서버인프라 #제이씨현시스템 #기가바이트 #GIGABYTE #AI솔루션 #ConnectX5 #ConnectX6 #ConnectX7 #ConnectX8 #ConnectX9 #RDMA