banner

블로그

Jan 26, 2024

Huawei와 IEEE Kazakhstan Subsection, HPC 무손실 이더넷 및 AI 패브릭 네트워크 기술 백서 공동 발표

이번 백서는 카자흐스탄에서 처음으로 개최된 화웨이 중동 및 중앙아시아 기술 카니발 2023의 일환으로 공개됐다.

알마티, 카자흐스탄:화웨이와 IEEE 카자흐스탄 분과는 네트워크 성능 호환성, 비용 효율성 및 유연성 측면에서 타의 추종을 불허하는 장점 덕분에 고성능 컴퓨팅(HPC) 및 AI 시나리오를 촉진하는 네트워크 솔루션인 무손실 이더넷에 대해 조명하는 백서를 공동으로 발표했습니다.

HPC 무손실 이더넷 및 AI 패브릭 네트워크 기술 백서라는 제목의 이 보고서는 매년 열리는 화웨이 중동 및 중앙 아시아(ME&CA) 기술 카니발의 첫날에 열린 화웨이 네트워크 서밋에서 발표되었습니다. 6월 5일부터 7일까지 카자흐스탄 알마티에서 처음으로 개최됩니다. '함께 새로운 가치를 위한 선도적인 디지털 인프라'라는 주제로 화웨이의 ME&CA Tech Carnival은 업계 오피니언 리더들을 한자리에 모아 디지털화의 무한한 가능성을 탐구합니다.

백서 발간식에는 Huawei 데이터 통신 제품 라인의 데이터 센터 네트워크 도메인 사장 Arthur Wang, IEEE 카자흐스탄 하위 섹션의 Carlo Molardi 박사, Huawei 중동 엔터프라이즈 비즈니스 그룹 부사장 Liu Gui가 참석했습니다. 및 중앙아시아 지역; 아랍에미리트 Ankabut의 CEO인 Fahem Al Nuaimi.

전 세계적으로 많은 국가와 지역에서 디지털 변혁을 촉진하기 위해 HPC 및 AI 개발에 도움이 되는 정책을 적극적으로 수립하고 있으며, 무손실 이더넷은 이러한 노력에서 핵심적인 역할을 계속할 것입니다.

예를 들어, 사우디아라비아는 글로벌 경쟁력 향상을 위해 HPC 및 AI 기술 개발을 목표로 사우디 비전 2030을 수립했습니다. 또한 HPC 및 AI 프로젝트의 R&D를 지원하기 위해 KACST(King Abdulaziz City for Science and Technology)를 설립했습니다. 카타르는 또한 HPC와 AI 기술을 추진하기 위한 국가 비전 2030을 발표했습니다. 카타르 컴퓨팅 연구소(Qatar Computing Research Institute)는 기술 혁신을 촉진한다는 사명을 가지고 HPC 및 AI에 중점을 둔 카타르 최고의 연구 기관입니다. UAE도 국가 AI 전략 2031을 수립하고 세계 최초로 AI 장관을 임명했다.

UAE의 첨단 연구 및 교육 네트워크(NREN)인 Ankabut는 슈퍼컴퓨팅 센터에 무손실 이더넷을 채택하여 35개 교육 기관과 80개 대학에 컴퓨팅 서비스를 제공하고 기상 예측 및 모델링, 생명 과학, 유체 역학 등 분야의 연구를 지원했습니다. 그리고 석유 탐사.

Ankabut의 CEO인 Fahem Al Nuaimi 박사는 "Ankabut는 회원 기관과 국가를 위한 최첨단 연구 개발과 협력을 촉진하는 역할을 하고 싶어합니다. 이 역할을 위해서는 고급 네트워크가 중요합니다. Huawei와 같은 파트너와 협력하는 것은 , 우리는 UAE 대학을 연구 분야의 리더로 만들겠다는 우리의 사명을 발전시키는 데 도움이 되는 미래 지향적인 네트워크를 만들 수 있습니다."

백서에 따르면 무손실 이더넷 기술은 지능형 RDMA(Remote Direct Memory Access) 및 NSLB(Network Scale Load Balancing)를 채택하여 패킷 손실 제로와 90% 초고속 네트워크 처리량을 달성하는 데 도움이 됩니다.

보고서는 HPC 네트워크 아키텍처인 Clos, 다중 레일 및 직접 연결 토폴로지(DCT)로 시작됩니다. Clos는 각 스위칭 장치가 하위 단계의 모든 스위칭 장치에 연결되는 다단계 아키텍처입니다. 엄밀히 말하면 비차단, 재배치 및 확장이 가능합니다. Multi-Rail은 모듈형 장치의 셀 스위칭을 채택하여 절대적인 로드 밸런싱을 구현합니다. DCT는 초대형 네트워킹, 저렴한 비용, 적은 수의 엔드투엔드 통신 홉을 특징으로 합니다.

그런 다음 이 문서에서는 소프트웨어 아키텍처가 네트워크 최적화와 네트워크 및 애플리케이션 시스템의 수렴 및 최적화라는 두 가지 측면에서 HPC 및 AI 애플리케이션 성능을 향상시키는 방법을 자세히 설명합니다. 네트워크 최적화의 목표는 다음 기술을 포함하여 전체 네트워크의 처리량을 최대화하고 대기 시간을 최소화하는 것입니다.

공유하다