디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

AMD, 인스팅트 MI325X·5세대 에픽 정식 출시··· 'AI 슈퍼사이클 잡는다'

IT동아갤로그로 이동합니다. 2024.10.11 06:08:27
조회 807 추천 0 댓글 0
[IT동아=샌프란시스코]

“우리는 고성능 컴퓨팅이 전 세계를 구성하는 기본 요소라고 믿으며, 클라우드, 의료, 산업, 자동차, 통신, PC, 게임 등 세계에서 가장 중요한 과제를 해결하기 위해 기술을 사용하고 있다. 오늘날 매일 수십억 명의 사람들이 AMD 제품을 사용하며, 그중 가장 흥미로운 응용 분야는 AI다. 앞으로도 이 분야에 더 많은 컴퓨팅이 필요해진다”


리사 수 AMD 최고경영자가 샌프란시스코 모스콘 센터에서 열린 ‘어드밴싱 AI’ 행사의 기조연설을 진행 중이다 / 출처=IT동아



글로벌 반도체 설계 기업 AMD가 현지시간으로 10월 10일, 미국 캘리포니아주 샌프란시스코 모스콘 센터에서 ‘어드밴싱 AI’ 행사를 열고 새로운 인스팅트 AI 가속기 및 서버용 에픽 프로세서, 네트워킹 장비, 기업용 프로세서 등을 공개했다. 이번에 출시된 AMD 인스팅트 MI325 AI 가속기는 인스팅트 MI300의 후속으로, 256GB의 HBM3E 메모리로 엔비디아 H200과 경쟁한다.

5세대 에픽(EPYC) 프로세서는 앞서 대만 컴퓨텍스 2024에서 주요 정보가 사전에 공개된 바 있으며, 이번 행사를 통해 공식 출시하고 올 하반기 판매를 시작한다. AMD의 기업용 제품군인 라이젠 프로 AI 300 프로세서 제품군, 데이터센터용 AMD 펜산도 폴라라 400 네트워킹 인터페이스 카드, 펜산도 셀리나 400 데이터 처리 장치(DPU)도 함께 공개됐다.

AMD MI325X AI 가속기 출시, 엔비디아 H200과 경쟁


AMD는 지난해 12월, 데이터서버용 AI 가속기인 인스팅트 MI300 시리즈를 공식 출시했다. 이후 5월부터 제품 인도가 시작됐고, 현재 마이크로소프트, 오픈AI, 메타에서 활용 중이며, 코히어, 스태빌리티AI, 에센셜AI를 비롯한 25개 주요 파트너사에서 운용 중이다.


AMD의 새로운 AI 가속기, AMD 인스팅트 MI325X가 공식 출시됐다 / 출처=IT동아



이번에 출시되는 인스팅트 MI325X는 고성능 버전인 MI300X의 후속으로, 전작의 192GB HBM3에서 더 상향된 256GB HBM3E 메모리를 갖추며, 메모리 대역폭도 초당 5.3TB에서 6TB로 늘었다. 8개를 연결한 구성에서는 초당 896GB의 인피티니 패브릭 대역폭으로 연결되며, 2TB의 HBM3E 메모리와 48TB의 대역폭을 갖춘다. 성능은 FP8 기준 20.8PF(페타플롭스), FP16 기준 10.4PF를 제공한다.


인스팅트 MI325X는 엔비디아 H100 및 H200의 대체제로 나선다 / 출처=IT동아



엔비디아의 고성능 AI 가속기인 H200과 비교해도 1.3배 높은 FP16 및 FP8 성능과 1.8배 높은 메모리 용량, 1.3배 높은 메모리 대역폭을 갖춘다. 추론 성능은 H200 HGX 시스템과 비교해 라마 3.1 405B 모델을 1.4배 더 빨리 처리하며, 라마 3.1 70B 모델은 1.2배 빨리 처리한다. 훈련 기능도 크게 강화돼 엔비디아 H200과 인스팅트 MI325X를 단일 비교했을 때 라마 2 7B 모델을 1.1배, 8개 구성에서는 라마 2 70B 모델과 동등한 처리 성능을 제공한다.

2025년 출시 예정인 인스팅트 MI350 시리즈도 첫선



차세대 AI 가속기인 MI350 시리즈의 MI355X에 대한 자료도 일부 공개됐다 / 출처=IT동아



아울러 2025년 출시 예정인 차세대 제품인 인스팅트 MI350 시리즈에 대한 주요 정보도 공개됐다. MI350 시리즈는 3nm 공정 기반에 CDNA4 아키텍처를 활용하며, 288GB의 HBM3E 메모리와 FP4 및 FP6 처리를 새롭게 지원한다. 8대를 구성한 구성에서는 최대 2.3TB의 HBM3E 메모리와 64TB의 메모리 대역폭을 갖추며, 이를 통해 18.5PF(페타플롭스)의 FP16, 37P FP8, 새로 지원하는 FP6 및 FP4도 각각 74PF의 처리 성능을 지원한다.

세부 모델인 인스팅트 MI355X는 MI325X와 비교해 1.8배 빠른 FP16, FP8 처리 성능을 제공한다. 3세대 이전 제품인 MI300과 비교하면 7.4배 향상된 AI 플롭스 처리 성능, 처리 가능한 모델 크기는 6배나 커졌다. AMD는 올해 4분기 중 인스팅트 MI325X 생산을 시작하고, 내년 1분기 중 델 테크놀로지스, 에비덴, 기가바이트, HPE 등 주요 파트너사에서 판매를 시작한다. AMD는 2025년 중 MI350을 출시하고, 26년에는 MI400 시리즈를 낼 예정이다.


밤시 보파나 AMD AI 부문 선임 부사장이 ROCm 6.2 버전에 대한 성능 향상을 소개하고 있다 / 출처=IT동아



한편 AMD 개발 생태계를 확대하기 위한 ROCm 관련 소식도 덧붙였다. AMD ROCm 6.2 버전은 6.0과 비교해 LLM 처리 성능을 최소 1.9배에서 2.8배까지 끌어올렸고, 훈련 성능 역시 평균 1.8배 향상됐다. AMD는 ROCm 호환성 향상을 위해 올해 7월 인수한 AI 스타트업 사일로AI를 투입한다. AMD 사일로 AI 조직은 약 200여 개의 유럽 언어 기반 LLM 작업을 수행한 바 있다.

5세대 에픽 최대 192코어 384스레드··· 서버 점유율 30% 노린다


AMD는 4세대 에픽 프로세서를 통해 시장 점유율을 27%까지 끌어올렸으며, 현재 350개의 OEM 플랫폼과 950여 개의 클라우드 인스턴스로 제공된다. AMD는 5세대 에픽 프로세서를 통해 30% 이상 점유율 확보를 목표로 하며, 서버 CPU 시장 주도와 전력 효율성 확보, AI 기능 강화를 핵심 목표로 설정했다.


128코어 제품은 16개의 4nm 칩을 칩렛으로 엮었고, 192코어 버전은 12개의 3nm 칩을 칩렛으로 엮었다 / 출처=IT동아



프로세서는 3/4나노미터 젠5, 젠5C 아키텍처가 혼용된다. 젠5 아키텍처는 최대 128코어 256스레드까지 있고, 젠5C 아키텍처가 최대 192코어 384스레드로 구성된다. SP5 소켓은 그대로 유지되며, 5GHz의 동작 속도와 AVX-512 명령어를 512b 데이터 패스를 최대 지원한다. 소비전력은 최소 8코어 155W에서 최대 192코어 500W로 설정된다. 메모리는 12채널 DDR5-6400을 지원하고, 소켓당 최대 6TB의 메모리를 인식한다. PCIe 5.0는 128레인에 암호화를 지원하고, CXL 2.0 규격 저장장치도 호환된다. 보안 측면에서는 트러스티드 I/O를 처음 지원한다.


1세대 에픽과 비교해 코어 수는 6배, 성능은 11배가 늘었다 / 출처=IT동아



성능 측면에서는 사이클당 명령어 처리 횟수가 기업용 클라우드 환경에서 최대 17% 향상됐고, 고성능 컴퓨팅 및 AI 처리는 37% 향상된다. SPECrate_2017_Int_처리속도는 5세대 인텔 코어 8592+ 64코어 모델을 1로 설정할 때, 192코어 에픽 9965 모델이 2.7배 빠르다. 작업 속도도 비디오 전환 속도 4배, 작업용 앱 2.3배, 오픈 소스 데이터베이스 처리 속도 4배, 이미지 렌더링 속도는 3배 늘었다. 시뮬레이션 시각화 속도는 64코어 기준 1.6배, 고성능 컴퓨팅 환경에서 모델링 및 시뮬레이션 처리는 3.9배까지 빨라졌다.


AI CPU 성능은 경쟁사 제품 대비 최대 3.8배 늘었다는 설명이다 / 출처=IT동아



AI 처리 성능 면에서는 5세대 인텔 8592+와 비교해 XG부스트 머신러닝 속도는 3배, 엔드투엔드 AI 성능 및 유사성 검색은 3.8배, LLM 성능은 1.9배 늘었다. 인스팅스 MI300을 최대로 연결했을 때 인텔 8592+ 대비 추론 성능은 8%, 학습 성능은 20% 더 늘어난다. 엔비디아 H100과 연결 시에는 GPU 추론 성능은 20%, 학습 성능은 15% 앞선다.


인텔 제온 플래티넘 8280 1000대로 구성된 서버를 에픽 9965 131개만으로 대체할 수 있다 / 출처=IT동아



공간 및 효율 측면에서는 인텔 제온 플래티넘 8280 1000개로 구성된 서버를 에픽 9965 131개만으로 대체할 수 있으며, 이때 공간 효율은 7배 정도 줄어든다. 소비전력도 68% 줄어들고, 3년 간 총 소유비용도 67% 줄인다. 가격은 8코어 제품인 9015가 최소 527달러(70만 원대)부터 시작하며, 128코어 9755가 1만 2984달러(약 1745만 원), 젠5C 아키텍처 기반의 192코어 9965가 1만 4813달러(약 1990만 원)로 설정된다.

AI PRO 300 시리즈, 네트워크 프로그래밍 지원 DPU도 출시



기업용 노트북 프로세서인 AMD 라이젠 AI 프로 300 시리즈도 공개됐다 / 출처=IT동아



AMD의 기업용 프로세서인 라이젠 프로 제품군도 AI 300 시리즈과 마찬가지로 리브랜딩 됐다. 새로운 라이젠 AI 프로 300 시리즈는 마이크로소프트 코파일럿을 지원하며, RDNA 3.5 기반의 16개 GPU 코어와 2세대 XDNA NPU를 탑재해 최대 55TOPS(초당 55조 회 연산) 성능을 낸다. 프로세서 구성은 라이젠 AI 9 HX PRO 375 및 370이 12코어 24스레드, 라이젠 AI 7 프로 360이 8코어 16스레드다.

기업용 제품인 만큼 데이터 무결성 등을 검증하는 보안 프로세서와 제어 흐름 공격 방지 기능, 보안 부팅 등을 기본 지원하고, 클라우드 베어메탈 복구와 서플라이 체인 시큐리티, 와치독 타이머가 새로운 기능으로 추가됐다.


포레스트 노로드 데이터센터 솔루션 비즈니스 유닛 수석 부사장이 AMD 3세대 P4 엔진과 이를 기반으로 한 펜산도 셀리나 400, 폴라라 400 카드를 각각 공개했다 / 출처=IT동아



AMD는 데이터서버의 프론트앤드용으로 AMD 펜산도 셀리나 DPU를, 백엔드 환경에서는 업계 최초로 울트라 이더넷 컨소시엄(UEC) 규격을 지원하는 AMD 펜산도 폴라라 400 네트워킹 인터페이스 카드(NIC)를 각각 출시한다. 셀리나 DPU는 이전 세대에 비해 2배 성능 및 대역폭을 제공하며, 최대 400GB의 처리량을 지원한다. 두 제품은 모두 샘플링 단계에 있고, 올해 4분기 중 고객을 확보한 뒤 내년 상반기에 출시된다.

올해로 재임 10년 차 맞은 리사 수, AI로 새로운 도약 간다



AMD에게 있어서 올해는 대전환의 해다. 실적이나 프로덕트 측면에서도 이상적인 상황이다 / 출처=IT동아



리사 수 AMD 최고경영자는 지난 9월 열린 골드만삭스 커뮤나코피아 & 테크놀로지 콘퍼런스에서 “AMD는 1년 주기로 AI 로드맵을 가속화하고 있다”라며, “AI 슈퍼사이클은 이제 시작”이라고 말한 바 있다. 이번에 출시된 AMD 인스팅트 MI325는 앞서 밝힌 제품 로드맵에 맞춰 출시된 첫 제품이며, 이에 대한 시장의 기대는 상당하다.

지난 7월 열린 2분기 실적 발표에서 리사 수 최고경영자는 “AI칩에 대한 수요가 급증해 올해 매출 예상치를 40억 달러에서 45억 달러로 상향했다”라고 말했고, 2분기 매출과 순이익 모두 전년 대비 9%, 19%씩 증가했다. 특히나 경쟁사인 엔비디아가 차세대 칩인 ‘블랙웰’ 출시를 약 3개월가량 늦춘 상황에서, AMD 인스팅트 MI325X는 예정대로 출시돼 AMD가 AI 시장의 수요를 조금 더 먼저 받아낼 수 있게 됐다.

리사 수 AMD 최고경영자는 “이번 주가 AMD에서 일한 지 10주년이 되는 해다. 우리의 일은 너무나 중요하고, 이 산업에 함께하게 된 점은 행운이라 생각한다. AMD는 고성능 컴퓨팅과 AI의 한계를 계속 넓히고 있다. 이것은 이제 시작이다”라고 덧붙였다.

글 / IT동아 남시현 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ AMD 인스팅트로 분주해진 서버 파트너사, 주요 신제품은?▶ RTX 40 시리즈 단종 초읽기, 앞으로의 그래픽 카드 선택지는?▶ [투자를IT다] 2024년 10월 1주차 IT기업 주요 소식과 주가 흐름



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 손해 보기 싫어서 피해 입으면 반드시 되갚아 줄 것 같은 스타는? 운영자 24/11/18 - -
4556 전문가가 제시하는 스타트업 ESG 경영 전략…’2024 서울 스타트업 ESG 포럼’ IT동아갤로그로 이동합니다. 11.21 14 0
4555 수원대학교 'WoW 스타트업 브랜치 오픈이노베이션' 개최 IT동아갤로그로 이동합니다. 11.21 16 0
4554 [스타트업리뷰] 로닉 “인공지능 맞춤형 음식 도우미, AI 로봇셰프 큐브” IT동아갤로그로 이동합니다. 11.21 1677 0
4553 [IT기획자의 탄생] 3. IT기획자에게 필요한 상상력과 글로벌 전략 IT동아갤로그로 이동합니다. 11.21 32 0
4552 [IT’s 가성비] 삼성 크리스탈 UHD TV, 2024년형/85인치 모델에 눈길? IT동아갤로그로 이동합니다. 11.21 1778 0
4551 [스케일업] 클리카 [3] 피터 노빅과의 대담으로 살펴본 'AI 스타트업'의 방향성 IT동아갤로그로 이동합니다. 11.21 31 0
4550 [생활 속 IT] LG 가전 활용도 넓히는 'LG ThinQ' 연결 및 사용법 IT동아갤로그로 이동합니다. 11.21 25 0
4549 [생활 속 IT] 소프트웨어 활용 습관 바꿔줄 윈도 11 ‘가상 데스크톱’ [1] IT동아갤로그로 이동합니다. 11.20 75 0
4548 [부산창경 BEF 2024] 기술로 문제 풀이와 오답 노트 작성 효율 높인 ‘프라이머스’ IT동아갤로그로 이동합니다. 11.20 46 0
4547 IBM-연세대, 슈퍼컴 능가하는 127 큐비트 양자컴퓨터 국내 첫 도입 [3] IT동아갤로그로 이동합니다. 11.20 4756 4
4546 [주간스타트업동향] 휴머닉스, 위플로 CES 2025 혁신상 수상 外 IT동아갤로그로 이동합니다. 11.20 96 0
4545 [부산창경 BEF 2024] 만만한녀석들 “모듈형 집기로 친환경 MICE 산업 선도한다” IT동아갤로그로 이동합니다. 11.20 45 0
4544 [부산창경 BEF 2024] 나누기월드 “외국인 유학생, 장애인 문제 해결에 기여” [4] IT동아갤로그로 이동합니다. 11.20 249 0
4543 선박 제조업의 디지털 전환 이끄는 ‘버추얼 트윈’ 기술 IT동아갤로그로 이동합니다. 11.19 74 0
4542 에릭슨엘지 “네트워크도 API로 제공…개발자 참여 독려해야” IT동아갤로그로 이동합니다. 11.19 74 0
4541 [IT애정남] 노트북 SSD의 OEM 파티션, 삭제해도 되나요? IT동아갤로그로 이동합니다. 11.19 78 0
4540 [부산창경 BEF 2024] 그린에너지(주) “산업 현장 악취·유해물질 플라즈마로 해결” IT동아갤로그로 이동합니다. 11.19 78 0
4539 [자동차와 法] 행락철 교통사고 책임과 법적 대처 방안 IT동아갤로그로 이동합니다. 11.19 667 0
4538 아이작 컨셉츠 김태영 대표, "반도체·열유체 공학의 산학협력 교두보 만들겠다" IT동아갤로그로 이동합니다. 11.19 75 0
4537 [시승기] 돋보이는 디자인과 안전 사양 ‘KGM 액티언’ [1] IT동아갤로그로 이동합니다. 11.18 351 0
4536 +불필요한 PC 앱, 지우려면 이렇게! [이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 11.18 5089 5
4535 [스케일업] 반프 [3] 정예솔 전략총괄 “반프의 가치, 글로벌 시장에서도 매력적” IT동아갤로그로 이동합니다. 11.18 107 0
4534 [주간투자동향] 숨빗AI, 50억 원 규모 시드 투자 유치 外 IT동아갤로그로 이동합니다. 11.18 99 0
4533 [투자를IT다] 2024년 11월 2주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.16 199 0
4532 [스케일업] 보라웨어 [2] 전영복ㆍ이효주 “구성원 복지ㆍ기업 성장이 공존하는 곳” IT동아갤로그로 이동합니다. 11.15 193 0
4531 [생성 AI 길라잡이] 8종의 AI 모델 골라 쓰는 ‘SKT 에이닷’ 웹 버전 IT동아갤로그로 이동합니다. 11.15 181 0
4530 디지포레, “제조산업의 디지털 전환, ‘팩토리얼 프로’로 앞당길 것" IT동아갤로그로 이동합니다. 11.15 174 0
4529 [리뷰] 모니터링 헤드폰의 새로운 기준점 제시, 소니 MDR-M1 [5] IT동아갤로그로 이동합니다. 11.15 6191 1
4528 [2024 고려대] 스페이스점프 “자영업·소상공인 기자재의 모든 것, 소상공간” IT동아갤로그로 이동합니다. 11.15 166 0
4527 퀄컴, 온디바이스 AI·차량 전동화에 초점 맞춘 최신 솔루션 선보여 IT동아갤로그로 이동합니다. 11.15 186 0
4526 [창업도약+경북대] 비빔블 “비커스ㆍ버튜디오로 상상 이상의 가상경험 제공할 것” IT동아갤로그로 이동합니다. 11.15 143 0
4525 [AI와 미래] 기존 저작물은 AI 학습에 어디까지 활용할 수 있을까? IT동아갤로그로 이동합니다. 11.15 1363 0
4524 [월간자동차] 24년 10월, 신차 등록 두 달 연속 증가…싼타페 판매 1위 IT동아갤로그로 이동합니다. 11.15 138 0
4523 [리뷰] 10G 업링크 지원 네트워크 스위치, 넷기어 GS108MX IT동아갤로그로 이동합니다. 11.14 166 0
4522 데이터 주권 강조하는 소버린 AI, 진정한 의미는? [1] IT동아갤로그로 이동합니다. 11.14 698 0
4521 [스케일업] 스쿨버스 [3] 통학버스 전문 플랫폼 개발자 인터뷰 IT동아갤로그로 이동합니다. 11.14 168 0
4520 [UDC 2024] 다양한 산업을 변화시키는 블록체인의 힘 IT동아갤로그로 이동합니다. 11.14 161 0
4519 로봇과 문화예술의 만남, 브이디컴퍼니x장 줄리앙의 종이세상 IT동아갤로그로 이동합니다. 11.14 317 0
4518 [IT애정남] 갤럭시워치를 아이폰과 연결해서 쓸 수 있나요? IT동아갤로그로 이동합니다. 11.13 4653 0
4517 [신차공개] BMW ‘뉴 4시리즈 그란 쿠페’·로터스 ‘에메야’ 공식 출시 [3] IT동아갤로그로 이동합니다. 11.13 4755 1
4516 [스타트업-ing] 오아시스 스튜디오 “OVP·오닉스·디보틀로 콘텐츠 에코시스템 구축” IT동아갤로그로 이동합니다. 11.13 172 0
4515 [생활 속 IT] 취업 서류, 정부24에서 내려받는 법 IT동아갤로그로 이동합니다. 11.12 206 0
4514 기한 지나면 과태료…운전면허 적성검사 및 갱신 방법 살펴보니 IT동아갤로그로 이동합니다. 11.12 2385 3
4513 [창업도약+경북대] 준컴퍼니 “자동차 구매부터 판매까지 아우르는 모빌리티 통합 플랫폼 꿈꾼다” IT동아갤로그로 이동합니다. 11.12 196 0
4512 [스케일업] 모넷코리아 [2] HDC랩스와 협업 통해 AIoT 기반 부동산 관리 플랫폼 고도화 IT동아갤로그로 이동합니다. 11.12 229 0
4511 [2024 고려대] R2C컴퍼니 “데이터 수요·공급자 만족 이끄는 플랫폼” IT동아갤로그로 이동합니다. 11.12 647 0
4510 갤럭시 스마트폰의 위젯 기능, 제대로 쓰려면? IT동아갤로그로 이동합니다. 11.12 255 1
4509 [AWS 인더스트리 위크 2024] 국내 금융/핀테크 기업에 AWS 솔루션은 이렇게 적용됐다 [1] IT동아갤로그로 이동합니다. 11.11 2038 1
4508 '제조 스타트업 대상으로 소싱디렉팅·제품 제작까지'··· 서울과기대의 실질적 지원 들여다보니 IT동아갤로그로 이동합니다. 11.11 217 0
4507 [AWS 인더스트리 위크 2024] AWS가 실현하고 있는 인공지능 기술의 현재 IT동아갤로그로 이동합니다. 11.11 275 0
뉴스 디즈니, ‘무빙2’ 제작 공식화…APAC 콘텐츠 총괄 “강풀 작가와 추진 시작” 디시트렌드 11.21
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2