디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

‘NPU+GPU 성능 개선’ AMD 라이젠 AI 300 프로세서의 핵심 요소는?

IT동아갤로그로 이동합니다. 2024.07.17 13:19:42
조회 1071 추천 0 댓글 0
[IT동아 강형석 기자] AMD가 코드명 ‘스트릭스 포인트(Strix Point)’로 알려진 3세대 라이젠 AI 프로세서로 인공지능(AI) PC 시장 선점에 나선다. 에이수스, 게이머 공화국(Republic Of Gamers – ROG), 레노버, HP, 엠에스아이(MSI) 등 주요 노트북 제조사와 협력 중이며 약 150개 이상 AI 노트북 PC 제품을 시장에 선보인다는 계획이다. 출시는 2024년 3분기 내에 이뤄질 것으로 보인다.

잭 후인(Jack Huynh) AMD 수석 부사장 및 컴퓨팅ㆍ그래픽스 총괄 관리자는 2024년 7월 9일(미국 현지 시간), 미국 로스앤젤레스 웨스틴 보나벤처 호텔에서 개최된 AMD 테크데이 연단에 올라 3세대 라이젠 AI 프로세서를 소개하고 PC 시장 변화에 대한 AMD의 기술 전략을 언급했다.


AMD는 라이젠 AI 300 시리즈 탑재 노트북을 150개 이상 확대한다는 방침이다. / 출처=IT동아



“젠(Zen) 반도체 설계의 중앙처리장치는 세상을 놀라게 했다. 클럭 사이클당 명령어 처리 수(IPC) 성능을 한 단계 높였고 이후에는 7나노미터 칩과 14나노미터 입출력 칩을 결합하는 ‘트리플렛(Triplelet)’ 기술을 적용했다. 구리 대 구리 하이브리드 본딩 기술을 적용한 3D 시스템-온-칩(SoC)은 설계의 경계를 허물었다. 최고의 게이밍 프로세서를 추구한 그래나이트 릿지(Granite Ridge)는 밀도 높은 내부 상호연결 기술로 캐시 용량을 확보했다. 지난해에는 처음으로 전용 신경망 처리장치(NPU)를 가속처리장치(APU)에 통합, AI PC의 전환을 주도 중이다.”

AMD가 라이젠 프로세서에 적용해 온 기술들을 나열한 잭 후인 수석 부사장은 3세대 라이젠 AI 프로세서에 3가지 핵심 요소가 있음을 강조했다. 하나는 차세대 반도체 설계인 5세대 젠(Zen) 설계를 적용한 것이고 다음은 모바일 환경에 맞춰 조율한 그래픽 처리장치(GPU), 마지막은 50 TOPS 연산 능력을 가진 신경망 처리장치(NPU)다.

8비트 정수 연산의 속도와 반정밀도 부동소수점의 정교함 더한 NPU


신경망 처리장치에는 2세대 XDNA 설계가 적용됐다. AMD가 인수한 자일링스(Xilinx) 기술에 뿌리를 두고 있다는 점이 특징이다. 라이젠 AI 300 프로세서에 적용된 신경망 처리장치는 50 TOPS(초당 1조회 정수연산) 사양이다. 이는 마이크로소프트가 코파일럿+ PC 구동에 적합하다고 강조한 40 TOPS를 뛰어넘는 수치다. 2024년 하반기 해당 칩을 탑재한 노트북 PC는 온-디바이스(On-Device) AI 처리 능력을 충분히 갖췄다고 봐도 무방하다.

1세대 XDNA 설계 기반 신경망 처리장치는 10 TOPS 사양에 불과했다. 이 칩 안에는 인공지능 엔진 타일(이하 AI 타일)이 20개가 배치됐다. 2세대는 이를 32개로 늘렸다. 중요한 것은 인공지능 관련 데이터 구조에 따라 AI 타일을 운용하는 방법이 달라졌다. 기본적으로 각각의 AI 타일이 유연하게 대응하지만, 큰 데이터를 처리할 때는 8개씩 4개 구역으로 나눠 처리한다.


2세대 XDNA 설계는 AI 타일이 상황에 따라 유연하게 대응하도록 만들어 성능을 높였다. / 출처=IT동아



예로 작은 크기의 데이터는 각 AI 타일이 처리하다가 인공지능 기반 영상과 음성 데이터가 등장하면 8개 AI 타일이 하나처럼 뭉쳐 영상과 음성을 처리한다. 추가로 콘텐츠 생성 애플리케이션에서 인공지능 데이터 처리를 요구하면 8+8 형태로 뭉쳐 운영될 수 있다. 작은 데이터는 32개 AI 타일이 각각, 큰 데이터는 1~4개 AI 타일처럼 작동하는 셈이다.

AMD는 2세대 XDNA 설계를 적용하며 기존 대비 타일당 다중누적연산(MACs) 능력을 2배 높였다. AI 타일이 빠르게 메모리에 접근할 수 있도록 용량도 1.6배 늘리는 등 성능 개선에 집중했다. 이 외에도 라이젠 7040 시리즈 대비 컴퓨팅 처리 능력은 5배, 전력 효율은 2배 개선되는 효과를 가져왔다.


2세대 XDNA 설계는 라이젠 7040 대비 처리 능력은 5배, 전력 효율은 2배 개선됐다. / 출처=IT동아



또 다른 핵심 요소는 블록 반정밀도(Block FP16) 기술이다. 8비트 정수 연산과 반정밀도(FP16) 부동소수점 연산을 더한 것이다. 8비트 정수 연산은 속도는 빠르지만 정확도는 낮고, 반정밀도 부동소수점 연산은 느리지만 높은 정확도를 갖췄다. 두 장점을 더함으로써 16비트 정확도로 8비트 처리 능력을 제공할 수 있다는 입장이다.

밤시 보파나(Vamsi Bopanna) AMD 인공지능 그룹 수석 부사장은 “자체 역량을 갖춘 소프트웨어 개발사들은 언어 모델을 빨리 처리하는 것을 원한다. 이번에 개발한 블록 반정밀도 부동소수점은 매우 가치 있는 일이 될 것이라 생각한다. 타 신경망 처리장치와 차별화가 된다고 본다”고 말했다.

그래픽 성능 개선 이룬 RDNA 3.5 내장 그래픽 처리장치


온-디바이스 인공지능 시대가 와도 PC라는 사실은 변함이 없다. 인공지능 외에도 생산성 작업이나 게이밍 등 기본기도 갖춰야 한다는 이야기다. AMD는 라이젠 AI 300 프로세서의 내장 그래픽 처리장치(iGPU) 성능 향상을 통해 여러 작업에 대응하도록 준비했다. 특히 기존 3세대 RDNA 설계를 개선한 3.5세대 RDNA 설계로 전력 소모와 성능의 균형을 맞췄다.

3.5세대 RDNA 설계에서는 샘플링 속도를 두 배 높였다. 3D 뼈대 위에 재질, 색상 등을 입히는 텍스처의 샘플 단위를 두 배 높인 형태인데 병렬 처리 구조를 더해 속도를 높였다. 이 외에도 보간과 비교율도 두 배 높였다. 2차 예비 메모리(L2 캐시)와 주 메모리 등에 접근하는 구조도 최적화한 점도 눈길을 끈다.


3.5세대 RDNA 설계 기반 그래픽 처리장치는 처리 구조를 개선해 성능과 전력 효율을 높였다. / 출처=IT동아



최종 내장 그래픽 처리장치의 성능은 크게 향상됐다. 이전 세대 동급 제품에 15W 열설계전력(TDP)을 적용한 결과, 3D마크 타임 스파이 테스트에서 최대 32%, 나이트 레이드 테스트에서 19% 성능 향상을 이뤄냈다. 전기를 적게 쓰면서 최대 성능을 낸다는 점은 노트북의 운용 시간에 영향을 주기에 긍정적인 변화라 할 수 있다.

마크 페이퍼마스터(Mark Papermaster) AMD 부사장 및 최고기술책임자는 “3.5세대 RDNA 설계는 모바일 환경에 이상적인 구조다. 감소된 전력 소비로 높은 효율을 구현했다. 최근에는 삼성과 협력해 갤럭시 스마트폰에 맞춰 최적화하고 라이선스를 부여한 바 있다. 다른 시장이지만, 라데온 그래픽 처리장치의 이상적 경험이 가능할 것”이라고 말했다.


에이수스를 포함해 여러 노트북 PC 제조사에서 라이젠 AI 300 탑재 제품을 선보일 예정이다. / 출처=IT동아



AMD는 라이젠 AI 300 프로세서가 적용된 노트북 PC를 여럿 소개했다. 에이수스(ASUS)는 젠북(Zenbook) S16, 터프 게이밍(TUF Gaming) A14, 프로아트(ProArt) P16 등을 공개했다. MSI도 프레스티지(Prestige) 노트북이 전시됐다. 이 외에 레노버, 레이저 등 여러 노트북 제조사를 통해 향후 몇 개월 안으로 150여 이상 제품을 출시할 예정이다. 모두 마이크로소프트 코파일럿+ PC에 대응한다.

글 / IT동아 강형석 (redbk@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 코파일럿+PC가 연 'AI PC 시대', 제조사 별 시장 전략은?▶ ‘AI PC 경쟁 이제부터’ AMD, 라이젠 AI 300ㆍ라이젠 9000 시리즈 CPU 공개▶ 그래프코어, 소프트뱅크에 인수·· 왜 왕년의 기대주는 추락했나



추천 비추천

0

고정닉 0

7

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 축의금 적게 내면 눈치 줄 것 같은 스타는? 운영자 24/11/11 - -
4116 젠슨 황·저커버그 대담으로 들여다본 '생성형 AI의 향방' IT동아갤로그로 이동합니다. 07.30 238 0
4115 [정구태의 디지털자산 리터러시] 디지털자산 업계의 다양성 확보와 건강한 생태계 조성 IT동아갤로그로 이동합니다. 07.30 914 0
4114 [스타트업-ing] 선상원 로드원 대표, “허니콤 볼라드로 사고를 방지합니다” [1] IT동아갤로그로 이동합니다. 07.30 395 0
4113 삼성전자, 2024 파리 올림픽 메달리스트 대상 ‘셀카 마케팅’ 나서 [5] IT동아갤로그로 이동합니다. 07.29 2715 5
4112 [리뷰] 집에서도 고주파로 피부 케어, 메디큐브 에이지알 울트라튠 40.68 IT동아갤로그로 이동합니다. 07.29 787 0
4111 [SBA x IT동아] 여성 과학자들이 만든 페미닌 헬스케어 스타트업 ‘이너시아’ IT동아갤로그로 이동합니다. 07.29 234 0
4110 [리뷰] 에이수스 젠북 S 16 OLED로 확인해 본 AMD 라이젠 AI 9 HX 370 [14] IT동아갤로그로 이동합니다. 07.29 2695 1
4109 [스타트업-ing] 로웨인 “로봇으로 차세대 수직농장 현실화” IT동아갤로그로 이동합니다. 07.29 229 1
4108 [스타트업-ing] CIT “ASE 증착 기술, 국내외 다양한 성과 이어져” IT동아갤로그로 이동합니다. 07.29 222 0
4107 [주간투자동향] 딜리버스, 146억 원 시리즈B 투자 유치 IT동아갤로그로 이동합니다. 07.29 214 0
4106 [이럴땐 이렇게!] 해외 여행 시 플러그와 전압 정리 한 눈에 IT동아갤로그로 이동합니다. 07.29 736 1
4105 [리뷰] AI 시대의 워크스테이션 노트북, 델 프리시전 5690 [4] IT동아갤로그로 이동합니다. 07.29 695 0
4104 [투자를IT다] 2024년 7월 4주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 07.28 5152 2
4103 [농업이IT(잇)다] 넥스트그린, 기후변화 속 고부가가치 작물 재배 ‘식물공장 육묘 시스템’을 제안하다 IT동아갤로그로 이동합니다. 07.26 279 0
4102 [자동차 디자人] 영국 스포츠카 브랜드 ‘로터스’ 디자인 수장 ‘벤 페인’ IT동아갤로그로 이동합니다. 07.26 289 0
4101 [생성 AI 길라잡이] 내 손으로 만드는 광고 시안, 코바코 'AiSAC' [4] IT동아갤로그로 이동합니다. 07.26 8611 2
4100 [리뷰] 성능은 갖추고 가격은 낮췄다, 낫싱 CMF 버즈 프로 2 IT동아갤로그로 이동합니다. 07.26 760 0
4099 [SBA x IT동아] 고차원 “아프기 전 관리하는 구강·수면 케어 전파” IT동아갤로그로 이동합니다. 07.26 937 0
4098 마이바흐 첫 전기차 ‘EQS SUV’ 출시…주행가능 거리 612km IT동아갤로그로 이동합니다. 07.25 291 0
4097 [스타트업 첫걸음] 멘토링, 멘티가 되는 것도 준비가 필요하다 IT동아갤로그로 이동합니다. 07.25 286 0
4096 [스타트업-ing] 이영은 이니티움 대표, “초등학생도 음악을 작곡할 수 있습니다” [7] IT동아갤로그로 이동합니다. 07.25 5995 1
4095 리클 “의류 재활용 비즈니스를 위한 업무혁신, 그랜터 AI로 가속화” IT동아갤로그로 이동합니다. 07.25 302 0
4094 [SBA X IT동아] 아임토리 “로봇 팔 도입한 제조업 현장, AI 공정 최적화로 효율 극대화” IT동아갤로그로 이동합니다. 07.25 1090 0
4093 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 21 IT동아갤로그로 이동합니다. 07.25 250 0
4092 람보르기니 ‘분당 전시장’ 오픈…최초 하이브리드 SUV ‘우루스 SE’ 공개 IT동아갤로그로 이동합니다. 07.24 270 0
4091 방문 어려운 해외∙오지 분석, “인공위성으로 한 눈에” - 스텔라비전 IT동아갤로그로 이동합니다. 07.24 236 0
4090 DAXA, 자율규제안 제·개정 “가상자산법 안착 위해 노력할 것” IT동아갤로그로 이동합니다. 07.24 933 0
4089 릿툰 “웹툰도 이젠 숏폼이 대세, 인스타그램 아닌 전문 플랫폼 필요” [동국대학교 캠퍼스타운] IT동아갤로그로 이동합니다. 07.24 244 0
4088 ‘케이블 노출 없이 깔끔하게’ 에이수스, BTF 설계로 PC 시장 변화 주도 나선다 IT동아갤로그로 이동합니다. 07.24 255 0
4087 ‘클라우드에서 AI PC까지’ 인공지능 시대를 위한 AMD의 전략 IT동아갤로그로 이동합니다. 07.23 518 1
4086 [신차공개] 르노 ‘그랑 콜레오스’ 가격 공개·KGM ‘액티언’ 흥행 예고 IT동아갤로그로 이동합니다. 07.23 329 0
4085 클라우드 오류가 불러온 '사이버 정전', 발생 원인과 교훈은? IT동아갤로그로 이동합니다. 07.23 521 1
4084 [자동차와 法] 판례로 보는 휴가철 교통사고 IT동아갤로그로 이동합니다. 07.23 471 0
4083 [혁신스타트업 in 홍릉] 틸더 “의료데이터 활용, 소비자에 실질적 혜택 제공하는 게 관건” IT동아갤로그로 이동합니다. 07.23 278 0
4082 운약근답올핏 “혼자 할 수 있는 재활 운동 기구 ‘라이클’을 개발합니다” [동국대학교 캠퍼스타운] IT동아갤로그로 이동합니다. 07.23 236 0
4081 [스케일업] 두디스 [2] 어센트코리아 "경영자는 모든 것을 숫자로 판단해야" IT동아갤로그로 이동합니다. 07.23 5058 0
4080 [정구태의 디지털자산 리터러시] 건전한 디지털자산 시장을 위한 민간 중심 감시시스템 구현 IT동아갤로그로 이동합니다. 07.22 211 0
4079 텐스토렌트, 웜홀 AI 가속기 판매 돌입··· '증명의 시기 왔다' [10] IT동아갤로그로 이동합니다. 07.22 2895 1
4078 ‘휴대성ㆍ디자인ㆍ다중작업까지’ 다양한 선택지 갖춘 인텔 AI PC [1] IT동아갤로그로 이동합니다. 07.22 421 0
4077 가상자산 거래소, 예치금 이용료율 발표 ‘최대 2.5%까지 이자 제공’ IT동아갤로그로 이동합니다. 07.22 211 0
4076 [뉴스줌인] 커세어의 새로운 SFX 폼팩터 파워서플라이, 뭐가 다를까? [6] IT동아갤로그로 이동합니다. 07.22 1205 1
4075 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 20 IT동아갤로그로 이동합니다. 07.21 227 0
4074 AMD 개발자들이 말하는 '라이젠 9000ㆍ라이젠 AI 300' 이야기 [48] IT동아갤로그로 이동합니다. 07.20 9603 11
4073 공항, 병원, 은행 모두 멈췄다… 전 세계적 전산 장애 발생 [1] IT동아갤로그로 이동합니다. 07.19 426 0
4072 [SBA X IT동아] 리피드 “폐식용유 기반 바이오 항공유 산업을 위한 토털 솔루션 제공” [1] IT동아갤로그로 이동합니다. 07.19 371 0
4071 [생성 AI 길라잡이] 법률가를 위한 AI 어시스턴트 등장 IT동아갤로그로 이동합니다. 07.19 220 0
4070 [농업이 IT(잇)다] 국내 최초 식물성 선인장 가죽 만든 ‘그린컨티뉴’ [3] IT동아갤로그로 이동합니다. 07.19 966 2
4069 [리뷰] 모던함과 개성을 다 갖춘 스마트 워치, 낫싱 CMF 워치 프로 2 [9] IT동아갤로그로 이동합니다. 07.19 1495 0
4068 [스타트업-ing] 원하는 포장재 100장부터 제작, 칼렛스토어 ‘소량 인쇄 서비스’ IT동아갤로그로 이동합니다. 07.19 200 0
4067 가상자산 첫 규제 ‘가상자산이용자보호법’ 시행 [6] IT동아갤로그로 이동합니다. 07.19 2667 2
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2