[IT동아 남시현 기자] 현지 시간으로 지난 12월 6일, AMD가 ‘어드밴싱 AI(Advancing AI)’를 개최하고 AMD 인스팅트 MI 300 시리즈 데이터센터 AI 가속기와 대형 언어 모델(LLM) 지원 기능을 갖춘 ROCm 6 개방형 소프트웨어 스택, 그리고 라이젠 AI가 탑재된 새로운 라이젠 8040 프로세서를 공개했다. 이중 MI 300과 ROCm 6는 생성형 AI 및 서버 시장을 위한 제품이지만, 라이젠 8040 프로세서는 온디바이스(On-Device) 시장 대응을 위한 프로세서다.
리사 수 AMD 최고경영자가 어드밴싱 AI 행사에서 AMD 라이젠 8040 프로세서를 소개하고 있다 / 출처=AMD
AMD는 지난 6월, AI 기능을 수행하는 ‘라이젠 AI’ NPU(신경망 처리 장치)를 공개하고, 이를 탑재한 AMD 라이젠 7040HS 프로세서를 출시했다. 이번에 공개한 라이젠 8040은 전 세대 대비 최대 40% 향상된 AI 성능을 갖추며, 최상위 제품인 라이젠 9 8945HS 프로세서는 인텔 코어 i9-13900H 및 i7-13700H, i5-1340P 보다 최대 64% 빠른 비디오 편집 및 37% 빠른 렌더링 성능을 제공하며, AMD 라이젠 전용으로 구축된 AMD XDNA 아키텍처를 갖춘다.
아울러 AMD는 개발자가 사전 훈련된 모델울 활용해 윈도우 애플리케이션에 AI 기능을 추가할 수 있도록 돕는 라이젠 AI 1.0 소프트웨어 스택을 함께 공개했고, XNDA 2 아키텍처를 탑재해 AI 기능을 세배까지 끌어올리는 스트릭스 포인트 CPU를 내년 중 출시하겠다고 밝혔다.
인텔도 온디바이스 프로세서로 회생 노린다
인텔은 오는 12월 14일 온디바이스 AI가 탑재된
인텔 역시 지난 9월 공개한 AI 프로세서인 인텔 코어 울트라를 오는 12월 14일 출시한다. 인텔 코어 울트라는 코드명 메테오레이크로 불리며, 최초로 인텔 4 공정이 사용된다. 인텔 역시 기존에 사용해온 VPU(비전 처리 장치) 대신 NPU를 탑재해 네트워크 없이 장치에서 자체적으로 인공지능 기능을 수행하도록 한다.
독일의 소매업체 baur.에서 노출된 인텔 코어 울트라 기반의 에이서 스위프트 모델을 살펴보면, 인텔 코어 울트라 5 125H 모델이 14코어 18스레드, 155H 모델이 16코어 22스레드, 185H 모델이 16코어 22스레드 구성이 될 것으로 보인다. 또한 인텔 아크 Xe-LPG 통합 그래픽이 탑재돼 GPU의 연산 처리력으로 인공지능 기능을 보조할 것으로 보인다. 자세한 내용은 출시일에 맞춰 공개된다.
모바일 시장에서도 온디바이스 AI 기본화
퀄컴 역시 온디바이스 AI를 탑재한 애플리케이션 프로세서를 공개했다 / 출처=퀄컴 테크날러지
노트북 시장 뿐만이 아니다. 퀄컴이 지난 10월 공개한 스냅드래곤 8 3세대 AP는 퀄컴의 모바일 AP로는 처음으로 생성형 AI 도입을 고려해 설계됐다. 이 AP에는 최대 45TOPS의 처리 성능을 가진 퀄컴 헥사곤 NPU가 탑재돼 100억 개 가량의 매개변수를 탑재한 생성형 AI를 장치에서 지원한다. TOPS는 데이터를 1초에 1조 번 연산할 수 있다는 의미로, AI 하드웨어의 성능 지표를 나타낼 때 쓴다.
미디어텍 역시 지난달 공개한 디멘시티 9300에 APU(AI 처리 장치)를 탑재해 사전 준비된 모델 기반의 생성형 AI 성능을 전작대비 8배, 정수 및 실수 연산 속도는 두배 올리고, 전력 효율은 45% 끌어올린다. 삼성전자가 갤럭시 S24에 탑재하는 엑시노트 2400 AP 역시 NPU를 탑재해 전작인 엑시노스 2200과 비교해 14.7배 높은 인공지능 성능을 발휘한다. 다만 삼성전자의 경우 하드웨어 성능 보다는 삼성 가우스’ 등의 생성형 AI 생태계에 더 공을 들이는 모습이다.
대형언어모델도 스마트폰 최적화에 시동
온디바이스 모델이 지난 몇 년 간 침체됐던 PC 및 스마트폰 시장의 구세주로 떠오르면서 구글, 메타 등 AI 빅테크 기업들도 시장 확보에 열을 올리고 있다. 구글은 12월 17일, 차세대 생성형 AI 기반 모델 제미나이(Gemini)를 공개했다. 제미나이는 구글의 검색 결과와 구글 전체의 공동 연구를 포함하며, 음성과 이미지, 텍스트, 영상 등을 복합적으로 인지하는 멀티모달이 적용된다. 구글에 따르면 대규모 작업에서 언어 이해 성능은 GPT-4의 86.4%를 앞선 90%며, 멀티모달 역시 GPT-4V의 56.8%를 앞선 59.4%라고 밝혔다.
구글의 차세대 생성형 AI 기반 모델 제미나이 / 출처=구글
제미나이는 대형 모델인 울트라와 프로, 그리고 스마트폰 수준에 맞춘 나노 세 가지 규모로 출시된다. 이중 제미나이 나노는 구글 픽셀 8 프로에 처음 구현되고, 내장된 NPU를 활용해 챗봇을 구현한다. 이를 통해 녹음 요약이나 메시징 앱, 구글 보드 등에서 AI를 활용할 수 있고, 다양한 구글 서비스에 제미나이가 결합된다.
구글의 맞수인 메타 역시 퀄컴과 손을 잡고 온디바이스를 위한 전용 라마2(Llama 2) 모델을 구축한다. 이를 활용하면 클라우드를 쓸 수 없는 비행기 모드, 차량, 노트북 등에서도 조건에서도 챗봇 등을 활용할 수 있다. 현재 퀄컴의 스냅드래곤 8 3세대 등이 퀄컴 헥사곤 NPU를 탑재하는 것이 공식화된 만큼, 내년이면 서비스를 시작할 것으로 보인다.
온디바이스 AI가 가져다줄 편의성은?
온디바이스 AI는 애플리케이션의 활용도를 한층 끌어올릴 것이다. 예를 들어 촬영된 사진에서 안면인식으로 사람이 몇 명 있는지 숫자를 세어준다거나, 카메라로 식단을 찍으면 AI가 식품의 종류와 크기 등을 인식해 칼로리를 계산한다거나, 사물인터넷의 자동화 알고리즘을 사용자 분석으로 자동 생성하는 등 보다 다양한 방면에서 품질이 향상되는 식이다.
펫 겔싱어 인텔 최고경영자가 지난 9월 진행한 인텔 이노베이션에서 온디바이스 AI를 직접 시연하고 있다 / 출처=IT동아
고급 수준에서는 여러 기능이 복합적으로 작용한다. 보청기를 착용한 사람이 컴퓨터로 화상회의를 진행하면 온디바이스 AI 노트북이 노크나 회의 이외의 목소리를 감지해 보청기의 모드를 바꾸고, 사용자가 놓치는 부분의 대화 내용은 자동으로 인식한 뒤 번역한다. 보는 방향에 따라 내용을 기록하고, 언어를 인식해 변환 및 번역한다. 생태계만 확보된다면 오프라인 모드에서도 이 정도 기능을 쓸 수 있게 된다.
모건 스탠리는 내년에 전 세계 스마트폰 출하량이 약 4%, 2025년에는 4.4%씩 반등할 것으로 보고 있다. 스마트폰의 수요 창출은 새로운 온디바이스 AI 기능이 차지할 것이고, 개인정보 보호부터 카메라 기능, 음성 인식 등 다양한 측면에서 폭넓게 활용될 것으로 보고 있다. 생성형 AI에서 창출된 온디바이스 AI가 우리의 실생활을 어떻게 바꿀지 지켜보자.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.