디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 중 AI 기업들, 칩금지에 맞서 영리하게 혁신

시타갤로그로 이동합니다. 2024.09.21 15:27:07
조회 84 추천 2 댓글 0

https://www.economist.com/science-and-technology/2024/09/19/chinas-ai-firms-are-cleverly-innovating-around-chip-bans

중국 AI 기업들은 칩 금지에 맞서 영리하게 혁신하고 있다


강력한 하드웨어의 부족을 무디게 하는 소프트웨어 트윅


2024 2024년 9월 19일

-

-


오늘날 최고의 인공지능(AI) 모델은 그래픽 처리 장치(GPU)로 알려진 수많은 최첨단 프로세서에 의존한다. 대부분의 서구 기업들은 이를 확보하는 데 어려움이 없다. 소셜 미디어 대기업인 Meta의 최신 모델인 Llama 3는 미국 칩 제조업체인 Nvidia의 H100 GPU 16,000개로 훈련되었다. Meta는 연말까지 60만 개를 더 비축할 계획이다. 

엘론 머스크가 투자한 스타트업인 XAI는 멤피스에 100,000개의 H100으로 구동되는 데이터 센터를 구축했다. 또 다른 대형 모델 제조업체인 OpenAI는 GPU 보유량에 대해 함구하고 있지만, 지난 4월 Nvidia의 사장인 젠슨 황이 직접 최신 프로세서를 전달한 바 있다.


이런 종류의 접근은 대부분의 중국 기술 기업에게는 먼 꿈일 뿐이다. 미국은 2022년 10월부터 고성능 프로세서의 중국 판매를 차단했다. 일부 중국 기업들은 이 탐나는 칩을 손에 넣기 위해 암시장으로 눈을 돌리고 있다는 소문이 돌고 있다. 그러나 대다수는 제한된 자원을 최대한 활용하는 데 초점을 맞추고 있다. 그들의 결과는 서구 기업들에게 생각할 거리를 제공하고 있다.


항저우에 본사를 둔 중국 스타트업인 DeepSeek도 혁신 기업 중 하나이다. 9월 초에 출시된 최신 모델인 DeepSeek-v2.5는 영어와 중국어로 된 코딩 과제뿐만 아니라 다른 오픈 소스 모델과 비교해도 손색이 없다. 이러한 성과는 규모에 그치지 않는다:  DeepSeek는 중국 회사로서는 큰 규모이지만 미국 경쟁사 기준으로 보면 적은 수인 Nvidia의 구형 GPU를 10,000개 이상 보유하고 있는 것으로 알려져 있다.


DeepSeek는 여러 가지 방식으로 이러한 부족함을 보완한다. 첫 번째는 각기 다른 문제에 가장 적합한 여러 가지 네트워크로 구성되어 있다는 점이다. 이러한 '전문가 혼합' 접근 방식을 통해 모델은 각 작업을 적절한 네트워크에 위임하여 속도를 개선하고 처리 시간을 단축할 수 있다. 


DeepSeek는 서로 다른 데이터 비트를 연결하는 가상 연결인 2360억 개의 '매개변수'를 가지고 있지만, 처리하는 새로운 정보 덩어리마다 한 번에 10분의 1도 채 사용하지 않는다. 또한 이 모델은 새로운 데이터를 처리하기 전에 압축한다. 이를 통해 대용량 입력을 보다 효율적으로 처리할 수 있다.


GPU 부족에 대한 창의적인 해결책을 찾는 것은  DeepSeek만이 아니다. 칭화대학교와 AI 스타트업인 ModelBest가 개발한 오픈 소스 모델인 MiniCPM은 각각 24억 개와 12억 개의 매개 변수를 가진 다양한 종류가 있다. 작은 크기에도 불구하고 언어 관련 작업에 대한 MiniCPM의 성능은 70억~130억 개의 파라미터를 사용하는 대규모 언어 모델(LLM)과 비슷하다. DeepSeek의 모델과 마찬가지로 전문가 혼합 접근 방식과 입력 압축을 결합한다. 그러나 매개 변수가 적은 다른 소형 모델과 마찬가지로 MiniCPM도 특정 학습 분야 외의 영역에서는 그다지 높은 성능을 발휘하지 못할 수 있다.


MiniCPM은 크기가 작기 때문에 개인용 기기에 적합하다. 지난 8월에는 여러 언어를 지원하고 텍스트, 이미지, 오디오 등 다양한 유형의 데이터와 함께 작동하는 휴대폰용 버전을 출시했다.


다른 곳에서도 비슷한 접근 방식이 시도되고 있다. Together.ai, Meta, Nvidia의 연구원들이 개발한 알고리즘인 FlashAttention-3은 Nvidia의 H100 GPU에 맞게 설계하여 LLM의 훈련 및 실행 속도를 높인다. Google DeepMind에서 7월에 발표한 또 다른 알고리즘인 JEST는 초기 학습을 위해 소량의 고품질 데이터를 제공한 후 더 큰 규모의 저품질 데이터 세트에 투입한다. 이 방식은 다른 방식보다 13배 빠르고 10배 더 효율적이라고 구글은 주장한다. OpenAI를 지원하는 Microsoft의 연구원들도 약 40억 개의 매개 변수가 있는 Phi-3 mini라는 소형 언어 모델을 출시했다.


서구 기업들과 달리 중국 기업들에게 적은 자원으로 더 많은 일을 하는 것은 선택 사항이 아니다[필수 사항이다]. 하지만 이것이 나쁘지 않을 수도 있다. AI 투자 펀드인 Air Street Capital의 Nathan Benaich는 “희소성 사고방식은 확실히 효율성 향상에 인센티브를 제공한다.”라고 말한다. ■


추천 비추천

2

고정닉 1

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2944 설문 축의금 적게 내면 눈치 줄 것 같은 스타는? 운영자 24/11/11 - -
815713 일반 이스라엘군 전사자에 대한 진실 [2] 러갤러(180.66) 11.09 92 2
815712 일반 러우전쟁의 결말 (통일교 시각) ㅇㅇ(112.72) 11.09 99 1
815710 일반 이시각 이스라엘 근황 ㅋㅋㅋ 러갤러(180.66) 11.09 134 2
815709 일반 전사자 교환으로 보는 교전비 (우크라이나 15 : 1 러시아) ㅇㅇ갤로그로 이동합니다. 11.09 98 2
815708 일반 이스라엘군 vs 러시아, 세르비아, 인도군 러갤러(180.66) 11.09 45 0
815706 일반 [딥 스토리] 러시아에 파병된 북한 병사들의 6가지 특징? 러갤러(125.132) 11.09 53 0
815705 일반 보수당은 트럼프 똥이라도 입에 처넣어야할판 [1] 스겔(211.222) 11.09 51 1
815704 일반 미국의 PC력을 감안하면 K페미니즘이 충분히 통할거 같은데. [2] ㅇㅇ(39.126) 11.09 74 3
815703 일반 트럼프가 할 일 [6] ㅇㅇ(112.72) 11.09 93 1
815702 일반 러시아 외무부 "자산 몰수시 미국과 외교단절" [2] ㅇㅇ갤로그로 이동합니다. 11.09 155 5
815701 일반 트럼프쪽이 러시아에 휴전협상을 제안한게 맞구나 [11] ㅇㅇ(39.126) 11.09 174 0
815700 일반 이와중에 국민의짐 하는짓 러갤러(61.79) 11.09 37 0
815699 일반 굥: 응 우크라 계속 지원하면 그만이야~ [1] 러갤러(180.66) 11.09 79 1
815698 일반 러시아, 핵추진 쇄빙선 추코트카호 출항 ㅇㅇㅇ(218.238) 11.09 80 2
815697 일반 야동코리아 무한로딩 뭐냐 [6] 러갤러(61.39) 11.09 10833 4
815696 일반 이시각 트황상 당선된 미구라 근황 ㅋㅋㅋ [4] 러갤러(180.66) 11.09 196 1
815695 일반 러시아가 제조업 한자리 못먹은 이유가 뭐임? [3] 러갤러(211.36) 11.09 63 0
815694 일반 서울보다 지방이 나은 이유 [6] Hospitaller갤로그로 이동합니다. 11.09 111 2
815693 일반 미국제품 쳐쓰면서 ㅋㅋㅋㅋ [8] ㅇㅇ(211.114) 11.09 105 2
815691 일반 ??? : Aigo~ 한국은 유교국가라서 PC에도 끄떡없는 nida~ [1] ㅇㅇ(223.39) 11.09 83 0
815689 일반 러뽕새끼들아 니들은 민주주의가 뭔지도 모르고 러시아를 빠는 벌레들이야 [4] ㅇㅇ(221.140) 11.09 61 3
815688 일반 러뽕이 미개한 변종사대주의자라는 증거 ㅇㅇ(221.140) 11.09 30 0
815687 일반 푸틴은 휴전할생각접어라 [2] ㅇㅇ(118.235) 11.09 132 3
815684 일반 근데 지금 미국은 깡패잔아 [1] ㅇㄷ(211.234) 11.09 57 0
815683 일반 러뽕대가리 믿을빠엔 [2] 러갤러(211.114) 11.09 46 0
815682 일반 트럼프 걍 시오니스트 아님? [2] 러갤러(221.148) 11.09 95 5
815681 일반 이번에 탄핵되면 페미가 얼마나 설칠려나? [11] 러갤러(180.70) 11.09 105 0
815680 일반 젤렌스키 그래도 윤석열대통령님 보단 똑똑한듯.. [1] 러갤러(122.44) 11.09 71 0
815679 일반 바이든과 트럼프 차이는 이거 같음 ㅇㅇ(221.148) 11.09 75 2
815677 일반 미 실험실 원숭이 탈출 이거 머냐 시동거는거냐?? [1] 러갤러(218.146) 11.09 95 1
815676 정보 다케시마와 니뽄노 료오도다(独島は日本の領土) 大日本ばんざい(51.158) 11.09 45 0
815675 일반 젊은층에서 일본어 배우는건 별거없어. ㅋ [4] 러갤러(115.137) 11.09 190 1
815674 일반 프리고진 있었으면 오데사 땄다 [3] ㅇㅇ(221.154) 11.09 78 1
815673 일반 병신러뽕 [1] ㅇㅇ(211.114) 11.09 35 1
815672 일반 푸틴이 젤란스키보단 똑똑한거냐? [10] 러갤러(180.64) 11.09 123 0
815671 일반 트럼프가 할 일은 두가지 뿐임 [1] ㅇㅇㅇㅇ(39.117) 11.09 60 1
815670 일반 트뽕새끼들 걍 존나게 웃김. [2] 러갤러(61.79) 11.09 83 8
815669 추측/ 러사아는 딱 저기까지 먹으려고 계획할듯 가장 합리적일듯 [5] ㅇㅇ(218.147) 11.09 161 2
815668 일반 본래 우크라 영토는 이것밖에 안됨 [5] 러갤러(180.64) 11.09 159 5
815667 일반 트럼프 제안도 받을 수는 있지 러갤러(180.70) 11.09 53 0
815666 일반 송영길은 울 나라 입장에서는 이득이 안 되긴 함 김유빈의아카이브갤로그로 이동합니다. 11.09 78 0
815665 일반 우크라에 살상무기 지원! [1] 러갤러(180.64) 11.09 74 3
815664 일반 "중국 지고 일본 뜬다" .. 중국어 대신 일본어 배우는 이유는? [4] 김유빈의아카이브갤로그로 이동합니다. 11.09 102 0
815663 일반 송영길이 러시아통이구만. [5] 13567(39.117) 11.09 115 3
815662 일반 병신드라 푸틴이 오데사 안 먹는건 개구멍으로 냅두는거야 [1] ㅇㅇ(218.147) 11.09 73 0
815661 일반 트럼프 "20년 동안 현재 전선을 따라 휴전하자"는 개솔이 시전 [5] ㅇㅇ갤로그로 이동합니다. 11.09 153 3
815660 일반 꾸뇽? ㅎ [1] Hospitaller갤로그로 이동합니다. 11.09 23 1
815659 일반 짱. [1] Hospitaller갤로그로 이동합니다. 11.09 22 1
815658 일반 중국 무비자... 효과 직빵인데!! [1] 13567(39.117) 11.09 99 2
815657 일반 ㅋㅋㅋ [1] Hospitaller갤로그로 이동합니다. 11.09 22 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2