갤러리 이슈박스, 최근방문 갤러리
연관 갤러리
남자 연예인 갤러리 타 갤러리(0)
이 갤러리가 연관 갤러리로 추가한 갤러리
0/0
타 갤러리 남자 연예인 갤러리(0)
이 갤러리를 연관 갤러리로 추가한 갤러리
0/0
개념글 리스트
1/3
- 딥시크 활용한 hwh 매매 후기 케엑
- 법치 선진국에서는 국가원수를 구속 기소하는 미 개한 짓을 할까? 문재인은구속기
- 김민아 충주맨 인터뷰 ㅈㄴ웃기네 ㅋㅋㅋㅋ 환장의 짝꿍 ㄹㅇ ㅇㅇ
- 여대생이 출산하면 지원금 10배 준다는 나라ㄷㄷ ㅇㅇ
- 영양제 효과 없다는 저속노화 교수님 ㅇㅇ
- 싱글벙글 나루토 VS 원피스 객관적 비교...JPG 금발양아치누나
- 지난 10년간 대통령들이 보낸 설 선물들 jpg 野獣先輩
- 싱글벙글 챗지피티 vs 딥시크 검열 비교 ㅇㅇ
- 안싱글벙글 영화관 진상 직무매미
- 싱글벙글 다른나라 사람들은 이해하기 힘든 미국문화 ㅇㅇ
- 싱글벙글 일본 창작물 사이트들 근황...jpg ㅇㅇ
- 뉴비의 r8 도쿄 사진 (스압) 디붕이
- 싱글방글 창문이 초록색인 이유 썅년
- 싱글벙글 우리나라 국회가 가진 세계기록 ㅇㅇ
- 설날2025 지존박실짱짱맨
폰아레나의 갤럭시 S25 울트라 리뷰 요약
폰아레나의 갤럭시 S25 울트라 리뷰 _ AI를 위한 비약 없는 작은 한 걸음 장점 · 새로운 디자인은 세련되고 깔끔하며 전문성이 느껴지도록 함 · 고릴라 아머의 반사 방지 특성은 여전히 뛰어남 · 벤치마크 스트레스로 인해 성능이 저하될 수 있지만 성능은 훌륭함 단점 · "플로팅 스타일"이 적용된 새로운 카메라에는 이물질이 끼일 것임 · 기존과 동일한 배터리 용량, 배터리 수명, 충전 속도 · 원했던 것보다 적게 업그레이드된 스피커 디스플레이 무한한 명암비, 선명한 해상도, 생생한 색상, HDR 지원, 최대 120Hz의 가변 재생률을 제공하는 뛰어난 패널임 "선명한 화면" 모드에서 3단계의 선명도를 선택할 수 있음 전작 대비 화면 밝기는 비슷하지만 반사방지는 조금 더 개선됐기 때문에 전작과 마찬가지로 디스플레이의 시인성이 매우 뛰어남 카메라 · 모듈은 거의 동일하나 소트프웨어 측면에서 약간의 조정이 이루어짐 · 이전 모델들만큼 과도하게 선명하지 않음(과한 샤픈 효과가 줄어듦) · 야간 촬영 시 노출이 S24 울트라보다 약간 더 좋음 · 전반적으로 사소한 업그레이드가 이루어짐 · 전면카메라는 변함없으나 여전히 괜찮은 수준임 성능 · 전작대비 30% 빠른 CPU, 37% 빠른 GPU, 40% 빠른 NPU · 벤치마크에서 매우 훌륭한 점수를 받았음 · 하지만 스트레스 테스트에서 4,000점으로 스토를링될 때까지 최대 2번의 사이클이 소요됐음 · 7사이클이 되면 테스트가 끝날 때까지 3,000점 근처에서 맴돌기 시작함 · 이는 아이폰 16 프로 맥스의 성능과 매우 유사함 · 실생활에서는 매우 빠르며 불만이 전혀 없음 소프트웨어 대부분이 새로 추가된 기능들을 읊는 수준이라 간추려서 유용했던 오디오 지우개와 S펜 관련 사항만 올림 오디오 지우개 · 오디오 지우개 기능은 스튜디오 수준의 음질을 구현할 수 있음 · 아이폰처럼 다양한 모드가 있는 것은 아니며 기능이 조금 덜 강력함 · 하지만 다양한 범주의 사운드를 지울 수 있고 괜찮은 기능을 제공함 S펜 · S펜은 여전히 훌륭하지만 블루투스 기능이 사라짐 · 하지만 그다지 걱정할 필요는 없음 · S펜에 있던 기능들의 대부분은 기믹성 기능에 가까웠음 · 게다가 그러한 기능들 때문에 S펜에 배터리와 충전이 필요했음 · 그런데도 실제로 그다지 많이 사용 하는 사람은 없었음 · 즉 삼성이 번들 S펜에 블루투스 기능을 제거한 이유는 합리적임 배터리와 충전 · 전반적으로 전작 S24 울트라와 매우 유사함 · 배터리 수명의 경우 약간 개선됨 · 여전히 괜찮은 수준이지만 최고 수준은 아님 스피커와 진동 · 햅틱은 말할 필요도 없이 정확하고 반응이 빠르며 만족스러움 · S25 울트라는 스피커에서도 약간의 업그레이드가 이루어짐 · S24 울트라보다 약간 더 크고 약간 더 육감적인 소리를 냄 저음 출력이 약간 바뀌었고, 더 깊은 저음 대신 낮은 중저음에 약간의 강조가 느껴짐 여전히 중음에서 약간 비좁게 들리는 부분이 있으며, 볼륨을 최대로 올릴 경우 소리가 약간 압축되는 현상이 있음 휴대폰에서 기대할 수 있는 수준치고는 꽤 훌륭한 소리를 내지만 여전히 블루투스 스피커 수준에는 미치지는 못함 평점과 결론 평점_8.0 / 10 (전작 S24 울트라는 7.4점) 갤럭시 S25 울트라는 약간 실망스러운 면이 있음 물론 훌륭한 안드로이드 스마트폰이고, 모든 최신 기능을 갖추고 있으며 2025년 내내 꽤 인기를 끌 가능성이 높음 하지만 S24 울트라에서 큰 업그레이드를 기대했다면, 여기서는 찾기 어려울 것임 심지어 삼성조차 S25 시리즈에 대한 흥미를 끌어내는 데 어려움을 겪은 듯함 무대에서 AI 기능을 마치 혁신적인 기술인 것처럼 강조했지만, 대부분 '향상된 검색' 수준에 불과함 그렇다고 해도, 애초에 S24 울트라에서 1년만에 바로 업그레이드하려는 사용자는 그리 많지 않을 것임 만약 이번 S25가 오랜만에 바꾸는 폰이거나 첫 프리미엄 스마트폰이라면, 분명 만족할 것임 눈에 띄는 개선이 적은 이유도 이해할 만함 삼성은 이미 완성된 공식을 가지고 있고, S24 울트라와 S23 울트라 같은 제품들 자체가 이미 매우 뛰어났기 때문임 예상대로, 갤럭시 S25 울트라 역시 매우 훌륭한 제품임 https://www.phonearena.com/reviews/samsung-galaxy-s25-ultra-review_id6862 Samsung Galaxy S25 Ultra review: one small step for AI... eh, no leapsThe Samsung Galaxy S25 Ultra is here! Here are our first in-person impressionswww.phonearena.com- 갤럭시s25울트라 vs 아이폰16프로맥스 비교테스트 짤- dc official App- s25 색상 영상 찍어 옴 (+동영상 추가) 네이비 실버 아이스 블루 민트 네이비 볼수록 ㄱㅊ은듯..? + 화질 저하가 심해서 영상 버전도 업로드 함 https://youtu.be/pUXAnae1Cfc 네이비 → 실버 → 아블 → 민트 - dc official App
작성자 : SundayMove고정닉
벤 톰슨 stratechery DeepSeek 분석
사건의 발단은 워싱턴이 2023년 중국이 7나노를 만들어내는 것을 보고 과하게 경기를 일으킨 것부터 시작된다. 2023년 9월 화웨이가 SMIC를 통해 만든 7나노가 탑재된 Mate 60 Pro를 발표했을 때, 그 칩을 자세히 들여다보면 놀라운 일은 아니었는데 말이다.이미 그로부터 1년 전, SMIC는 7나노를 만들었었고 타사들도 다 만들 수 있음에도 수율이 안나와서 안만들었을 뿐인 사건인데 말이다. 오히려 놀라웠던건 워싱턴 DC의 반응이었고 그때부터 미국은 칩 판매를 허가기반으로 바꿔버린 것이다. DeepSeek 사건도 이때와 비슷하게 흘러가고 있다.사실 이번 훈련비용 절감 관련한 사실은 R1 모델이 아니라 지난 크리스마스에 공개된 V3 논문에서 드러났었다.https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf그들은 V3모델 이전의 V2에서 DeepSeekMoE, DeepSeekMLA를 소개했었는데, 이 성과가 V3에서부터 나기 시작했다.우선 DeepSeekMoE는 MoE, Mixture of Experts 전문가 혼합이라는 뜻인데 GPT-3.5 같은 모델은 훈련시든 추론시든 어떤 토큰이 모델로 들어오면 전체를 활성화시키는데 반해, MoE는 특정 주제에 맞는 전문가만 활성화시킨다. (**물론 이것이 잘 발동하려면 게이트가 토큰의 종류를 적절히 판별해 알맞는 전문가에 보내도록 해야한다. 사전학습시 Dense 모델처럼 토큰마다 모든 GPU를 사용하지 않으니 Sparse할 것이고 연산량과 GPU타임이 줄 수 밖에 없다. 하지만 최근 트렌드는 거의 모든 훈련모델들이 MoE를 사용하고 있기 때문에 이것 때문에 효율성이 특출나졌다는 것은 불가능한 이야기다.)이어서 DeepSeekMLA는 추론에서의 제한사항을 혁신해주었다. 어마어마한 양의 메모리 사용량을 줄여준 것이다. 기존에는 모델 전체를 메모리에 로드하고 긴 컨텍스트 윈도우의 토큰 모두를 Key, Value 값으로 저장해야했는데 이런식은 Key-Value 값이 기하급수적으로 늘어서 비용이 늘 수 밖에 없는 것이다. 메모리 부담도 매우 커지고. 하지만 MLA, Multi-head latent attention을 통해 key-value 저장을 압축시켜서 추론시 필요한 메모리를 크게 줄였다.여기에 V3에서 통신오버헤드를 줄이는 로드 밸런싱 방식과 훈련단계에서 여러 토큰을 동시에 예측하도록(multi-token prediction)하는 기법이 추가된 것이다. 그 결과 훈련 효율이 크게 향상되어 H800 GPU 타임이 2,788K로 전체 비용이 557.6만 달러가 나온 것이다. (**라마 훈련비용에 비해 3%)Q: 그건 아무리 봐도 너무 낮은 것 아닌가? A: 최종 훈련단계에서의 비용만 계산한 것이다. 그외 모든 비용은 제외시킨 것이다. V3 논문 자체에도 이런 표현이 명시되어 있다.- 모델구조, 알고리즘, 데이터, 사전 연구, 비교실험 등에 사용된 비용은 포함하지 않았다.즉, 이번 DeepSeek 사건을 재현하려면 3%보다 훨씬 더 큰 돈이 든다는 말이다. 하지만 "최종 훈련" 자체만 보면 그 비용은 말이 된다.Q: 알렉산드르 왕이 한 H100 5만개 이야기는 뭔가?A: 아마 그는 Dylan Patel이 2024년 11월에 한 트윗을 본 것이 아닐까 추측한다. 당시 파텔은 DeepSeek이 호퍼 5만개분을 가지고 있을 것이라는 분석을 내놓았다. 사실 H800은 H100에서 메모리 대역폭을 크게 줄인 버전이다. 중요한 점은 DeepSeek은 그 GPU간의 통신에서 제한이 걸렸기 때문에 이런 연구를 시작했고 거기서 성과를 냈다는 것이다. H800 각 칩에서 132개 프로세싱 유닛 중 20개를 통신 전담으로 할당했다는 것은 쿠다로는 불가능하다. PTX라는 저수준 GPU 명령어집합까지 내려가야만 가능한 일이다. 이정도로 미친수준의 최적화까지 집착했다는 것은 오히려 H100이 아니라 H800에서 훈련을 해내겠다는 집념을 보인 셈이다. 또 지금처럼 추론 서비스를 실제 제공하고 있으려면 상당량의 GPU가 확보되어야만 가능한 일이다. 어마어마한 양의 GPU가 필요하다.(**아마 호퍼 5만개 이상은 확보했을 것이라는 추측이며 최근 일론 머스크도 여기에 동의했다.)Q: 그럼 칩 규제 위반 아닌가?A: 아니다. H100은 막았어도 H800은 막지 않았기 때문이다. 다들 프론티어 모델을 개발하려면 칩간 대역폭이 중요할 것이라 추측했는데 DeepSeek은 그 한계를 극복하도록 모델 구조와 인프라를 최적화시킨 셈이다. 만약 H100 수출규제가 없었다면 더 쉽게 클러스터를 구축하고 모델을 만들어냈을 것이다.Q: 그럼 V3가 (base에서의) 프론티어 모델이란 말인가?A: 적어도 4o, Sonnet-3.5 와 비빌 수준임은 확실해보이고 라마보다는 훨씬 더 위다. 다만 DeepSeek은 4o, 소넷을 디스틸(distill)해서 훈련용 토큰을 만들어냈을 확률이 아주 높아보인다.Q: 디스틸레이션(distillation)이 뭔가?A: 디스틸레이션은 다른 모델의 이해를 추출하는 방법이다. 선생 모델에서 다양한 입력을 넣고 만들어진 출력으로 학생 모델의 학습에 사용시키는 것이다. 각 연구소들은 이런 디스틸레이션을 명백히 금지하고 있다. 하지만 매우 흔하게, DeepSeek 외에도 수많은 곳에서 다들 하고 있다. 때문에 4o, 소넷급 모델들이 계속해서 나오고 있는 것이다. 솔직히 안했을리가 없다고 생각될 정도로 흔한 방법이다.Q: 그럼 1등 모델들은 불리한 것 아닌가?A: 맞다. 앞서가는 연구소들은 가장자리를 넓히는데에 이런 방식은 사용할 수 없다. 대신에 자사 모델 최적화에는 사용할 수 있는 정도다. 부정적인 면은, 이런식으로 디스틸하게 되면 타 연구소들이 계속해서 무임승차하는 것이 가능해진다는 이야기다. 최첨단 모델을 개발하는데 드는 비용은 오직 프론티어 랩들만이 떠안게 된다. 그 결과, 리딩 엣지(leading edge) 모델들에 어마어마한 돈이 들어서 개발되어도, 금방 디스틸레이션으로 카피해서 들어간 돈이 회수가 어렵게 되는 것이다. 곧바로 상품화되고 흔해지니까 말이다. 바로 이 점이 마이크로소프트와 OpenAI가 점점 더 결별하는 방향으로 나아가는 이유인 것 같다. 1천억 달러를 들여서 최신 모델을 개발해봐야, 금방 감가상각되어 흔해지면 돈을 회수할 수가 없다.Q: 이런 이유로 빅테크 주가가 떨어지고 있는 것인가?A: 장기적으로보면 추론비용이 싸지는 것은 마이크로소프트 같은 기업에 유리하다. 그들은 서비스 제공업자이기 때문이다. 아마존 역시 AWS 때문에 수혜자다.이번 사건으로 가장 큰 수혜를 보는 곳 중 하나는 애플이다. 메모리 요구량이 급격하게 줄면 애플 실리콘 같은 엣지 디바이스에서 추론이 실현 가능해지기 때문이다. 애플은 CPU, GPU, NPU가 모두 통합된 메모리를 공유한다. 즉, 애플의 고사양 칩이 곧바로 소비자용 추론 칩이 될 수 있다.엔1비디아의 게이밍 GPU VRAM은 32GB가 최대치지만 애플의 경우 128GB의 램을 사용할 수 있다.메타도 수혜자다. 그들의 비전에서 가장 큰 걸림돌이 추론 비용이었는데 이게 사전훈련 비용과 마찬가지로 매우 싸진다면 그들의 비전 역시 더욱 실현가능해질 것이다.다만 구글의 경우는 악재다. 하드웨어 요구량이 줄어들기 때문에 그들의 TPU로 누려왔던 이점이 줄어들고 추론비용이 제로에 가까워질수록 새로운 검색서비스 등이 나타나기 때문이다. 물론 구글도 자체비용을 줄일 순 있겠지만 잃는 것이 더 크다.Q: 그럼 왜 주가가 떨어지나A: 내가 말한 건 장기적 비전이고 현재는 R1으로 인한 충격이 수습되기 전이다.Q: R1은 어떤가A: R1은 추론형 모델이다. 이는 openai의 o1 신화를 두 가지 면에서 무너뜨린다. 첫째 존재 자체다. 추론에 오픈ai만의 특별한 비법이 없다는 것이다. 둘째, 가중치를 공개해버렸다는 것이다. 물론 데이터는 숨겼기 때문에 오픈소스라 일컫는 것은 무리가 있지만 말이다. 이제 굳이 OpenAI에 돈을 내지 않고도 원하는 서버나 로컬환경에서 추론모델을 돌릴 수 있게 되었다.사실 deepseek은 이번에 R1과 R1zero를 함께 공개했는데 후자가 더 중요하다고 본다.R1-zero는 인간의 피드백을 완전히 빼버렸다. 순수 RL(강화학습)이다. 이 모델에 문제를 잔뜩 주고 올바른 답을 내면 보상을 주고, 체계적인 사고과정을 보여주면 또 보상을 주는 방식으로 만들었다. 마치 알파고가 이기면 보상을 주는 보상함수를 만들었더니 모델 스스로 인간이 가르치지 않은 방식대로 서로 학습시킨 것 처럼 말이다.이를 보면 The bitter Lesson이 다시 한번 입증된 것 같다. 추론하는 방법을 일일히 가르치는 것이 아니라 충분한 연산자원과 데이터만 주면 알아서 학습한다는 것이다. Q: 그럼 결국 우린 AGI에 더 가까워진 것인가?A: 그렇게 보인다. 소프트뱅크의 마사요시가 왜 마이크로소프트가 아닌 OpenAI에 돈을 댄 것인지도 설명이 된다. 1등에 서면 엄청난 수익이 돌아올 것이라는 믿음이 있는 것이다. (** 곧 모델이 알아서 똑똑해지기 시작할 것이기 때문)Q: 그럼 R1이 선두에 선 것인가?A: 그렇다고 보긴 어렵다. 여러 정황 상 R1은 o1-pro를 디스틸레이션한 것으로 보인다. OpenAI는 이미 o3를 선보였다. DeepSeek은 확실히 효율성에서 선두를 차지했지만 그게 최고의 모델이라는 의미는 아니다.(** 뿐만 아니라 o1-mini도 R1 671B 디스틸에 사용된 정황으로 보이는 케이스도 속속 드러났다. https://x.com/JJitsev/status/1883158764863537336)Q: 그럼 왜 이렇게 다들 호들갑인건가?A: 세 가지 요인 때문이다. 1. 중국은 미국보다 많이 뒤쳐져있다 는 인식이 틀렸기 때문에 사람들이 충격받는 것이다. 중국의 소프트웨어 역량은 매우 높은 수준임이 드러났다.2. V3의 낮은 훈련비용, R1의 낮은 추론 비용 때문이다. 계산상으로는 가능한 수치였기 때문에 NVDA에 대한 우려가 커진 것이다.3. DeepSeek이 칩 규제라는 벽을 뚫고 이 성과를 이뤄냈기 때문이다. 현재까지는 어쨌든 합법적으로 구한 H800으로 훈련한 것으로 보이긴 하지만 허점이 많다.Q: 난 NVDA 갖고 있는데 망한건가?A: NVDA 해자가 2개 있었다.1. 쿠다2. 여러 GPU를 하나로 묶어 가상의 거대한 GPU로 만들어내는 기술 - 이 능력은 그 회사만의 독보적인 영역이었다.이 둘은 서로를 더욱 강화시켜주는 것이었는데 약한 하드웨어와 낮은 대역폭으로도 극단적인 최적화가 가능하다는 것이 증명되었기 때문에 NVDA는 새로운 스토리들이 더 필요하게 되었다.다만 아직 유리한 점이 3가지 있다.1. DeepSeek의 접근방식을 오히려 H100이나 GB100 같은 최신식 칩에 사용하게 된다면 얼마나 더 강력해질까? 더 효율적인 컴퓨팅이 가능해진다 하더라도 더 많은 컴퓨팅은 여전히 유효하다.2. 추론 비용이 낮아지면 -> 오히려 모델 사용량이 더 늘어나는 측면이 있다.(** 사티아 나델라는 간밤에 제본스의 역설을 언급하며 AI가 점점 더 싸지고 접근가능성이 높아진다면 사용량이 더 크게 오를 것이라고 언질을 주었다.)(** 제본스의 역설이란 단일 비용이 A에서 B로 싸진다면 사용량이 C에서 D로 늘어나기 때문에 전체 사용량은 오히려 늘어남을 지적하는 것이다.)3. R1이나 o1같은 추론모델들은 더 많은 컴퓨팅을 사용할수록 더 똑똑해진다. 인공지능의 성능을 높이는 방법이 여전히 컴퓨팅에 달려있다면 여전히 NVDA가 수혜를 볼 가능성이 있다.하지만 장밋빛 전망만 있는 것은 아니다.DeepSeek의 효율성과 오픈웨이트로 인한 광범위한 공개는 NVDA의 단기적인 낙관적 성공스토리에 물음표를 달아버렸다.특히. 추론단계에서는 NVDA 칩 외에도 다른 대안 시나리오가 작동하기 시작했다.예를 들어 AMD 칩 하나로도 추론이 가능해진다면 칩간 대역폭이 낮다는 AMD 측의 단점을 상쇄할 수 있게 된다.추론 전용칩이 각광을 받을 수도 있다.요약하자면 NVDA가 사라지진 않을 것이다. 다만 지금까지 고려되지 않았던 불확실성에 노출되었고 이는 하방압력을 키울 수 밖에 없다.Q: 칩 규제는 어떻게 되는건가?A: 칩규제가 더 중요해졌다고 주장할 수도 있겠지만. 2023년의 백악관의 규제가 DeepSeek을 부추긴 것이라고도 볼 수 있기 때문에 단기적으로는 효과가 있더라도 장기적으로는 의문이다.Q: 그럼 왜 중국은 오픈소스를 하는건가?A: 중국이 아니라 DeepSeek이 그렇게 하는거다. CEO 량원펑은 오픈소스야말로 인재를 끌어들이는 핵심이라고 언급했다. Q: 그럼 OpenAI는 망한건가?A: 그렇다고 볼 순 없다. 결국은 AI Take-off에 가장 먼저 도달한 자가 승리한다. 반면 이번 주말의 가장 큰 패배자는 앤트로픽이다. DeepSeek이 앱스토어 1위를 차지하기까지 샌프란시스코 지역 외에서 클로드는 주목조차 끌지 못했다. API가 그나마 잘돌아간다고 어필하지만, DeepSeek 같은 방식대로 디스틸로 프론티어모델이 흔하게 퍼져버리면 가장 먼저 무너지는 쪽이 이 API 비즈니스다. 돈주고 API 쓰느니 성능이 비슷하다면 DeepSeek 같은 오픈웨이트 모델을 쓰기 때문이다.결국 가장 큰 수혜자는 소비자와 기업들이다. 이런 미래는 사실상 무료에 가까운 AI 제품과 서비스를 누릴 수 있게 될 것이기 때문이다. 중국은 이제 자신감이 점점 더 커질 것이다.미국은 선택의 기로에 놓여있다. 더 강경하게 나아갈 것인가, 아니면 더 큰 혁신으로 나아갈 것인가. 연구소들이 이제 로비에 신경쓰지 않고 혁신에만 집중하게된다면, 우린 DeepSeek에게 감사하게 될지도 모른다.
작성자 : KurisuMakise고정닉
차단하기
설정을 통해 게시물을 걸러서 볼 수 있습니다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.