갤러리 이슈박스, 최근방문 갤러리
연관 갤러리
대출 갤러리 타 갤러리(0)
이 갤러리가 연관 갤러리로 추가한 갤러리
0/0
타 갤러리 대출 갤러리(0)
이 갤러리를 연관 갤러리로 추가한 갤러리
0/0
개념글 리스트
1/3
- 싱글벙글 싱붕이 아는 놈 근황..jpg 흑두루미2
- 싱글벙글 여자어 관심종자
- 계엄해제 18명, 소장파 5명 “임기 단축” 탄핵 찬성 가능성 레츠고
- 버스타려고 무단횡단하는 보행자와 사고났는데 과실비율이 9:1 차갤러
- 싱글벙글 광기어린 pornhub의 영상 관심종자
- 특수전사령관 "추가 계엄 없을 것…지시 내려와도 거부" 묘냥이
- 부정선거 의심 정황증거 모음 ㅇㅇ
- 싱글벙글 이국종이 존경한 의사 관심종자
- "40년새 이런 불황은.." "거의 빈사상태죠" 생산·소비·투자 '트리플 틴푸
- 미드 보고 영감을 얻어 알몸에 비닐봉지 뒤집어쓰고 절도 행각 벌인 청소년 감돌
- 광운대학교 성명문 발표 ㅇㅇ
- 강동원 : "원피스 아직도 보고있다 ㅇㅇ" ㅇㅇ
- 尹 기습 비상계엄 선포에 연예계 소신 발언 모음.JPG ㅇㅇ
- 윤 대통령, 또 계엄 시도할까...민주 "정상적 판단하기 어려운 상태로 틴푸
- 골목에서 정차한 차량의 깨져있었던 사이드미러 살짝 스친 사건 소송 결과 감돌
ChatGPT 신규모델 o1 pro 에게 수능수학 킬러 문제 풀게 하기
- OpenAI-o1 모델 정식 출시 및 ChatGPT Pro 구독제 발표OpenAI, o1 모델 정식 출시 및 ChatGPT Pro 구독제 발표 (주요 내용) 1. o1 모델 특징 - 복잡한 추론과 문제 해결에 특화 - 이미지 업로드 기능 추가 - IMO 수학 올림피아드 예선 83% 정답률 기록(GPT-4o 13%) - 과학, 코딩, 수학 분야에서 PhD 수준 성능 2. ChatGPT Pro 구독제 - 월 200달러 구독료 - o1 모델 무제한 사용 - 우선 접근권 제공 - 사용량 제한 없음 - Pro 모드로 더 높은 연산능력 활용 가능 3. 가격 정책 - o1 API 요금: 입력 15달러/백만 토큰, 출력 60달러/백만 토큰 - o1-mini: 입력 3달러/백만 토큰, 출력 12달러/백만 토큰 - GPT-4o 대비 최대 6배 높은 요금 (요약) OpenAI가 추론에 특화된 o1 모델을 정식 출시하고, 월 200달러의 ChatGPT Pro 구독제를 도입했다. o1은 복잡한 문제 해결에서 뛰어난 성능을 보이며, Pro 구독자에게는 고급 기능과 무제한 사용을 제공한다. (핵심요약) OpenAI, 추론 특화 o1 모델 출시와 함께 월 200달러 ChatGPT Pro 구독제 도입, 고급 기능과 무제한 사용 제공 - dc official App- 챗지피티신규모델이 개쩐대,,수학문제도 다 풀어준다는데 pro쓰려면 월 200달러래..- (장문) o1 pro 에게 수능수학 킬러 문제 풀게 하기전에 o1-preview, Gemini 나왔을 때 수능 수학 실험글 올렸던 특붕이임https://gall.dcinside.com/mgallery/board/view/?id=thesingularity&no=569198&exception_mode=recommend&s_type=search_subject_memo&s_keyword=%EC%88%98%EB%8A%A5&page=1 o1 pro 가능해지자마자 어차피 자주 쓸 것 같아서 바로 결제했고, 전에 o1-preview랑 Gemini가 못 풀었던 문제들 위주로 물어봄참고로 멀티모달이 되기는 하지만 한국어랑 이미지 인식 능력이 아직은 회의적이어서 사진 말고 그냥 텍스트로(수식은 latex) 물어봄이하의 실험결과는 모두 성능 향상에 도움되는 별도의 프롬프트 없이, 1트만에 대답한 것임.---------------------------------------------------------------------------25 수능 수학 22번(공통)이제껏 인공지능이 제대로 푼 걸 본 적이 없었던 수열 추론 문제o1, gemini 등은 a_1 부터 케이스 나눠서 추론해서 케이스가 복잡해졌고, 그 와중에 빠뜨린 것들도 있어서 틀렸던 문제임일단 |a_1| = |a_3| 인 경우랑 |a_2| = |a_4| 인 경우 배제해야겠다고 생각하고 들어가는 것부터 굿바로 a_3 부터 케이스 나눔ㅋㅋㅋ 사실 똑똑해진 게 아니라 단순히 생각 시간만 늘린 거라면 케이스를 a_1 기준으로 나누었을 텐데애초에 a_3 기준으로 케이스 나눈 것부터 능지가 떡상했다는 뜻이후 각 케이스에 대해서 검산한 후에 답 제출한 것까지 완벽.o1은 시간이 부족해서 그런건지 24를 빠뜨려서 오답22번 정답 : 64o1 제출 : 40 (오답, 1분 22초)o1 pro 제출 : 64 (정답, 3분 27초)--------------------------------------------------------------------------------------------25 수능 수학 28번(미적)o1-preview랑 Gemini는 문제 상황은 잘 파악했지만 부분적분 계산 못 해서 실패했던 문제바로 1*f(x)로 바꿔서 부분적분하는 스킬 갈겨서 정답o1 pro 말고 o1한테도 시켜봤는데 33초 만에 계산하긴 했지만 부호를 틀림.y=f(x) 그래프 개형이 위로 볼록하게 그려야 하는데 아래로 볼록한 걸로 착각한 듯?아무튼 o1 pro는 맞춤22번 정답 : 2/3 + e/2o1 제출 : -2/3 - e/2 (오답, 33초)o1 pro 제출 : 2/3 + e/2 (정답, 2분 57초)----------------------------------------------------------------------------------------------------25 수능 수학 29번(미적)이것도 o1-preview, Gemini는 초항/공비까지는 구했는데 식 계산을 잘 못해서 틀린 문제짝수항 홀수항 나눠서 따로 합 잘 구했고, 이후 초항이랑 공비까지 잘 구함이후 계산도 잘 했고, 부등식 유도한 후 m이 홀수인 거 안 빠뜨리고 잘 대입해서 구함참고로 이 문제도 그냥 o1한테 시켰는데도 잘 풀었음o1 pro는 항상 o1보다는 시간 많이 쓰던데 아마 검산하느라 그런 듯물론 그 덕분에 o1이 틀린 다른 문제들까지 다 맞췄으니 바람직하다고 생각함22번 정답 : 25o1 제출 : 25 (정답, 1분 10초)o1 pro 제출 : 25 (정답, 2분 48초) -----------------------------------------------------------------------------------------------------25 수능 수학 30번(미적)o1-preview랑 Gemini는 (나) 의 주기 조건을 잘 해석 못 해서 못 풀었던 문제이후 힌트 줬는데도 그래프 이용해서 방정식 근 찾는 부분에서 막힘(나)의 주기 조건으로부터 a값이 1, 1.5, 2만 가능하다는 거 잘 추론해냈고,특히 (나)의 최소 주기 조건으로부터 a가 1.5밖에 안된다는 것도 완벽히 추론해냄. 이후 f(x)의 극대점을 찾기 위한 방정식의 근을 수식적으로 구할 수는 없지만, 근사적으로 구할 수 있다는 것을 추론해냄.구체적인 과정은 위 풀이에는 드러나있지 않아서 생각하는 과정 뚜껑 열어서 확인해봄인간이 하는 것처럼 그래프를 그려서 근의 개수를 구하지는 않았지만 (애초에 이 과정을 visualize해서 보여줄 수 있는 기능이 없는 듯? 멀티모달이라 사실은 이것도 시키면 되려나?)f'(x)의 부호가 바뀌는 x값의 수치를 근사적으로 예측하고 직접 대입해서 근들을 구함(...)사실 그래프 그려서 그리는 게 더 좋은 방법이긴 하지만 계산도 이제 잘 한다는 걸 보여주는 거라고 생각함30번 정답 : 15pi/2o1 제출 : 15pi/2 (정답)o1 pro 제출 : 15pi/2 (정답, 4분 33초)-------------------------------------------------------------------24 수능 수학 22번(공통)대망의 작년 수능 수학 22번단순 추론 난이도로만 따지면 역대 수능 문제 중 최강이었다고 생각함1. 발상 자체가 수학적이게 "f(n) < 0 인 최대의 정수 n을 생각하자" 라는 식으로 이루어져야 하고,2. 이후 인접한 두 정수에서 f가 근을 가져야 한다는 걸 알아내고,3. 그 이후에는 근의 위치 추론한 후 4. 식 세우고 계산해서 풀어야 함수능에 모든 걸 쏟아붓는 나라에서 정답률 1.5%라는 것에서 볼 수 있듯이 인간 상위권만 풀 수 있는 문제이전 인공지능(o1-preview, o1-mini, Gemini)들은 1-2단계 발상 정도까지는 어느 정도 했었는데 그 이후를 돌파하지 못함사실 삼차함수 개형 추론만 비정상적으로 좋아하는 한국 수능 스타일 + 수학적 추론을 동시에 요구하는 거라인공지능한테 불리한 문제이기도 함o1-pro 한테 시켰을 때도 한 10분 동안 혼자 ㅈㄴ 생각하는데, 계속 중근 가지는 경우 따지고 있고 똑같은 생각 계속 하길래 이번에도 못 푸나 싶었음그런데정답 : 483혹시 운빨로 맞춘 거 아닐까? 해서 풀이과정을 봄위 문단들을 요약하자면 "이 문제 조건 만족하는 건 존나 어려울 것 같음. 이거 만족하려면 근들이 엄청 특이하게 배치되어 있어야 할 듯?" 인데,이게 이 문제의 핵심임을 생각하면 통찰력이 꽤 대단하다고 할 수 있음이후 추론하는 과정 다 생략하고, 뜬금없이 f(x) = x(x-1)(x-r) 이라고 정답인 케이스를 내놓음.일단 여기까지 식 세웠으면 이후 과정은 단순계산이니 당연히 잘 계산해서 맞췄는데,일단 저 식이 바로 나온 게 너무 뜬금없어서 이새기 이거 운빨로 맞춘 거 아니야? 하고 생각하는 과정까지 다 검토함.(생각하는 과정 일부 편집해서 캡처)처음 한 2분 동안 여러 가지 시도해보다가 인접한 두 정수에서 근을 가지는 경우를 직관적으로 먼저 생각한 게 좀 신기함Hm, that's interesting 으로 시작하는데 그 이후 과정이 날카로운게 좀 소름돋음ㅋㅋㅋ이후 두 정수근 중 하나가 중근인 경우를 구해보는데 계산 상으로 근이 정수가 안 나오게 돼서 기각(참고로 o1-pro가 아니라 그냥 o1은 이 부분에서 근이 정수가 안 나왔는데도 그냥 답으로 제출해서 틀림)이후 정수근을 어떻게 가져야 문제 조건을 만족하게 될지 8분 동안 생각함f'의 부호까지 고려해서 근의 범위 구하고, 문제 조건 만족하기 위해서 근이 0~1 근처에 있어야 한다는 걸 (정확히는 아니지만) 유추해냄.아마 풀이과정에 이것까지 다 적기에는 너무 난잡해져서 그냥 생략한 듯함.아무튼 뜬금없이 찍어서 맞춘 것은 아니고, 문제 조건 전부 고려해서 근의 위치를 적절히 추론해냄텍스트로만 소통하고 있는 거라 확실하진 않지만, 멀티모달이라 그런지 그래프 개형 추론도 이제 어느 정도 하는 듯함.22번 정답 : 483o1 제출 : 800021/1728 (오답, 6분 14초)o1 pro 제출 : 483 (정답,10분 9초)------------------------------------------------------------------------------------25수능 수학(미적) 기준 준킬러/킬러 문제들 o1-pro는 다 맞추고(사실상 만점), o1은 3문제 틀림.특히 찍어서 맞추거나 불필요한 과정이 많지도 않았고, 딱 핵심만 파악해서 완벽하게 품.다른 문제들도 이제 멀티모달 되니까 그냥 캡처해서 시키면 되긴 하는데, 솔직히 이 문제들 풀이과정까지 완벽하게 맞출 정도면 다른 문제들은 그냥 맞출 확률 99%라 안 해봐도 된다고 생각함내가 하긴 귀찮으니 다른 특붕이들이 해보거나 나중에 뉴스 뜨면 보셈ㄱㄱ수학문제들 테스트해보고 나서 느낀 점은, 솔직히 9월달에 처음 o1 나오고 처음 테스트했을 때도 신세계였는데, 불과 2개월만에 이 정도 발전한 것도 ㄹㅇ놀라움물론 수능문제 따위는 최전선 수학 연구 주제에 비하면 아무것도 아니긴 하지만, 일단 발전속도가 말도 안됨단순 언어모델만으로 이 정도 추론까지 할 수 있다는 게 진짜 신기하고,언어모델이 이 정도인데 구글의 AlphaGeometry 같은 것도 있다는 걸 고려해보면 수학/과학 쪽에서도 인간 최상위권을 따라잡는데 오래 걸리지 않을 것이라고 보는 게 맞을 듯그리고 o1-preview에서 o1-pro로 바뀌면서 사실 제일 크게 달라진 건 의외로 추론 시간인 것 같음o1-preview나 o1에서는 문제 풀다가 좀 막힌다 싶으면 어? 안되네 하고 대충 검토도 안 해보고 제출해버리거나구한 답이 문제 상황과 일치하는지 생각하는 과정이 부족했고 그래서 오답이 나오는 경우가 제일 많았는데,o1-pro는 일단 자기가 계산한 게 맞는지 철저히 검토해보면서 오답을 최소한 줄이고,메타적으로도 자신이 생각하고 있는 상황이 문제 상황과 일치하는지 계속해서 생각해보는 느낌이었음.결국 "환각"이라는 것도 내부 검증 시간이 부족한 게 문제지, 검증 모델이 정확하고 검증 시간만 충분히 주어진다면환각은 충분히 해결 가능할 거라는 생각도 들었음. 괜히 Scaling 법칙이 아직까지 유효하다고 하는 게 아닌 듯함이제 수능 수학은 사실상 정복됐으니, 이후 더 어려운 학부/석박 과정 수학문제들도 종종 풀려볼 예정임세줄 요약:1. o1-pro 2025 수능 수학 준킬러/킬러 모두 정답, 24 수능 22번도 정답2. 추론 능력 떡상, 연산 시간 늘리면서 오답 낼 확률 현저히 적어짐3. 특이점은 온다
작성자 : ㅇㅇ고정닉
이번 인디아나존스 평가에서 은근 웃긴점...JPG
현재 86~88점 상태에 있는 인디아나존스 : 그레이트서클..해당 게임을 가장 저평가한 PureXbox의 6점 리뷰를 포함해서7~10점짜리 리뷰에서 공통적으로 말하는 내용은'인디아나존스 원작에 대한 존중이 많다.''인디아나존스 팬들이라면 만족할 만한 게임.'이런 평이 대다수임..근데 이게 왜 레딧 포함해서 은근 놀랍다는 말이 나오냐면원작 파괴 논란으로 게임 팬들의 질타가 많자치프 배우가 직접 사과까지하며자신이 맡은 배역 임무 중 하나는 원작 팬들과의 연결 고리를 박살내는 것이었다느니전작 등장인물 캐붕까지 발생하면서 까지전작을 즐긴 사람을 불쾌하게 만드는 스토리를 집필해놓고비판하는 게이머들에게"원작자보다 원작을 더 잘아는 자칭 팬 보이들이 유난이다"같은 헛소리를 한다거나원작 팬들과 게이머들의 니즈를 전혀 모르고 지들 좆대로 만들어서 개좆박아 놓고는 메타크리틱 점수 제도의 문제니, 스팀 유저 통계가 잘못이니 하는 병신 개발사가 있어서 그런지인디아나존스 이번 작품의 호불호와 별개로원작 존중 만큼은 엄청 잘했다고 칭찬하고 있음..아니 원작 있는 작품이면당연히 존중하는게 맞았던거 아님 ㄹㅇ..?원작 존중의 정상화유기물 역사상 최고 GOAT이 아니라...사실 이번 인디아나존스에서 씹드 좆워드는 디즈니한테 IP 빌려올때 얼굴 마담으로 같이 가기 +그냥 조언따리 역할 하나로 본인 이름을 대문짝하게 한스푼 얹은 수준이고 실제 게임 개발 디렉팅은 울펜슈타인 뉴오더 당시에 총괄 프로듀서였던 예르크 구스타프손이 맡음..근데 둠 디렉터처럼 게임 괜찮게 만드는거랑 별개로그냥 지나가는 겜붕이 2 처럼 생긴 외모 게임쇼에 나올때마다 남들 앞에서 말하는거는 잘 못해가지고말빨 GOAT 씹드 좆워드가 본인이 만든냥 계속 쳐나온거임..- 역사상 최고 GOATG O A T- 인디아나존스 팬들이 오열했다는 이번 게임 오프닝.swf영화 첫 오프닝 그대로 오마쥬함..
작성자 : 한지은고정닉
차단하기
설정을 통해 게시물을 걸러서 볼 수 있습니다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.