갤러리 이슈박스, 최근방문 갤러리
개념글 리스트
1/3
- 한 미국인 학생이 한국국적을 포기한 이유 ㄷㄷㄷ 최훤종
- 속보 실시간 국민의힘 대통령 후보자 등록 공고 근황...jpg 사피엔스
- 훌쩍훌쩍 군대 위문공연 레전드 기레츠
- 충격 김문수 짤림 ㄷㄷㄷㄷㄷ 이거 실화냐? ㄷㄷㄷㄷㄷ ㅇㅇ
- 속보) 클린스만 : 손흥민이 먼저 이강인 때렸다 ㄷㄷㄷㄷㄷㄷ ㅇㅇ
OAI 추론팀 연구원이 보여주는 로드맵
o 시리즈를 통해 강화학습 '훈련'에 더 많은 시간을 투자할 수록 성능이 개선됨을 발견(테스트 타임 계산과는 별개로)GPT-4o 까지 거의 모든 컴퓨팅은 사전학습에 사용o1에서 사용된 사전학습:강화학습 컴퓨팅 비율 대략적인 그림o3 그림미래 버전들의 그림 -> 앞으로 RL 컴퓨팅을 점점 더 확장할 것임을 시사나중에는 결국 이렇게 될 것이며, 이를 목표로 하고 있다<2019년 얀 르쿤의 강연 슬라이드>얀 르쿤은 자기 지도 학습을 케이크, 지도 학습을 아이싱, 그리고 강화학습을 체리에 비유하며 RL의 정보량이 상대적으로 적다고 말했습니다..."우리는 이 밈을 완전히 뒤집고 싶습니다... 거대한 강화 학습 체리로 사전 학습 케이크를 뭉개버리고 싶습니다."https://www.youtube.com/watch?v=_rjD_2zn2JU
작성자 : ㅇㅇ고정닉
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.