갤러리 이슈박스, 최근방문 갤러리
개념글 리스트
1/3
- 샘 알트만 "2026 레벨4 agi 될 것" 특술람
- 요즘 현지에선 역대급으로 욕쳐먹고 있는 헐크호건 상황 대갓염
- ‘단일화 갈등’ 김문수, 직접 ‘대선후보 지위 인정’ 가처분 신청 ㅇㅇ
- 선수 뒤에 숨어버린 이정효 ㅋㅋㅋㅋㅋgisa ㅇㅇ
- 냠냠쩝쩝 인도음식들 박기린
'돈 내면 성능평가 1위?'…'벤치마크 무용론'에 자금논란까지
AI 성능 평가의 허와 실• 오픈AI, 메타, xAI 등 빅테크 기업들이 자사 AI 모델의 벤치마크 점수를 부풀리기 위해 맞춤형 사전 훈련이나 특수 테스트 버전을 사용하는 등의 의혹이 제기되고 있다.• 메타의 라마4, 머스크의 그록3, 오픈AI의 GPT-3 등이 벤치마크 조건에 맞춰 훈련된 모델을 사용하여 실제 성능보다 높은 점수를 기록한 사례가 드러났다.• 스탠퍼드대 HAI 연구소는 벤치마크 발표 사례 150개 이상을 검토한 결과 데이터 조건 통제 및 재현성 문제를 지적하며 벤치마크의 신뢰성에 의문을 제기했다.• 벤치마크 기관에 대한 빅테크 기업들의 자금 지원으로 인해 평가 결과에 대한 공정성 논란이 일고 있으며, 현재 AI 성능 평가 방식은 마케팅 도구에 가깝다는 비판이 제기되고 있다.https://n.news.naver.com/mnews/article/421/0008236494
작성자 : ㅇㅇ고정닉
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.