갤러리 이슈박스, 최근방문 갤러리
개념글 리스트
1/3
- 깜짝… 여성 ADHD 환자… 역대급 갱신…ㄹㅇ 갈베
- 블붕이가 트위터 스팸봇한테 치즈돈까스 레시피 받아내는법 스마튬
- '여론조사비 대납의혹' 수사 경찰, 미래한국연구소 전 소장 조사 ㅇㅇ
- “경제 전망 불확실성 ‘더’ 커졌다”...美연준 3연속 기준금리 ㅇㅇ
- 김문수 - 한덕수 단일화 협상 결렬 서현역
'돈 내면 성능평가 1위?'…'벤치마크 무용론'에 자금논란까지
AI 성능 평가의 허와 실• 오픈AI, 메타, xAI 등 빅테크 기업들이 자사 AI 모델의 벤치마크 점수를 부풀리기 위해 맞춤형 사전 훈련이나 특수 테스트 버전을 사용하는 등의 의혹이 제기되고 있다.• 메타의 라마4, 머스크의 그록3, 오픈AI의 GPT-3 등이 벤치마크 조건에 맞춰 훈련된 모델을 사용하여 실제 성능보다 높은 점수를 기록한 사례가 드러났다.• 스탠퍼드대 HAI 연구소는 벤치마크 발표 사례 150개 이상을 검토한 결과 데이터 조건 통제 및 재현성 문제를 지적하며 벤치마크의 신뢰성에 의문을 제기했다.• 벤치마크 기관에 대한 빅테크 기업들의 자금 지원으로 인해 평가 결과에 대한 공정성 논란이 일고 있으며, 현재 AI 성능 평가 방식은 마케팅 도구에 가깝다는 비판이 제기되고 있다.https://n.news.naver.com/mnews/article/421/0008236494
작성자 : ㅇㅇ고정닉
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.