갤러리 이슈박스, 최근방문 갤러리
연관 갤러리
다이어트 갤러리 타 갤러리(0)
이 갤러리가 연관 갤러리로 추가한 갤러리
추가한 갤러리가 없습니다.
0/0
타 갤러리 다이어트 갤러리(0)
이 갤러리를 연관 갤러리로 추가한 갤러리
0/0
개념글 리스트
1/3
- 선생님이 집까지 태워주신 manhwa 도우시락
- WWE역사상 가장 유명한 라이벌리 프갤러
- 한국군은 항상 너무 구식인 나머지 신식이 되는게 웃김 기신고래(진)
- 싱글벙글 ㄹㅇ 1박 2일이 GOAT였던 이유.... ㅇㅇ
- 블라) 내가 그렇게 돈에 미친년이야? 관심종자
- 한 “조국 수호는 왜?” 홍 “법에도 눈물 있다“ 세티르
- 네이버 하이버클로바X의 신모델을 테스트 해보았다. Cohere
- 본인, 해고를 당하다... .MANHWA ..김지민
- 아프간에 다녀온 여자 PD가 말하는 탈레반 ㅇㅇ
- 싱글벙글 12년 동안 월급 안 받은 교황 프란치스코 수인갤러리
- 안싱글벙글 헬스장에서 상처 받은 남녀 비만인.jpg ㅇㅇ
- 나거한)아이 안낳으면 감옥가야 발언 경찰조사....jpg ㅇㅇ
- 일쌍툰 1~4화.manhwa 웅쿤
- 싱글벙글 mcu 노베이스 캐릭터들 최철귀
- 돼지고기로 보는 가슴확대수술 과정 ㅇㅇ
GPT 환각 방지 프롬프트, 정말 효과가 있을까?
일단 이 글을 적기 위해서 11,046원을 지출하였음.후원 좀 받을 수 없나..?ㅋㅋㅋ환각(Hallucination)이란?챗갤 유저들이라면 아주 흔히 접해봤을 용어일 것임.간단히 말하면,LLM이 존재하지 않는 거짓 정보를 그럴싸하게 생성하는 현상을 말함.예를 들어,그러니까 존나 당당하게 틀린 말을 한다는 것이 문제인 거지.주요 LLM 개발사들은 환각 현상을 줄이기 위해 상당한 심혈을 기울이고 있고,유저들도 나름대로 대응책을 공유하고 있음.여러 프롬프트 사이트들 보면,여러 유저들이 환각을 줄이는 프롬프트를 공유하는 모습을 볼 수 있음.그러나 이런 프롬프트들이 실효성이 있는지에는 의문이 있음.이번에는 챗갤에 게시되었던 여러 환각 방지 프롬프트들을 정량적으로 평가해볼꺼임.SimpleQASimpleQA는 LLM의 사실성(factuality)를 측정하기 위한 OpenAI 벤치마크임.얼마나 환각을 적게 생성하는지, 얼마나 정확하게 응답하는지 평가함.주요 모델들 simpleQA 벤치마크베이스 모델 중에는 GPT-4.5가 가장 높은 정확도를 보임. 즉 환각이 제일 낮다는 뜻.https://github.com/openai/simple-evals GitHub - openai/simple-evalsContribute to openai/simple-evals development by creating an account on GitHub.github.comOpenAI는 simpleQA 벤치마크 데이터셋을 공개하고 있음.해당 데이터셋을 사용하여 프롬프트 벤치마크를 진행해볼꺼임
실험 세팅벤치마크: OpenAI SimpleQA테스트케이스 갯수: 500개방식: 테스트 모델이 벤치마크 문제들을 풀어오면, 채점자 모델이 채점하는 방식으로 진행테스트 모델: ChatGPT-4o-latest (최신 ChatGPT 4o 모델)파라미터- Temperature: 0.7- max_tokens: 150- 그 외에는 default채점자 모델: GPT-4.1.mini파라미터- Temperature: 0.1- max_tokens: 10상술했듯, OpenAI SimpleQA 벤치마크를 사용하였고, 현재 ChatGPT에서 서비스되고 있는 4o의 API를 사용하여 테스트함.테스트케이스는 원래는 4332개인데 내가 그지라서 좀 줄였음.Node.js로 벤치마크 프로그램을 만들어서 진행하였음.프롬프트별 테스트 결과OpenAI 기본 프롬프트(You are a helpful assistent)아주 기본적인 시스템 프롬프트만 포함하고 있음.정확도 39.6%공식 벤치마크 정확도가 38.2%이므로 상당히 준수한 성능을 뽑아내었음.하나빛 환각 방지 프롬프트정확도 38.6%오히려 기본 프롬프트에 비해 정확도가 떨어짐.ㅇㅇ(221.150) 환각 방지 프롬프트정확도 38.3%마찬가지로, 기본 프롬프트에 비해 낮은 정확도를 보여주었음.(DLC)모노로그 환각 방지 프롬프트딱 봐도 예능용 프롬프트지만, 그래도 한 번 테스트해봄.정확도 0%그만 알아보자.결과 비교프롬프트 종류정확도비고OpenAI 기본 프롬프트39.6%공식 벤치마크(38.2%)보다 약간 높음하나빛 프롬프트38.6%효과 미미ㅇㅇ(221.150) 프롬프트38.3%오히려 떨어짐모노로그 프롬프트(예능용)0%결론적으로,커뮤니티에서 공유된 대부분의 ‘환각 방지 프롬프트’는 오히려 기본 프롬프트보다 정확도가 낮았음.이는 프롬프트만으로 환각 문제를 해결하는 데 한계가 있다는 점을 다시 한 번 보여줌.하지만 그렇다고 프롬프트 엔지니어링이 무의미하다는 건 아님.일부 논문 중에는 프롬프팅을 통해 정확도를 향상시킨 사례도 존재함(CoVE라던가)즉, 잘 설계된 프롬프트는 분명 효과가 있을 수 있음.문제는 지금 돌아다니는 대부분의 환각 방지 프롬프트가 그저 조악하다는 거임.좋은 모델을 사용하고, 비판적으로 검토하는 것이 가장 나을 것임.
작성자 : 구름냥이고정닉
[소개] 지옥행 직전인 노인네들의 레트로 지옥 크롤링
뿅~ 인디갤 마스코트 노루시 등장~!!Neon Noroshi 인디 게임 갤러리 담당 인사드립니다!벌써 4월이 끝나가요! 의미있는 무언가를 이루셨나요!사실 아직 안 이뤘어도 괜찮대요! 2025년 많이 남아서!https://youtu.be/t58DcDo6bfA오늘의 게임!1인칭 시점의 던전 탐험 생존 호러 게임인Labyrinth of the Demon King (마왕의 미궁)을 소개해요!게임의 배경은 요괴와 악령이 활보하는 봉건 시대 말의 일본이며, 주인공은 주군을 잃고 복수를 다짐하는 병사랍니다!거대한 미궁을 탐색하며 마왕과 그 수하들을 처치하고, 잃어버린 진실을 찾아 나서는 게 목표죠!게임은 거대한 성과 폐허, 지하 던전으로 구성된 미궁을 탐험하며 진행되며일본 전통 신사, 무덤, 성채 등을 뒤틀고 썩은 듯한 형태로 재해석해 불길함을 조성하고 있답니다!지역 간 연결과 봉인 해제 등 메트로이드배니아식 구조가 도입되어 길찾기와 탐색이 핵심이에요!의도적으로 저해상도 텍스처와 거친 폴리곤, 디더링 효과를 활용해 PS1 시대의 공포 게임 분위기를 재현했답니다!어두운 색조와 뭉개진 화면 효과가 상상력을 자극하며 긴장감을 유발하게 설계되어 있죠!4:3 비율, 로딩 도어 연출 등 고전 게임 특유의 연출도 충실히 담겨 있고요!레트로 미학을 철저히 살린 그래픽은 동시대 인디 호러 게임 중에서도 독보적이라고도 볼 수 있지 않을까 싶네요!조작 역시도 현대 FPS와 유사하지만은, 움직임이 느리고 스태미너 제약이 있어 조심스러운 플레이를 유도한답니다!조작의 느림과 무거움 자체가 공포의 연출 장치가 되는 방식이죠!빠른 이동보다 상황 파악과 주변 경계가 생존의 열쇠가 될 수 있어요!전투는 느리지만 강한 몰입감을 주는 실시간 1인칭 액션으로 구성되어 있어요!카타나, 창, 머스켓 등 제한된 무기를 사용하며, 스태미너 시스템이 있어 신중한 판단이 중요하죠!한 번의 공격, 막기, 회피에도 전략과 타이밍이 필수이며, 무기마다 사용법과 제약이 각기 다르답니다!강력한 요괴들의 예측 불가능한 공격은 전투의 압박감을 훨씬 증폭시키기도 하고요!단순 크롤링뿐만이 아니라, 게임 내 NPC들과의 만남은 선택지에 따라 플레이 결과에 영향을 미친답니다!일부는 도움을 주고, 일부는 배신할 수도 있어 선택의 무게감이 존재하죠!스토리는 단순한 진행형이 아니라 플레이어 행동에 따라 분기될 수 있으며,각 캐릭터와의 상호작용이 세계관 이해와 몰입에 중요한 역할을 한다고 하네요!무시무시한 동양식 호러를 담은 1인칭 던전 크롤러 게임'마왕의 미궁'은 5월 14일, 스팀으로 정식 출시 예정이랍니다!PS1 그래픽의 소름돋는 액션을 원하신다면 좋아요와 팔로우는 어떠신지요~!!https://store.steampowered.com/app/1804010/Labyrinth_Of_The_Demon_King/ Labyrinth Of The Demon King on Steam Venture through the Labyrinth Of The Demon King, solving puzzles and fighting fearsome monsters in an epic quest to track down the demon who betrayed your lord and end its life.store.steampowered.com감사합니다! Neon Noroshi입니다!감사합니다!
작성자 : NeonNoroshi고정닉
차단하기
설정을 통해 게시물을 걸러서 볼 수 있습니다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.