사진 찍으면 AI가 문제 풀어주는 클로바엑스

GPT매거진 갤러리

1/3

방금 찍어온 비오는 가을 밤 (26장, webp) 심심해서 주섬주섬 챙겨입고 나가서 사진 좀 찍다옴옛날엔 비오는날에 옷 버려서 싫어했는데 요즘엔 비오는 날만 찍을수 있는 사진이 있어서 나쁘지 않은거 같음 작성자 : 호랑선생

사진 찍으면 AI가 문제 풀어주는 클로바엑스

GPTMAGAZINE

2024.08.23 12:11:26

조회 6932 추천 1 댓글 7

🔼 클로바 엑스에 이미지 인식 탑재
🔼 멀티모달 LLM으로 AI 진화 가속화
🔼 텍스트·이미지·음성 모두 처리 가능

네이버가 자사의 AI 비서 '클로바 엑스(CLOVA X)'에 이미지 인식 기능을 탑재하며 인공지능 기술 경쟁력 강화를 본격화했다. 이로 인해 사용자는 사진 속 상황을 설명하거나 표와 그래프를 분석하며, 수학 문제까지 해결할 수 있는 다재다능한 AI와 상호작용할 수 있게 됐다. 네이버는 이번 업데이트를 통해 텍스트뿐만 아니라 이미지와 음성까지 동시에 처리할 수 있는 멀티모달 AI로 클로바 엑스를 진화시키며, 생성형 AI 분야에서 경쟁력을 확보하려 하고 있다.

네이버는 오는 27일 클로바 엑스 서비스 업데이트를 통해 새로운 시각 정보 처리 기능을 추가한다고 22일 발표했다. 이번 업데이트의 핵심은 이미지 이해 기능으로, 사용자가 클로바 엑스 채팅창에 업로드한 이미지와 입력된 질의에 기반해 AI와 소통할 수 있도록 지원한다.

클로바 엑스는 사진 속 현상을 설명하거나 상황을 추론하는 등 다양한 지시를 수행할 수 있다. 예를 들어, 표와 그래프를 이미지 형태로 입력하면 이를 이해하고 분석하는 능력을 보여준다. 네이버는 자사의 우수한 문서 처리 및 문자 인식 기술과 다양한 분야의 지식을 가진 대규모 언어 모델(HyperclovaX)을 결합해 보다 정확하고 신뢰할 수 있는 서비스를 제공한다고 밝혔다.

네이버는 실제로 국내 초·중·고등학교 검정고시 문제 1,480개를 AI 모델에 이미지로 입력해 문제를 해결해보는 실험을 진행했다. 그 결과, 클로바 엑스가 학생들의 학습을 지원할 수 있는 가능성을 확인했다고 전했다.

또한, 네이버는 20일 '클로바' 공식 기술 블로그를 통해 HyperClovaX 기반의 음성 AI 기술도 공개했다. 이 모델은 기존 음성 인식 및 음성 합성 기술보다 더욱 발전된 형태로, 대규모 언어 모델의 우수한 맥락 이해와 명령 해석 능력을 활용해 언어 구조와 발음 정확도를 개선했으며, 감정 표현이 가능한 자연스러운 대화를 제공할 수 있게 됐다.

네이버는 AI 음성 녹음 '클로바 노트', AI 인사 전화 '클로바 케어 콜', AI 음성 합성 '클로바 더빙' 등 다양한 음성 AI 서비스를 이미 선보였으며, 이번 음성 멀티모달 LLM 기술을 통해 실시간 음성 번역, 언어 학습, 상담 등 다양한 서비스에 활용할 가능성을 제시했다.

네이버 클라우드의 하이퍼스케일 AI 기술 총괄인 성낙호는 “HyperClovaX를 멀티모달 LLM으로 발전시켜 AI 안전성을 강화할 계획”이라며, “네이버 AI 안전 프레임워크(ASF)를 활용해 AI 시스템의 잠재적 위험을 평가하고, 음성 AI 기술이 보다 안전한 서비스를 제공할 수 있도록 지속적으로 검토할 것”이라고 밝혔다.

네이버는 HyperclovaX를 멀티모달 LLM으로 발전시키는 과정에서 AI 안전성을 강화하기 위해 지속적으로 노력할 계획이다. 지난 6월 발표된 네이버 AI 안전 프레임워크(ASF)를 통해 AI 시스템의 잠재적 위험성을 평가하고, 다양한 측면을 검토하여 보다 안전한 AI 서비스를 제공할 방침이다.

◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com
카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf
페이스북 그룹 : https://www.facebook.com/groups/392367786704067

고정닉 0

원본 첨부파일 2본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	제목	글쓴이	작성일	조회	추천
설문	지금 결혼하면 스타 하객 많이 올 것 같은 '인맥왕' 스타는?	운영자	24/10/28	-	-
397	OpenAI의 음성 변환 도구 'Whisper', 심각한 오류 발생 논란 [4]	GPTMAGAZINE	10.28	6556	1
396	메타, AI 시대 맞아 로이터와 첫 뉴스 제휴 계약 체결	GPTMAGAZINE	10.28	85	0
395	블룸버그 AI, 인터넷보다 빠르게 발전할 것	GPTMAGAZINE	10.28	99	0
394	"애플, 'Apple Intelligence' 출시로 AI 혁명 선도" [6]	GPTMAGAZINE	10.23	2164	0
392	오픈AI, Windows용 ChatGPT 앱 출시	GPTMAGAZINE	10.18	1261	0
391	테슬라 AI 로봇, 알고 보니 사람이 조종했나? [19]	GPTMAGAZINE	10.15	3146	6
390	‘에이전틱 AI’, 자율적 학습과 추론의 시대 [1]	GPTMAGAZINE	10.14	2293	2
389	MS, 세계 최초 '엔비디아 블랙웰' 기반 서버 공개 [1]	GPTMAGAZINE	10.11	1375	1
388	인공지능의 아버지들, 노벨상 공동 수상 [5]	GPTMAGAZINE	10.10	2034	7
387	아마존과 MS의 대규모 투자, 시애틀의 의료 AI 혁신 [2]	GPTMAGAZINE	10.08	2982	2
386	애플, iOS 18.1로 AI 기능 공개 [5]	GPTMAGAZINE	10.07	8536	2
385	메타, AI 텍스트 영상 제작 도구 '무비젠' 공개	GPTMAGAZINE	10.07	625	1
384	AI와 숏폼 콘텐츠, 구글의 아성 흔들다	GPTMAGAZINE	10.07	276	0
383	오픈AI, AI를 전기처럼 흐르는 세상 구축 계획 [10]	GPTMAGAZINE	09.26	3400	6
382	챗GPT-4o, 이제 한국어도 완벽 구사 가능 [12]	GPTMAGAZINE	09.25	4237	8
381	유튜버가 개발한 챗GPT로 시험 부정행위? 계산기가 커닝 도구로 변신! [13]	GPTMAGAZINE	09.24	3790	5
380	애플, AI ‘애플 인텔리전스’ 내년 한국어 지원 발표 [8]	GPTMAGAZINE	09.19	6393	4
379	정부, 공공기관 업무에 AI 도입 허용…보안 규제 대폭 완화 [19]	GPTMAGAZINE	09.12	6323	2
378	OpenAI, AI 모델 'Strawberry' 출시 임박 [11]	GPTMAGAZINE	09.11	3211	2
377	IBC 2024, 생성형 AI로 미디어와 엔터테인먼트 산업 혁신 이끌다 [1]	GPTMAGAZINE	09.10	6047	2
376	SKT, 퍼플렉시티 프로, SKT 고객에게 1년 무료 제공 [2]	GPTMAGAZINE	09.06	7904	0
375	구글 제미나이, 이제 크롬에서 바로 사용 [5]	GPTMAGAZINE	09.06	3269	2
374	테드 창, AI는 예술가인가? 아니면 기계일 뿐인가? [77]	GPTMAGAZINE	09.04	9215	14
373	오픈AI, 주간 사용자 2억 명 돌파 [5]	GPTMAGAZINE	09.02	3265	6
372	구글, AI 기반 둠 게임 엔진 시뮬레이션 개발에 성공 [18]	GPTMAGAZINE	08.30	9440	7
371	오픈AI, 서치GPT 개발로 인한 추가 투자 유치 인가? [2]	GPTMAGAZINE	08.29	6108	0
370	오픈AI, 딥페이크 방지 위해 워터마크 법안 지지 [15]	GPTMAGAZINE	08.28	4060	5
369	SK텔레콤 '에이닷', 지피티, 클로드 등 최신 언어 모델 7종 도입	GPTMAGAZINE	08.27	5811	4
368	구글 AI 스튜디오, 프롬프트 갤러리로 개발자 지원 [1]	GPTMAGAZINE	08.26	3110	2
	사진 찍으면 AI가 문제 풀어주는 클로바엑스 [7]	GPTMAGAZINE	08.23	6932	1
366	NVIDIA, AI 기술로 게임 캐릭터 대화 능력 대폭 향상 [21]	GPTMAGAZINE	08.22	7388	10
365	GPT-4o, 개발자 위한 파인튜닝 서비스 공식 출시 [5]	GPTMAGAZINE	08.21	7137	3
364	런웨이ML, '젠-3 알파 터보' 출시 [4]	GPTMAGAZINE	08.19	1274	0
363	일론머스크의 xAI, 'Grok2' 출시 [5]	GPTMAGAZINE	08.16	6282	0
362	구글, AI 음성 비서 ‘Gemini Live’ 공식 출시 [13]	GPTMAGAZINE	08.14	8371	1
361	오픈AI, 'GPT-5' 공개 임박? [6]	GPTMAGAZINE	08.13	3127	4
360	미드저니 위협하는 Flux.1, 얼마나 강력한가? [2]	GPTMAGAZINE	08.12	2278	0
359	LLM은 가고, LAM이 온다...AI의 한계 [12]	GPTMAGAZINE	08.09	4890	9
358	LG, 차세대 AI 모델 ‘EXAONE 3.0’ 오픈 소스로 공개 [7]	GPTMAGAZINE	08.08	3480	0
357	일론머스크, 오픈AI 설립 초기 약속 배신당해 [1]	GPTMAGAZINE	08.07	3629	2
356	ChatGPT 표절 방지 기술, 왜 비공개? [7]	GPTMAGAZINE	08.05	3745	1
355	오픈AI, 'GPT-5' 모델 미국 정부에 첫 공개 [17]	GPTMAGAZINE	08.05	3745	5
354	EU, 세계 최초 AI 규제법 발효 [36]	GPTMAGAZINE	08.02	7768	17
353	엔비디아와 메타, 구글과 애플의 동맹 [4]	GPTMAGAZINE	07.31	7295	3
352	오픈AI, 챗GPT 운영비 부담으로 인한 재정 위기 [51]	GPTMAGAZINE	07.30	9963	9
351	Meta, 최신 AI 모델 'Rama 3.1' 출시 [8]	GPTMAGAZINE	07.25	2914	1
350	애플, 2.5조 개 토큰으로 훈련된 7B 오픈소스 언어 모델 공개	GPTMAGAZINE	07.23	3169	2
349	네이버 거대AI 하이퍼클로바, 파라미터 숫자 공개 [11]	GPTMAGAZINE	07.22	3867	1
348	오픈AI, 자사 최강 모델의 미니 버전 'GPT-4o mini' 출시 [13]	GPTMAGAZINE	07.19	2915	1
347	엔비디아-미스트랄AI, 신규 AI 모델 '미스트랄 네모' 출시	GPTMAGAZINE	07.19	803	1