디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

사진 찍으면 AI가 문제 풀어주는 클로바엑스

GPTMAGAZINE갤로그로 이동합니다. 2024.08.23 12:11:26
조회 6932 추천 1 댓글 7




🔼 클로바 엑스에 이미지 인식 탑재
🔼 멀티모달 LLM으로 AI 진화 가속화
🔼 텍스트·이미지·음성 모두 처리 가능








네이버가 자사의 AI 비서 '클로바 엑스(CLOVA X)'에 이미지 인식 기능을 탑재하며 인공지능 기술 경쟁력 강화를 본격화했다. 이로 인해 사용자는 사진 속 상황을 설명하거나 표와 그래프를 분석하며, 수학 문제까지 해결할 수 있는 다재다능한 AI와 상호작용할 수 있게 됐다. 네이버는 이번 업데이트를 통해 텍스트뿐만 아니라 이미지와 음성까지 동시에 처리할 수 있는 멀티모달 AI로 클로바 엑스를 진화시키며, 생성형 AI 분야에서 경쟁력을 확보하려 하고 있다.


네이버는 오는 27일 클로바 엑스 서비스 업데이트를 통해 새로운 시각 정보 처리 기능을 추가한다고 22일 발표했다. 이번 업데이트의 핵심은 이미지 이해 기능으로, 사용자가 클로바 엑스 채팅창에 업로드한 이미지와 입력된 질의에 기반해 AI와 소통할 수 있도록 지원한다.


클로바 엑스는 사진 속 현상을 설명하거나 상황을 추론하는 등 다양한 지시를 수행할 수 있다. 예를 들어, 표와 그래프를 이미지 형태로 입력하면 이를 이해하고 분석하는 능력을 보여준다. 네이버는 자사의 우수한 문서 처리 및 문자 인식 기술과 다양한 분야의 지식을 가진 대규모 언어 모델(HyperclovaX)을 결합해 보다 정확하고 신뢰할 수 있는 서비스를 제공한다고 밝혔다.


네이버는 실제로 국내 초·중·고등학교 검정고시 문제 1,480개를 AI 모델에 이미지로 입력해 문제를 해결해보는 실험을 진행했다. 그 결과, 클로바 엑스가 학생들의 학습을 지원할 수 있는 가능성을 확인했다고 전했다.


또한, 네이버는 20일 '클로바' 공식 기술 블로그를 통해 HyperClovaX 기반의 음성 AI 기술도 공개했다. 이 모델은 기존 음성 인식 및 음성 합성 기술보다 더욱 발전된 형태로, 대규모 언어 모델의 우수한 맥락 이해와 명령 해석 능력을 활용해 언어 구조와 발음 정확도를 개선했으며, 감정 표현이 가능한 자연스러운 대화를 제공할 수 있게 됐다.


네이버는 AI 음성 녹음 '클로바 노트', AI 인사 전화 '클로바 케어 콜', AI 음성 합성 '클로바 더빙' 등 다양한 음성 AI 서비스를 이미 선보였으며, 이번 음성 멀티모달 LLM 기술을 통해 실시간 음성 번역, 언어 학습, 상담 등 다양한 서비스에 활용할 가능성을 제시했다.


네이버 클라우드의 하이퍼스케일 AI 기술 총괄인 성낙호는 “HyperClovaX를 멀티모달 LLM으로 발전시켜 AI 안전성을 강화할 계획”이라며, “네이버 AI 안전 프레임워크(ASF)를 활용해 AI 시스템의 잠재적 위험을 평가하고, 음성 AI 기술이 보다 안전한 서비스를 제공할 수 있도록 지속적으로 검토할 것”이라고 밝혔다.


네이버는 HyperclovaX를 멀티모달 LLM으로 발전시키는 과정에서 AI 안전성을 강화하기 위해 지속적으로 노력할 계획이다. 지난 6월 발표된 네이버 AI 안전 프레임워크(ASF)를 통해 AI 시스템의 잠재적 위험성을 평가하고, 다양한 측면을 검토하여 보다 안전한 AI 서비스를 제공할 방침이다.










◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com
카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf
페이스북 그룹 : https://www.facebook.com/groups/392367786704067

추천 비추천

1

고정닉 0

14

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 지금 결혼하면 스타 하객 많이 올 것 같은 '인맥왕' 스타는? 운영자 24/10/28 - -
397 OpenAI의 음성 변환 도구 'Whisper', 심각한 오류 발생 논란 [4] GPTMAGAZINE갤로그로 이동합니다. 10.28 6556 1
396 메타, AI 시대 맞아 로이터와 첫 뉴스 제휴 계약 체결 GPTMAGAZINE갤로그로 이동합니다. 10.28 85 0
395 블룸버그 AI, 인터넷보다 빠르게 발전할 것 GPTMAGAZINE갤로그로 이동합니다. 10.28 99 0
394 "애플, 'Apple Intelligence' 출시로 AI 혁명 선도" [6] GPTMAGAZINE갤로그로 이동합니다. 10.23 2164 0
392 오픈AI, Windows용 ChatGPT 앱 출시 GPTMAGAZINE갤로그로 이동합니다. 10.18 1261 0
391 테슬라 AI 로봇, 알고 보니 사람이 조종했나? [19] GPTMAGAZINE갤로그로 이동합니다. 10.15 3146 6
390 ‘에이전틱 AI’, 자율적 학습과 추론의 시대 [1] GPTMAGAZINE갤로그로 이동합니다. 10.14 2293 2
389 MS, 세계 최초 '엔비디아 블랙웰' 기반 서버 공개 [1] GPTMAGAZINE갤로그로 이동합니다. 10.11 1375 1
388 인공지능의 아버지들, 노벨상 공동 수상 [5] GPTMAGAZINE갤로그로 이동합니다. 10.10 2034 7
387 아마존과 MS의 대규모 투자, 시애틀의 의료 AI 혁신 [2] GPTMAGAZINE갤로그로 이동합니다. 10.08 2982 2
386 애플, iOS 18.1로 AI 기능 공개 [5] GPTMAGAZINE갤로그로 이동합니다. 10.07 8536 2
385 메타, AI 텍스트 영상 제작 도구 '무비젠' 공개 GPTMAGAZINE갤로그로 이동합니다. 10.07 625 1
384 AI와 숏폼 콘텐츠, 구글의 아성 흔들다 GPTMAGAZINE갤로그로 이동합니다. 10.07 276 0
383 오픈AI, AI를 전기처럼 흐르는 세상 구축 계획 [10] GPTMAGAZINE갤로그로 이동합니다. 09.26 3400 6
382 챗GPT-4o, 이제 한국어도 완벽 구사 가능 [12] GPTMAGAZINE갤로그로 이동합니다. 09.25 4237 8
381 유튜버가 개발한 챗GPT로 시험 부정행위? 계산기가 커닝 도구로 변신! [13] GPTMAGAZINE갤로그로 이동합니다. 09.24 3790 5
380 애플, AI ‘애플 인텔리전스’ 내년 한국어 지원 발표 [8] GPTMAGAZINE갤로그로 이동합니다. 09.19 6393 4
379 정부, 공공기관 업무에 AI 도입 허용…보안 규제 대폭 완화 [19] GPTMAGAZINE갤로그로 이동합니다. 09.12 6323 2
378 OpenAI, AI 모델 'Strawberry' 출시 임박 [11] GPTMAGAZINE갤로그로 이동합니다. 09.11 3211 2
377 IBC 2024, 생성형 AI로 미디어와 엔터테인먼트 산업 혁신 이끌다 [1] GPTMAGAZINE갤로그로 이동합니다. 09.10 6047 2
376 SKT, 퍼플렉시티 프로, SKT 고객에게 1년 무료 제공 [2] GPTMAGAZINE갤로그로 이동합니다. 09.06 7904 0
375 구글 제미나이, 이제 크롬에서 바로 사용 [5] GPTMAGAZINE갤로그로 이동합니다. 09.06 3269 2
374 테드 창, AI는 예술가인가? 아니면 기계일 뿐인가? [77] GPTMAGAZINE갤로그로 이동합니다. 09.04 9215 14
373 오픈AI, 주간 사용자 2억 명 돌파 [5] GPTMAGAZINE갤로그로 이동합니다. 09.02 3265 6
372 구글, AI 기반 둠 게임 엔진 시뮬레이션 개발에 성공 [18] GPTMAGAZINE갤로그로 이동합니다. 08.30 9440 7
371 오픈AI, 서치GPT 개발로 인한 추가 투자 유치 인가? [2] GPTMAGAZINE갤로그로 이동합니다. 08.29 6108 0
370 오픈AI, 딥페이크 방지 위해 워터마크 법안 지지 [15] GPTMAGAZINE갤로그로 이동합니다. 08.28 4060 5
369 SK텔레콤 '에이닷', 지피티, 클로드 등 최신 언어 모델 7종 도입 GPTMAGAZINE갤로그로 이동합니다. 08.27 5811 4
368 구글 AI 스튜디오, 프롬프트 갤러리로 개발자 지원 [1] GPTMAGAZINE갤로그로 이동합니다. 08.26 3110 2
사진 찍으면 AI가 문제 풀어주는 클로바엑스 [7] GPTMAGAZINE갤로그로 이동합니다. 08.23 6932 1
366 NVIDIA, AI 기술로 게임 캐릭터 대화 능력 대폭 향상 [21] GPTMAGAZINE갤로그로 이동합니다. 08.22 7388 10
365 GPT-4o, 개발자 위한 파인튜닝 서비스 공식 출시 [5] GPTMAGAZINE갤로그로 이동합니다. 08.21 7137 3
364 런웨이ML, '젠-3 알파 터보' 출시 [4] GPTMAGAZINE갤로그로 이동합니다. 08.19 1274 0
363 일론머스크의 xAI, 'Grok2' 출시 [5] GPTMAGAZINE갤로그로 이동합니다. 08.16 6282 0
362 구글, AI 음성 비서 ‘Gemini Live’ 공식 출시 [13] GPTMAGAZINE갤로그로 이동합니다. 08.14 8371 1
361 오픈AI, 'GPT-5' 공개 임박? [6] GPTMAGAZINE갤로그로 이동합니다. 08.13 3127 4
360 미드저니 위협하는 Flux.1, 얼마나 강력한가? [2] GPTMAGAZINE갤로그로 이동합니다. 08.12 2278 0
359 LLM은 가고, LAM이 온다...AI의 한계 [12] GPTMAGAZINE갤로그로 이동합니다. 08.09 4890 9
358 LG, 차세대 AI 모델 ‘EXAONE 3.0’ 오픈 소스로 공개 [7] GPTMAGAZINE갤로그로 이동합니다. 08.08 3480 0
357 일론머스크, 오픈AI 설립 초기 약속 배신당해 [1] GPTMAGAZINE갤로그로 이동합니다. 08.07 3629 2
356 ChatGPT 표절 방지 기술, 왜 비공개? [7] GPTMAGAZINE갤로그로 이동합니다. 08.05 3745 1
355 오픈AI, 'GPT-5' 모델 미국 정부에 첫 공개 [17] GPTMAGAZINE갤로그로 이동합니다. 08.05 3745 5
354 EU, 세계 최초 AI 규제법 발효 [36] GPTMAGAZINE갤로그로 이동합니다. 08.02 7768 17
353 엔비디아와 메타, 구글과 애플의 동맹 [4] GPTMAGAZINE갤로그로 이동합니다. 07.31 7295 3
352 오픈AI, 챗GPT 운영비 부담으로 인한 재정 위기 [51] GPTMAGAZINE갤로그로 이동합니다. 07.30 9963 9
351 Meta, 최신 AI 모델 'Rama 3.1' 출시 [8] GPTMAGAZINE갤로그로 이동합니다. 07.25 2914 1
350 애플, 2.5조 개 토큰으로 훈련된 7B 오픈소스 언어 모델 공개 GPTMAGAZINE갤로그로 이동합니다. 07.23 3169 2
349 네이버 거대AI 하이퍼클로바, 파라미터 숫자 공개 [11] GPTMAGAZINE갤로그로 이동합니다. 07.22 3867 1
348 오픈AI, 자사 최강 모델의 미니 버전 'GPT-4o mini' 출시 [13] GPTMAGAZINE갤로그로 이동합니다. 07.19 2915 1
347 엔비디아-미스트랄AI, 신규 AI 모델 '미스트랄 네모' 출시 GPTMAGAZINE갤로그로 이동합니다. 07.19 803 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2