디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[생성 AI 길라잡이] 더 사람 같아진 AI, 'GPT-4o'는 어떻게 다를까?

IT동아갤로그로 이동합니다. 2024.05.17 12:20:22
조회 1433 추천 1 댓글 2
※생성 인공지능이 세계를 뜨겁게 달굽니다. 사람만큼, 더러는 사람보다 더 그림을 잘 그리고 글을 잘 쓰는 생성 인공지능. 생성 인공지능을 설치하고 활용하는 방법과 최신 소식을 매주 전합니다.

[IT동아 권택경 기자] 오픈AI가 지난 13일(현지시각) 최신 대형언어모델(LLM)인 ‘GPT-4o’를 발표했습니다. 구글 ‘제미나이’, 앤트로픽 ‘클로드’, 메타 ‘라마’ 등 수많은 LLM이 등장해 경쟁이 치열해지는 와중에 오픈AI가 이번 업데이트로 다시 한 번 기술 격차를 벌리고, 생성 AI 업계 대표이자 선두라는 걸 입증하는 모양새입니다.

GPT-4o의 o는 옴니(Omni)를 뜻합니다. ‘모든’을 뜻하는 라틴어 접두사입니다. 이 말에 걸맞게 글뿐만 아니라 사진, 영상, 음성 등 여러 종류 데이터를 처리할 수 있는 능력인 ‘멀티 모달리티(Multimodality)를 극한까지 밀어붙였습니다. 하나의 AI 모델로 모든 게 가능한 ‘옴니 모델(Omni Model)’이라는 의미가 담긴 이름입니다. 그야말로 만능인 셈입니다.


지난 13일 열린 오픈AI의 GPT-4o의 발표 행사 / 출처=오픈AI



이번 발표의 하이라이트라고 할 수 있는 음성 모드가 옴니모델의 특장점을 잘 보여줍니다. 음성 모드는 사람과 대화하듯 챗GPT와 음성으로 대화하는 기능입니다. 이번 GPT-4o의 적용으로 반응 속도가 최소 232밀리초, 평균 320밀리초 수준으로 개선됐습니다. 2~5초 수준이었던 이전 버전들과는 비교하면 환골탈태 수준입니다.

오픈AI의 시연을 보면 마치 인간과 대화하는 듯한 자연스러움을 느낄 수 있는데, 실제로 250밀리초 수준으로 알려진 인간만큼 반응 속도가 빠르기 때문입니다. 이렇게 음성 모드가 빨라진 건 음성을 음성 그 자체로 인식하고 처리할 수 있게 됐기 때문입니다. 이전에는 음성을 텍스트로 바꿔 인식하고, 답변도 텍스트로 생성한 다음 이를 단순 음성 합성으로 읊는 방식이었다고 합니다.


실시간 영상 인식과 음성 기능으로 마치 AI와 영상통화를 하듯 대화할 수 있다 / 출처=오픈AI



처리 방식이 바뀌면서 반응 속도만 빨라진 게 아니라 음성에 담긴 톤이나 배경에 섞인 소리도 인식할 수 있게 됐습니다. 반대로 AI가 목소리에 감정을 담거나, 웃거나, 노래를 부르는 일도 가능해졌습니다. 오픈AI가 공개한 시연 영상을 보면 챗GPT가 사용자의 농담에 반응해 웃거나, 자장가를 부릅니다. 두 챗GPT가 서로 자연스럽게 대화를 이어가기도 합니다.

샘 올트먼 오픈AI CEO는 AI와 사랑에 빠지는 영화 ‘그녀(Her)’를 언급하기도 했는데, 영화에나 나올 법한 사람 같은 수준의 AI가 현실이 됐다는 평가도 그리 과장은 아닌 것처럼 느껴질 정도입니다. 이 모든 게 GPT-4o가 텍스트, 화상, 오디오 등 여러 형태의 데이터를 하나의 신경망으로 처리하는 옴니모델이기에 가능한 일입니다.


챗GPT에 태블릿 화면 속 수학 문제를 공유해 AI 과외 선생님처럼 활용할 수도 있다 / 출처=오픈AI



속도와 바용도 개선됐습니다. 특히 영어 외 언어에서 토큰(AI 데이터 처리의 최소 단위) 효율이 대폭 개선되면서 처리 능력이 올랐습니다. 한국어도 토큰 효율이 1.7배 개선됐습니다. 같은 양의 한국어 텍스트를 더 적은 토큰으로 처리할 수 있게 됐다는 의미입니다. 그만큼 GPT-4o를 활용하는 앱이나 서비스들의 속도가 빨라지고, 비용도 저렴해집니다. 오픈AI에서는 GPT-4o의 응용 프로그램 인터페이스(API)가 이전 버전인 GPT4-터보와 같은 성능을 더 빠르고 50% 저렴하게 제공한다고 설명합니다.


음성 모드를 사용 중인 오픈AI 개발자/ 출처=오픈AI



발표와 함께 오픈AI는 우선 GPT-4o의 텍스트와 이미지 기능을 먼저 출시했습니다. 월 20달러(약 2만 7100원)의 유료 서비스 ‘챗GPT 플러스’ 이용자에게만 제공됐던 GPT-4, GPT-4 터보 등과 달리 무료 이용자들도 현재 이용이 가능합니다. 다만 이용 가능한 메시지 수에 제한이 있습니다. 사용량과 수요에 따라 유동적으로 결정됩니다. 유료 이용자는 무료 이용자보다 5배 더 많은 메시지를 이용할 수 있습니다.

다만 아쉽게도 음성 모드는 아직 출시되지 않았습니다. 오픈AI는 앞으로 몇 주 내에 음성 모드 알파 버전을 일부 유료 이용자를 대상으로 순차 출시할 예정이라고 밝혔습니다.

글 / IT동아 권택경 (tk@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 국내 기업 열에 일곱은 "이제 AI 활용 못 하는 직원은 고용 안 해"▶ [생성 AI 길라잡이] GPT 활용 사례 및 교육 커뮤니티, '지피터스'▶ 효율 중요한 키워드 검색광고, 인공지능에 해답 있다



추천 비추천

1

고정닉 0

7

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 손해 보기 싫어서 피해 입으면 반드시 되갚아 줄 것 같은 스타는? 운영자 24/11/18 - -
4564 [생활 속 IT] 카카오톡 팀채팅, 입력코드로 한꺼번에 친구 추가한다 IT동아갤로그로 이동합니다. 08:29 20 0
4563 [투자를IT다] 2024년 11월 3주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 00:28 1797 0
4562 [창업도약+경북대] 허드슨에이아이 “팀버(Timbr)로 크리에이터 글로벌 진출 가교 역할할 것” IT동아갤로그로 이동합니다. 11.22 47 0
4561 [ENSL 2024] 누구나 쉽게 버튜버 만들어주는 동영상 서비스 ‘에이플라’ [7] IT동아갤로그로 이동합니다. 11.22 5072 2
4560 [리뷰] AI PC로 거듭난 비즈니스 노트북, 에이수스 엑스퍼트북 P5(P5405) [2] IT동아갤로그로 이동합니다. 11.22 738 0
4559 [부산창경 BEF 2024] 바다플랫폼 “블록체인 세이피안, 식품 생산·유통 안전 지킨다” IT동아갤로그로 이동합니다. 11.22 68 0
4558 [부산창경 BEF 2024] 엘리코퍼레이션 “인도 여성 인권 신장하는 콘택트렌즈 전문 브랜드” IT동아갤로그로 이동합니다. 11.22 55 0
4557 [창업도약+경북대] 에이스에듀 “버추얼 아이돌로 전 세계에 K-콘텐츠의 매력 알릴 것” IT동아갤로그로 이동합니다. 11.22 52 0
4556 전문가가 제시하는 스타트업 ESG 경영 전략…’2024 서울 스타트업 ESG 포럼’ [1] IT동아갤로그로 이동합니다. 11.21 1703 0
4555 수원대학교 'WoW 스타트업 브랜치 오픈이노베이션' 개최 IT동아갤로그로 이동합니다. 11.21 87 0
4554 [스타트업리뷰] 로닉 “인공지능 맞춤형 음식 도우미, AI 로봇셰프 큐브” IT동아갤로그로 이동합니다. 11.21 4805 0
4553 [IT기획자의 탄생] 3. IT기획자에게 필요한 상상력과 글로벌 전략 IT동아갤로그로 이동합니다. 11.21 95 0
4552 [IT’s 가성비] 삼성 크리스탈 UHD TV, 2024년형/85인치 모델에 눈길? IT동아갤로그로 이동합니다. 11.21 1890 0
4551 [스케일업] 클리카 [3] 피터 노빅과의 대담으로 살펴본 'AI 스타트업'의 방향성 IT동아갤로그로 이동합니다. 11.21 96 0
4550 [생활 속 IT] LG 가전 활용도 넓히는 'LG ThinQ' 연결 및 사용법 IT동아갤로그로 이동합니다. 11.21 87 0
4549 [생활 속 IT] 소프트웨어 활용 습관 바꿔줄 윈도 11 ‘가상 데스크톱’ [1] IT동아갤로그로 이동합니다. 11.20 185 0
4548 [부산창경 BEF 2024] 기술로 문제 풀이와 오답 노트 작성 효율 높인 ‘프라이머스’ IT동아갤로그로 이동합니다. 11.20 105 0
4547 IBM-연세대, 슈퍼컴 능가하는 127 큐비트 양자컴퓨터 국내 첫 도입 [3] IT동아갤로그로 이동합니다. 11.20 4882 4
4546 [주간스타트업동향] 휴머닉스, 위플로 CES 2025 혁신상 수상 外 IT동아갤로그로 이동합니다. 11.20 177 0
4545 [부산창경 BEF 2024] 만만한녀석들 “모듈형 집기로 친환경 MICE 산업 선도한다” IT동아갤로그로 이동합니다. 11.20 99 0
4544 [부산창경 BEF 2024] 나누기월드 “외국인 유학생, 장애인 문제 해결에 기여” [4] IT동아갤로그로 이동합니다. 11.20 343 0
4543 선박 제조업의 디지털 전환 이끄는 ‘버추얼 트윈’ 기술 IT동아갤로그로 이동합니다. 11.19 128 0
4542 에릭슨엘지 “네트워크도 API로 제공…개발자 참여 독려해야” IT동아갤로그로 이동합니다. 11.19 124 0
4541 [IT애정남] 노트북 SSD의 OEM 파티션, 삭제해도 되나요? IT동아갤로그로 이동합니다. 11.19 126 0
4540 [부산창경 BEF 2024] 그린에너지(주) “산업 현장 악취·유해물질 플라즈마로 해결” IT동아갤로그로 이동합니다. 11.19 125 0
4539 [자동차와 法] 행락철 교통사고 책임과 법적 대처 방안 IT동아갤로그로 이동합니다. 11.19 717 0
4538 아이작 컨셉츠 김태영 대표, "반도체·열유체 공학의 산학협력 교두보 만들겠다" IT동아갤로그로 이동합니다. 11.19 122 0
4537 [시승기] 돋보이는 디자인과 안전 사양 ‘KGM 액티언’ [1] IT동아갤로그로 이동합니다. 11.18 437 0
4536 +불필요한 PC 앱, 지우려면 이렇게! [이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 11.18 5179 5
4535 [스케일업] 반프 [3] 정예솔 전략총괄 “반프의 가치, 글로벌 시장에서도 매력적” IT동아갤로그로 이동합니다. 11.18 151 0
4534 [주간투자동향] 숨빗AI, 50억 원 규모 시드 투자 유치 外 IT동아갤로그로 이동합니다. 11.18 142 0
4533 [투자를IT다] 2024년 11월 2주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.16 238 0
4532 [스케일업] 보라웨어 [2] 전영복ㆍ이효주 “구성원 복지ㆍ기업 성장이 공존하는 곳” IT동아갤로그로 이동합니다. 11.15 231 0
4531 [생성 AI 길라잡이] 8종의 AI 모델 골라 쓰는 ‘SKT 에이닷’ 웹 버전 IT동아갤로그로 이동합니다. 11.15 221 0
4530 디지포레, “제조산업의 디지털 전환, ‘팩토리얼 프로’로 앞당길 것" IT동아갤로그로 이동합니다. 11.15 213 0
4529 [리뷰] 모니터링 헤드폰의 새로운 기준점 제시, 소니 MDR-M1 [5] IT동아갤로그로 이동합니다. 11.15 6295 1
4528 [2024 고려대] 스페이스점프 “자영업·소상공인 기자재의 모든 것, 소상공간” IT동아갤로그로 이동합니다. 11.15 200 0
4527 퀄컴, 온디바이스 AI·차량 전동화에 초점 맞춘 최신 솔루션 선보여 IT동아갤로그로 이동합니다. 11.15 220 0
4526 [창업도약+경북대] 비빔블 “비커스ㆍ버튜디오로 상상 이상의 가상경험 제공할 것” IT동아갤로그로 이동합니다. 11.15 179 0
4525 [AI와 미래] 기존 저작물은 AI 학습에 어디까지 활용할 수 있을까? IT동아갤로그로 이동합니다. 11.15 1401 0
4524 [월간자동차] 24년 10월, 신차 등록 두 달 연속 증가…싼타페 판매 1위 IT동아갤로그로 이동합니다. 11.15 176 0
4523 [리뷰] 10G 업링크 지원 네트워크 스위치, 넷기어 GS108MX IT동아갤로그로 이동합니다. 11.14 199 0
4522 데이터 주권 강조하는 소버린 AI, 진정한 의미는? [1] IT동아갤로그로 이동합니다. 11.14 763 0
4521 [스케일업] 스쿨버스 [3] 통학버스 전문 플랫폼 개발자 인터뷰 IT동아갤로그로 이동합니다. 11.14 202 0
4520 [UDC 2024] 다양한 산업을 변화시키는 블록체인의 힘 IT동아갤로그로 이동합니다. 11.14 194 0
4519 로봇과 문화예술의 만남, 브이디컴퍼니x장 줄리앙의 종이세상 IT동아갤로그로 이동합니다. 11.14 353 0
4518 [IT애정남] 갤럭시워치를 아이폰과 연결해서 쓸 수 있나요? IT동아갤로그로 이동합니다. 11.13 4686 0
4517 [신차공개] BMW ‘뉴 4시리즈 그란 쿠페’·로터스 ‘에메야’ 공식 출시 [3] IT동아갤로그로 이동합니다. 11.13 4819 1
4516 [스타트업-ing] 오아시스 스튜디오 “OVP·오닉스·디보틀로 콘텐츠 에코시스템 구축” IT동아갤로그로 이동합니다. 11.13 208 0
4515 [생활 속 IT] 취업 서류, 정부24에서 내려받는 법 IT동아갤로그로 이동합니다. 11.12 240 0
뉴스 BTS 지민, '마마 어워즈' 첫날 대상…로제 '아파트' 무대 첫공개(종합) 디시트렌드 14:00
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2