[IT동아 권택경 기자] 생성 AI가 채팅창을 넘어 일상 속으로 침투하는 시대가 본격적으로 열릴 전망이다. 오픈AI와 구글이 실시간으로 보고, 듣고, 대화할 수 있는 AI 비서를 잇따라 발표하면서다.
구글은 지난 14일(현지시각) 연례 개발자 회의 I/O 행사 첫날 ‘프로젝트 아스트라’를 발표했다. 프로젝트 아스트라는 구글 대형언어모델(LLM) 제미나이(Gemini)를 기반으로 일상생활에 도움이 되는 범용(Universal) AI 비서를 만드는 프로젝트다.
구글의 생성 AI 제미나이의 실시간 대화 기능인
이날 행사에서는 프로젝트 아스트라의 일환으로 ‘제미나이 라이브(Gemini Live)’ 기능의 프로토타입도 선보였다. 제미나이 라이브는 AI와 실시간으로 대화할 수 있는 기능이다. 카메라를 켜서 AI에게 주변 환경을 보여주고 상호작용할 수도 있다.
구글이 공개한 시연 영상에서 제미나이는 창밖 풍경을 보고 해당 지역이 어디인지 맞추거나, 이용자가 올려놓고 위치를 깜빡한 안경을 빠르게 찾아낸다. 모니터나 칠판에 써진 개발 코드나 도식 내용을 해석하고, 개선안을 제시하기도 한다.
시연에서는 스마트폰이 아닌 스마트 글래스 형태 기기로 AI 비서를 활용하는 모습도 담겼다. 이 때문에 구글의 실패작으로 꼽히는 ‘구글 글래스’가 AI를 등에 업고 다시 등장할 것이라는 관측도 나온다.
설령 구글이 직접 스마트 글래스를 만들지 않더라도, 구글이 그리는 AI 생태계에 스마트 글래스가 포함된 건 분명해 보인다. 데미스 허사비스 구글 딥마인드 CEO는 “휴대폰 혹은 글래스처럼 새롭고 흥미로운 폼팩터를 통해 전문가급 비서를 곁에 둘 수 있는 미래를 쉽게 상상할 수 있다”고 언급했다.
제미나이 라이브는 올 여름 출시된다. 시연에서 공개된 카메라 기능은 연말 출시 예정이다 / 출처=구글
구글은 제미나이 라이브를 올여름 제미나이 앱에 업데이트할 예정이라고 밝혔다. 카메라 기능은 올해 말 출시된다.
이날 구글 발표 전날 오픈AI도 최신 LLM GPT-4o를 공개하고, AI와 실시간 대화가 가능한 챗GPT 음성 모드 최신 버전을 공개한 바 있다. ‘제미나이 라이브’와 거의 같은 기능을 한발 앞서 공개하면서 구글 발표의 김을 뺀 셈이다.
이번 GPT-4o와 프로젝트 아스트라 발표는 생성 AI가 거의 사람처럼 보고 듣고 말하는 게 가능한 수준에 도달했다는 걸 보여준다. 이전에도 생성형 AI를 음성 비서와 접목하려는 시도는 있었지만, 일문일답 형태의 기존 음성 비서에서 크게 벗어나지 않았다. 하지만 여러 유형의 데이터를 처리하는 멀티모달 능력을 갖추고, 반응 속도도 빨라지면서 상황이 달라졌다.
오픈AI의 GPT-4o 기반 챗GPT 음성 모드 / 출처=오픈AI
시리, 알렉사, 아마존, 빅스비 등 기존의 음성 비서들도 생성 AI에 힘 입어 부활할 전망이다. 아마존은 이미 지난해 9월 LLM을 적용한 새로운 알렉사를 발표한 바 있으며, 삼성전자도 빅스비에 생성 AI를 적용하겠다고 밝힌 바 있다.
애플 또한 ‘대화가 가능한’ 형태의 새로운 시리를 포함해 아이폰16에 탑재될 생성 AI 기능을 오는 6월 열리는 세계 개발자 컨퍼런스(WWDC)에서 공개할 것으로 점쳐진다. 블룸버그에 따르면 애플은 이러한 생성 AI 기반 기능을 구현하기 위해 오픈AI와 협력 중이다.
애플도 자체 생성 AI 기능을 개발하고 있지만, 완성도가 아직 자체 제품을 출시할 만큼 발전하지는 않은 것으로 전해졌다. 하지만 AI 기능에 대한 소비자와 시장의 요구와 기대가 커진 만큼 과도기의 공백을 메꾸기 위해 오픈AI와의 협력을 택했다고 블룸버그는 전했다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.