디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

인포플라 “대답만 하던 기존 AI의 한계, VLM 기반 자동화로 극복”

IT동아갤로그로 이동합니다. 2024.05.18 15:07:37
조회 7243 추천 3 댓글 4
[IT동아 김영우 기자] 클라우드 시장의 대표주자인 아마존웹서비스(이하 AWS)가 5월 16일과 17일, 양일간 서울 코엑스에서 ‘AWS 서밋 서울 2024(AWS Summit Seoul 2024, 이하 AWS 서밋)’을 개최했다. 국내 클라우드 생태계의 현황을 조명하고 AWS의 비전을 전하는 이 행사는 2015년부터 시작해 올해로 10년 차를 맞이했다.

올해 AWS 서밋은 60여개의 파트너사가 부스를 꾸리고 2만 9000여명의 인원이 참가해 국내 클라우드 관련 행사 중 최대 규모를 뽐냈다. 특히 올해 행사는 최근 시장의 최대 화두로 떠오른 생성형 AI 관련 혁신을 이끄는 기술과 제품, 그리고 서비스가 다수 소개되어 큰 관심을 끌었다.


AWS 서밋 행사장에서 발표를 진행한 최인묵 인포플라 대표 / 출처=IT동아



AWS 클라우드 생태계에서 AI 관련 제품과 서비스를 개발하고 있는 고객사들의 사례 발표도 눈에 띄었다. 그 중에는 대기업 외에 스타트업 및 중소기업의 사례도 주목을 받았다. 17일 EXPO 세션에서 ‘생성형 AI 기반 IT 서비스 자동화 기술 및 클라우드 서비스 개발 여정’을 주제로 발표한 ‘㈜인포플라(대표 최인묵)’도 그 중의 하나다.

이날 발표를 진행한 최인묵 인포플라 대표는 반복적인 업무를 자동화하는 RPA(Robotic Process Automation) 솔루션에 대한 가능성, 그리고 한계를 명확히 하는 것으로 운을 띄웠다. 특히 기존의 스크립트 기반 RPA를 비전공자가 원활하게 이용하기 위해서는 전문가의 도움이 필요한 점을 언급했다. 또한, 웹이나 앱 내에서 이루어지는 반복 작업을 RPA로 자동화한 경우, 갑작스럽게 팝업 창의 등장이나 화면 장애 등의 돌발변수에 제대로 대응하지 못해 RPA가 정지하는 등의 문제가 있다고 지적했다.


VLM을 통해 기존 RPA의 한계를 극복할 수 있다 / 출처=인포플라



인포플라는 이러한 기존 RPA의 한계를 극복하는 방안으로 ‘VLM(Vision Language Model)’을 제안했다. 이는 거대 언어 모델, LLM(Large language model)에 이미지 처리능력을 더한 것이다. 스크립트가 아닌 화면 인식만으로 모든 문제를 해결할 수 있으며, 원격 환경도 지원이 가능한 점 등, 기존 RPA의 한계를 다수 극복할 수 있다.

이와 더불어 돌발변수에도 화면을 인식해 마치 사람처럼 능동적인 대응이 가능하며, 무엇보다 학습이 거듭될수록 능력이 향상되는 것이 가장 큰 장점이다. 이를테면 웹페이지에 텍스트를 반복 입력하는 업무를 VLM 기반으로 자동화한 경우, 작업 중 팝업창이 뜨는 돌발변수가 발생하더라도 화면 및 상황을 분석해 팝업창을 닫은 후 텍스트 박스에 텍스트를 입력하는 업무를 이어갈 수 있다. 물론 기존 RPA라도 이러한 상황에 대응하는 스크립트를 만들어 대응하는 것은 가능하겠지만, 이렇게 스크립트가 늘어날수록 오류 가능성 역시 커진다.

이와 관련, 이날 인포플라는 자사에서 개발한 ‘VLAgent(VLM + Agent)’를 제안했다. 이는 VLM을 통해 화면을 인지하고 명령을 수행할 수 있는 에이전트 모델을 의미한다. 스크립트의 수동 제작이 불필요하며, AI가 화면을 이해하고 작업 플랜 및 액션 플랜의 생성 및 실행을 자동으로 수행할 수 있는 것이 특징이다.

이는 LLM과 AI 에이전트, 그리고 업무 자동화 등의 최근의 트렌드를 한데 모은 것이다. 또한, 단순히 사용자의 질문에 답변만 하는 기존 AI 서비스와 달리, 실행을 통한 문제 해결까지 이어진다는 것도 차별점이다. 또한 기존의 모델은 고해상도 영상을 인식하고 대응하는 과정에서 지나치게 높은 처리 능력을 요구하기도 했고, 한글을 지원하지 않아 국내 사용자들이 이용하기에 불편을 주기도 했다.


‘VLAgent’의 구성 / 출처=인포플라



이에 인포플라는 이러한 문제를 해결할 수 있는 4K 고해상도 및 한글 지원, 그리고 일반 PC에서도 구동 가능한 가벼움, 그리고 데이터 학습 기능 등을 품은 자체 솔루션을 개발하게 되었다고 강조했다. VLAgent는 인포플라의 실시간 객체인식 RPA인 ‘알파카(RPACA)’를 포함해 AWS에 업로드된 상태이며, 인포플라의 AI 기반 통합 매니지먼트 시스템인 ‘아이톰스(ITOMS)’를 통해 활용할 수 있다.

이날 발표 중 인포플라는 시연 영상을 보여주기도 했다. 윈도 운영체제 기반의 PC에서 VLAgent에 “건대역에서 강남역까지 경로를 알려줘”라는 내용의 명령을 입력하자, AI가 마우스와 키보드를 제어해 바탕화면의 ‘크롬’ 웹 브라우저를 실행하고 ‘구글 지도’ 서비스를 선택한 후, 출발지(건대역)와 도착지(강남역)을 입력해 경로를 검색하는 과정까지 자동 완료했다.


VLAgent의 시연 영상을 소개하는 최인묵 인포플라 대표 / 출처=IT동아



한편, 최인묵 인포플라 대표는 이날 발표를 마무리하며 “우리의 솔루션은 서비스 및 업무 자동화, 시각 장애인 지원, 엔터테인먼트 사업, 교육 및 제조, 의료, 고객서비스 등 다양한 분야에서 활용이 가능하다”며, “사실상 국내에선 최초의 시도이며, 해외에서도 유사한 사례를 찾기 힘들다”고 강조하기도 했다.

글 / IT동아 김영우(pengi@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ [생성 AI 길라잡이] 더 사람 같아진 AI, 'GPT-4o'는 어떻게 다를까?▶ 10년 차 맞은 AWS 서밋 서울··· '국내 최대 IT·클라우드 행사로 자리매김'▶ 국내 기업 열에 일곱은 "이제 AI 활용 못 하는 직원은 고용 안 해"



추천 비추천

3

고정닉 0

2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 손해 보기 싫어서 피해 입으면 반드시 되갚아 줄 것 같은 스타는? 운영자 24/11/18 - -
4564 [생활 속 IT] 카카오톡 팀채팅, 입력코드로 한꺼번에 친구 추가한다 [1] IT동아갤로그로 이동합니다. 11.23 40 0
4563 [투자를IT다] 2024년 11월 3주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.23 4373 0
4562 [창업도약+경북대] 허드슨에이아이 “팀버(Timbr)로 크리에이터 글로벌 진출 가교 역할할 것” IT동아갤로그로 이동합니다. 11.22 61 0
4561 [ENSL 2024] 누구나 쉽게 버튜버 만들어주는 동영상 서비스 ‘에이플라’ [7] IT동아갤로그로 이동합니다. 11.22 5105 2
4560 [리뷰] AI PC로 거듭난 비즈니스 노트북, 에이수스 엑스퍼트북 P5(P5405) [2] IT동아갤로그로 이동합니다. 11.22 764 0
4559 [부산창경 BEF 2024] 바다플랫폼 “블록체인 세이피안, 식품 생산·유통 안전 지킨다” IT동아갤로그로 이동합니다. 11.22 81 0
4558 [부산창경 BEF 2024] 엘리코퍼레이션 “인도 여성 인권 신장하는 콘택트렌즈 전문 브랜드” IT동아갤로그로 이동합니다. 11.22 67 0
4557 [창업도약+경북대] 에이스에듀 “버추얼 아이돌로 전 세계에 K-콘텐츠의 매력 알릴 것” IT동아갤로그로 이동합니다. 11.22 64 0
4556 전문가가 제시하는 스타트업 ESG 경영 전략…’2024 서울 스타트업 ESG 포럼’ [1] IT동아갤로그로 이동합니다. 11.21 1730 0
4555 수원대학교 'WoW 스타트업 브랜치 오픈이노베이션' 개최 IT동아갤로그로 이동합니다. 11.21 98 0
4554 [스타트업리뷰] 로닉 “인공지능 맞춤형 음식 도우미, AI 로봇셰프 큐브” IT동아갤로그로 이동합니다. 11.21 4821 0
4553 [IT기획자의 탄생] 3. IT기획자에게 필요한 상상력과 글로벌 전략 IT동아갤로그로 이동합니다. 11.21 107 0
4552 [IT’s 가성비] 삼성 크리스탈 UHD TV, 2024년형/85인치 모델에 눈길? IT동아갤로그로 이동합니다. 11.21 1908 0
4551 [스케일업] 클리카 [3] 피터 노빅과의 대담으로 살펴본 'AI 스타트업'의 방향성 IT동아갤로그로 이동합니다. 11.21 107 0
4550 [생활 속 IT] LG 가전 활용도 넓히는 'LG ThinQ' 연결 및 사용법 IT동아갤로그로 이동합니다. 11.21 97 0
4549 [생활 속 IT] 소프트웨어 활용 습관 바꿔줄 윈도 11 ‘가상 데스크톱’ [1] IT동아갤로그로 이동합니다. 11.20 205 0
4548 [부산창경 BEF 2024] 기술로 문제 풀이와 오답 노트 작성 효율 높인 ‘프라이머스’ IT동아갤로그로 이동합니다. 11.20 115 0
4547 IBM-연세대, 슈퍼컴 능가하는 127 큐비트 양자컴퓨터 국내 첫 도입 [3] IT동아갤로그로 이동합니다. 11.20 4904 4
4546 [주간스타트업동향] 휴머닉스, 위플로 CES 2025 혁신상 수상 外 IT동아갤로그로 이동합니다. 11.20 187 0
4545 [부산창경 BEF 2024] 만만한녀석들 “모듈형 집기로 친환경 MICE 산업 선도한다” IT동아갤로그로 이동합니다. 11.20 108 0
4544 [부산창경 BEF 2024] 나누기월드 “외국인 유학생, 장애인 문제 해결에 기여” [4] IT동아갤로그로 이동합니다. 11.20 359 0
4543 선박 제조업의 디지털 전환 이끄는 ‘버추얼 트윈’ 기술 IT동아갤로그로 이동합니다. 11.19 136 0
4542 에릭슨엘지 “네트워크도 API로 제공…개발자 참여 독려해야” IT동아갤로그로 이동합니다. 11.19 132 0
4541 [IT애정남] 노트북 SSD의 OEM 파티션, 삭제해도 되나요? IT동아갤로그로 이동합니다. 11.19 131 0
4540 [부산창경 BEF 2024] 그린에너지(주) “산업 현장 악취·유해물질 플라즈마로 해결” IT동아갤로그로 이동합니다. 11.19 130 0
4539 [자동차와 法] 행락철 교통사고 책임과 법적 대처 방안 IT동아갤로그로 이동합니다. 11.19 722 0
4538 아이작 컨셉츠 김태영 대표, "반도체·열유체 공학의 산학협력 교두보 만들겠다" IT동아갤로그로 이동합니다. 11.19 127 0
4537 [시승기] 돋보이는 디자인과 안전 사양 ‘KGM 액티언’ [1] IT동아갤로그로 이동합니다. 11.18 445 0
4536 +불필요한 PC 앱, 지우려면 이렇게! [이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 11.18 5188 5
4535 [스케일업] 반프 [3] 정예솔 전략총괄 “반프의 가치, 글로벌 시장에서도 매력적” IT동아갤로그로 이동합니다. 11.18 155 0
4534 [주간투자동향] 숨빗AI, 50억 원 규모 시드 투자 유치 外 IT동아갤로그로 이동합니다. 11.18 146 0
4533 [투자를IT다] 2024년 11월 2주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.16 242 0
4532 [스케일업] 보라웨어 [2] 전영복ㆍ이효주 “구성원 복지ㆍ기업 성장이 공존하는 곳” IT동아갤로그로 이동합니다. 11.15 235 0
4531 [생성 AI 길라잡이] 8종의 AI 모델 골라 쓰는 ‘SKT 에이닷’ 웹 버전 IT동아갤로그로 이동합니다. 11.15 225 0
4530 디지포레, “제조산업의 디지털 전환, ‘팩토리얼 프로’로 앞당길 것" IT동아갤로그로 이동합니다. 11.15 217 0
4529 [리뷰] 모니터링 헤드폰의 새로운 기준점 제시, 소니 MDR-M1 [5] IT동아갤로그로 이동합니다. 11.15 6304 1
4528 [2024 고려대] 스페이스점프 “자영업·소상공인 기자재의 모든 것, 소상공간” IT동아갤로그로 이동합니다. 11.15 204 0
4527 퀄컴, 온디바이스 AI·차량 전동화에 초점 맞춘 최신 솔루션 선보여 IT동아갤로그로 이동합니다. 11.15 224 0
4526 [창업도약+경북대] 비빔블 “비커스ㆍ버튜디오로 상상 이상의 가상경험 제공할 것” IT동아갤로그로 이동합니다. 11.15 183 0
4525 [AI와 미래] 기존 저작물은 AI 학습에 어디까지 활용할 수 있을까? IT동아갤로그로 이동합니다. 11.15 1405 0
4524 [월간자동차] 24년 10월, 신차 등록 두 달 연속 증가…싼타페 판매 1위 IT동아갤로그로 이동합니다. 11.15 180 0
4523 [리뷰] 10G 업링크 지원 네트워크 스위치, 넷기어 GS108MX IT동아갤로그로 이동합니다. 11.14 203 0
4522 데이터 주권 강조하는 소버린 AI, 진정한 의미는? [1] IT동아갤로그로 이동합니다. 11.14 771 0
4521 [스케일업] 스쿨버스 [3] 통학버스 전문 플랫폼 개발자 인터뷰 IT동아갤로그로 이동합니다. 11.14 206 0
4520 [UDC 2024] 다양한 산업을 변화시키는 블록체인의 힘 IT동아갤로그로 이동합니다. 11.14 198 0
4519 로봇과 문화예술의 만남, 브이디컴퍼니x장 줄리앙의 종이세상 IT동아갤로그로 이동합니다. 11.14 357 0
4518 [IT애정남] 갤럭시워치를 아이폰과 연결해서 쓸 수 있나요? IT동아갤로그로 이동합니다. 11.13 4690 0
4517 [신차공개] BMW ‘뉴 4시리즈 그란 쿠페’·로터스 ‘에메야’ 공식 출시 [3] IT동아갤로그로 이동합니다. 11.13 4827 1
4516 [스타트업-ing] 오아시스 스튜디오 “OVP·오닉스·디보틀로 콘텐츠 에코시스템 구축” IT동아갤로그로 이동합니다. 11.13 212 0
4515 [생활 속 IT] 취업 서류, 정부24에서 내려받는 법 IT동아갤로그로 이동합니다. 11.12 244 0
뉴스 다듀 최자, “셋이 시작하는 새 삶” 득녀…힙합계 축하 세례 [공식] 디시트렌드 11.23
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2