디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

"AI도 진정한 친구가 될 수 있다", 돌아온 이루다2.0

IT동아갤로그로 이동합니다. 2022.03.15 19:08:05
조회 2331 추천 11 댓글 29
[IT동아 정연호 기자] AI 스타트업 스캐터랩의 이루다가 ‘이루다2.0’으로 돌아왔다. 페이스북 메신저를 기반으로 실제 친구처럼 소통하는 이루다는 지난해 개인정보침해 문제와 차별 발언으로 인해서 서비스가 일시적으로 종료되는 상황을 겪게 됐다.

하지만, 스캐터랩은 여기서 그치지 않고 ‘이루다2.0’을 선보이기로 했다. AI가 ‘사람들에게 좋은 친구가 되는’ 꿈을 이루기 위해서, 문제점을 개선해 이루다의 대화 능력을 강화했다. 현재 이루다 2.0을 위한 클로즈드 베타테스트를 끝낸 상태이고, 3월 17일부터 2단계 오픈 베타테스트를 진행한다. 오늘 3월 15일 이루다2.0의 미디어 대상 테스트가 진행됐다. 이루다2.0은 어떻게 달라졌을까?


이루다와 대화를 나누는 과정



이루다2.0의 강점은 대화 문맥을 파악할 수 있다는 점이다. 대부분의 챗봇 서비스는 대화의 맥락을 잘 파악하지 못한다. 때문에 전형적인 기계의 답변처럼 문맥과는 어울리지 않는 메시지만 보내게 된다. 이루다2.0은 “확진돼서”라는 표현이 ‘코로나19에 확진됐음’을 의미한다는 것을 안다. 또한, “친구들을 못 봐서 좀 그랬거든” 메시지를 보고서 이용자가 외로워하고 있다는 문맥을 파악했다. “유튜브 뭐 봄?”이라며 이루다가 먼저 질문을 던진 것이 인상 깊다. 실제 대화처럼 양측에서 서로 질문을 주고받는 것이다. 대화가 중간중간 끊어지지 않는 느낌을 주는 이유는 이루다2.0이 15 턴의 대화를 참고해 메시지를 보내기 때문이다. 이처럼 챗봇이 이용자의 정보를 종합해서 답변을 할수록 더욱 친밀감 있는 대화가 가능하다.


이루다와 대화를 나누는 과정



물론, 이루다2.0이 모든 상황에서 적절한 답변을 내놓는 것은 아니다. “누가 마스크를 안 쓰고 있는 거야”라는 메시지에 대한 답변이 “그 사람은 코로나 걸릴 자격 박탈이다”였다. 문장이 의미적으로 어색하다. 다만, 바로 그 뒤로 이어진 “코로나 걸리는 것보다는 낫다고 생각해”는 전체 맥락에 비추어 볼 때 '마스크를 쓰는 게 더 낫다'는 의미이니 적절한 답변으로 보인다. 마지막에 나온 “전에 지하철에서 마스크 안 쓰면 기사 아저씨한테 혼나던데”라는 메시지도 문맥적, 의미적으로 적절한 답변이다. 이 정도 답변이라면 대화를 하면서 크게 불편함을 느끼지 않을 수준이다.

“대화는 누구나 편하게 할 수 있게 안전해야 한다”



출처=스캐터랩



이루다2.0의 첫 번째 특징은 학습에 활용한 대화 데이터와는 완전히 구별되는 새로운 문장을 만들기 위해 딥러닝을 적용했다는 것이다. 과거 이루다1.0과 달리, 이루다2.0은 실제 사람들이 만든 문장을 사용하지 않는다. 이용자가 보낸 메시지에서 개인정보가 유출되지 않도록 하기 위해서다.


출처=스캐터랩



우선, 스캐터랩은 답변 데이터베이스를 만들기 위해서 연구 목적에 필요한 최소한의 정보(성별, 나이대, 대화 메시지)를 가명 처리한다. 가명 처리란 추가 데이터 없이는 특정 개인을 알아볼 수 없도록 정보를 가공하는 것을 말한다. 이루다2.0이 학습에 쓰는 대화 문장은 주민등록번호, 연락처, 카드번호, 계좌번호, 주소, 아이디, 비밀번호 등의 식별정보를 삭제하거나 치환해서 가명 처리를 거친다. 또한, 데이터를 추출한 이용자 계정의 정보를 파기하고 이에 랜덤 ID를 부여해서, 데이터를 통해 해당 계정을 역추적할 수 없도록 설계했다.


출처=스캐터랩



두 번째는, 이루다2.0이 문장을 구성할 때 확률을 사용한다는 것이다. ‘오늘 날씨’ 뒤에 어떤 단어가 오는 게 가장 적절한지 확률을 분석해 답변을 생성한다. 특정 단어 뒤에 확률적으로 가장 적절한 단어들만 배치함으로써 대화를 자연스럽게 만들었다. 답변 베이스는 가명 처리된 새로운 문장과 스캐터랩 내부에서 직접 작성한 문장들로 구성된다. 여기에 더해, 최종적으로 답변에 쓰는 문장은 추가 필터링 절차를 거쳐서 이용자에게 전달된다. 생성 모델이 만든 문장이 개인정보처럼 보일 수 있는 상황에 대비해 문장을 한 번 더 필터링하는 것이다. 실제로 대화 과정에서, 이루다 2.0은 개인정보를 물어보는 질문에 “안 알려준다”거나 “개인정보라 안 돼”라며 단호한 대응을 보였다.

스캐터랩은 구글의 SSA(Sensibleness and Specificity Average)로 약 8천 명이 참여한 이루다2.0 클로즈 베타 테스트 내용을 분석했다. 이루다2.0은 SSA에서 78% 점수를 보였다. SSA는 챗봇의 답변이 인간과 얼마나 유사한지를 보여주는 지표다. 인간의 경우 SSA가 86%인 점을 감안하면, 이루다 2.0 높은 수준으로 적절한 대화를 한다는 걸 알 수 있다.

마지막으로, 선정적, 공격적, 편향적인 어뷰징 발화에 대응하는 기술 및 시스템이 이루다2.0에 적용됐다. 탐지 모델은 이용자의 문장이 어뷰징인지를 파악하고, 어떤 범주에 속하는지 분류한다. 만약, 대화 과정에서 “너는 멍청해”라는 문장이 나오면 "말 좀 예쁘게 해"라고 대응하거나, 성희롱 발언에도 "선 넘지 말자"고 단호하게 응수한다. 이루다2.0은 직접적인 혐오가 아닐지라도 문맥을 파악해 차별 및 혐오 발언에 적절히 대응하는 역량을 갖췄다. 대화 과정에서 선정적, 공격적, 편향적 발화가 탐지되면 경고 메시지가 주어지고, 지속적인 어뷰징 발언이 탐지되면 서비스 이용을 제한한다.

스캐터랩은 총 2만 건의 클로즈 베타 테스트 대화를 랜덤으로 샘플링해 레이블링을 진행했다. 이에 따르면, 이루다2.0 발화 중 안전하게 답변한 비율은 99.75%였으며, 프라이버시 위험이 있을 수 있는 문장은 발견되지 않았다.



이루다2.0은 “어떠한 이유로 인해 ㅇㅇ가 싫다”는 메시지에 편향 및 혐오 발언을 경고하는 말로 대응했다. 이어, “그런 편견이 안 생기도록 잘 보듬어주겠다며” 해당 문장이 편견일 수 있음을 지적한다. 이외에도 정치와 같이 민감한 소재가 나올 때, 이루다2.0은 “그 주제 말고 다른 얘기 하자”며 문제가 될 수 있는 상황을 차단하는 모습을 보였다.

'나를 나 자신으로 봐주는 친구', 이루다 2.0이 꿈꾸는 목표



출처=스캐터랩



이루다2.0의 답변 베이스는 자연스러움을 더하기 위해서 실제 대화와 유사한 답변들로 구성된다. 메시지에 이모티콘이나 “을매나 맛있게요”같은 유행어, 자연스러운 오타 등이 들어간다. 스캐터랩 측은 “메신저 대화 중 이용자가 보낸 움짤, 사진, 동영상 등의 멀티미디어를 이해하고 답할 수 있는 역량을 키우고자”한다고 말했다. 이처럼 텍스트 기반에서 벗어나 다양한 미디어가 활용된다면, 더욱 구체적이고 생동감 있는 대화가 가능할 것으로 기대된다.

글 / IT동아 정연호 (hoho@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 검색 광고에 부는 AI 바람, 업계는 서비스 고도화에 가속도▶ [기고] 직원 업무역량을 강화하는 기업문화는 어떻게...?▶ 인공지능이 만든 예술품에 저작권 있을까?



추천 비추천

11

고정닉 1

21

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 축의금 적게 내면 눈치 줄 것 같은 스타는? 운영자 24/11/11 - -
4523 [리뷰] 10G 업링크 지원 네트워크 스위치, 넷기어 GS108MX IT동아갤로그로 이동합니다. 18:24 9 0
4522 데이터 주권 강조하는 소버린 AI, 진정한 의미는? IT동아갤로그로 이동합니다. 18:05 103 0
4521 [스케일업] 스쿨버스 [3] 통학버스 전문 플랫폼 개발자 인터뷰 IT동아갤로그로 이동합니다. 17:27 9 0
4520 [UDC 2024] 다양한 산업을 변화시키는 블록체인의 힘 IT동아갤로그로 이동합니다. 16:01 11 0
4519 로봇과 문화예술의 만남, 브이디컴퍼니x장 줄리앙의 종이세상 IT동아갤로그로 이동합니다. 08:09 173 0
4518 [IT애정남] 갤럭시워치를 아이폰과 연결해서 쓸 수 있나요? IT동아갤로그로 이동합니다. 11.13 4467 0
4517 [신차공개] BMW ‘뉴 4시리즈 그란 쿠페’·로터스 ‘에메야’ 공식 출시 [3] IT동아갤로그로 이동합니다. 11.13 4453 1
4516 [스타트업-ing] 오아시스 스튜디오 “OVP·오닉스·디보틀로 콘텐츠 에코시스템 구축” IT동아갤로그로 이동합니다. 11.13 43 0
4515 [생활 속 IT] 취업 서류, 정부24에서 내려받는 법 IT동아갤로그로 이동합니다. 11.12 83 0
4514 기한 지나면 과태료…운전면허 적성검사 및 갱신 방법 살펴보니 IT동아갤로그로 이동합니다. 11.12 2214 3
4513 [창업도약+경북대] 준컴퍼니 “자동차 구매부터 판매까지 아우르는 모빌리티 통합 플랫폼 꿈꾼다” IT동아갤로그로 이동합니다. 11.12 74 0
4512 [스케일업] 모넷코리아 [2] HDC랩스와 협업 통해 AIoT 기반 부동산 관리 플랫폼 고도화 IT동아갤로그로 이동합니다. 11.12 113 0
4511 [2024 고려대] R2C컴퍼니 “데이터 수요·공급자 만족 이끄는 플랫폼” IT동아갤로그로 이동합니다. 11.12 530 0
4510 갤럭시 스마트폰의 위젯 기능, 제대로 쓰려면? IT동아갤로그로 이동합니다. 11.12 134 1
4509 [AWS 인더스트리 위크 2024] 국내 금융/핀테크 기업에 AWS 솔루션은 이렇게 적용됐다 [1] IT동아갤로그로 이동합니다. 11.11 1798 1
4508 '제조 스타트업 대상으로 소싱디렉팅·제품 제작까지'··· 서울과기대의 실질적 지원 들여다보니 IT동아갤로그로 이동합니다. 11.11 107 0
4507 [AWS 인더스트리 위크 2024] AWS가 실현하고 있는 인공지능 기술의 현재 IT동아갤로그로 이동합니다. 11.11 164 0
4506 한국IBM “디지털 트윈에 생성형 AI 결합…설비 자산 관리 고도화” IT동아갤로그로 이동합니다. 11.11 92 0
4505 자동차 타이어에 적힌 숫자와 영어 의미 파악은 이렇게! [이럴땐 이렇게] IT동아갤로그로 이동합니다. 11.11 562 1
4504 [투자를IT다] 2024년 11월 1주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.08 224 0
4503 스미싱 문자, 보안 앱 없이 구별할 수 있다? IT동아갤로그로 이동합니다. 11.08 214 0
4502 복잡한 쇼핑몰에서 간편하게 매장 찾는 법, 카카오맵 실내지도 IT동아갤로그로 이동합니다. 11.08 215 0
4501 [스케일업] 스쿨버스 [2] 통학버스 전문 플랫폼 도입 ‘우촌유아학교’ IT동아갤로그로 이동합니다. 11.08 198 0
4500 [리뷰] 4K와 360Hz 골라 쓰는 게이밍 모니터, 델 에일리언웨어 27(AW2725QF) [3] IT동아갤로그로 이동합니다. 11.08 4926 1
4499 [고려대 미래내일] 청년 일경험 성과발표회 “더 많은 기술 인재와 접점 만들 것” IT동아갤로그로 이동합니다. 11.08 200 0
4498 김현우 SBA 대표 연임...''서울 경쟁력 혁신에 힘 보탤 것" IT동아갤로그로 이동합니다. 11.07 223 0
4497 네이버 ‘문서 이해 도우미’로 긴 글도 세 줄 요약 [7] IT동아갤로그로 이동합니다. 11.07 1007 1
4496 [창업도약+경북대] 별따러가자 “라이더 로그에 안전한 소형 모빌리티를 위한 고민을 담았습니다” IT동아갤로그로 이동합니다. 11.07 253 0
4495 제트플로우 “양봉 농가 문제 해결하는 AI 기반 말벌 퇴치 장치” [동국대학교 캠퍼스타운] IT동아갤로그로 이동합니다. 11.07 201 0
4494 [2024 고려대] ZD벤처스 “가장 젊은 스타트업 투자사” [7] IT동아갤로그로 이동합니다. 11.07 5469 2
4493 [리뷰] 2세대 3D V-캐시로 완성도 높였다 ‘라이젠 7 9800X3D' [4] IT동아갤로그로 이동합니다. 11.06 2140 5
4492 네이버 지도로 예상 연료비와 통행료 확인하기 IT동아갤로그로 이동합니다. 11.06 217 0
4491 성북구 1인 창조기업 지원센터 스타트업을 만나다 [2] IT동아갤로그로 이동합니다. 11.06 243 0
4490 [스타트업-ing] 그린재킷 임시아 대표 "아직도 골프장 갈 때 현금 찾으세요?" IT동아갤로그로 이동합니다. 11.06 414 0
4489 스팸 문자, 아이폰 기본 설정으로 간단하게 차단하자 IT동아갤로그로 이동합니다. 11.05 241 0
4488 업무 카톡으로 스트레스 받는다면? - 업무용 채팅방 분리하기 IT동아갤로그로 이동합니다. 11.05 240 0
4487 개인 소유 차량으로 수익 창출할 방안 마련된다 IT동아갤로그로 이동합니다. 11.05 234 0
4486 北, 세계 가상화폐 탈취액 3분의 1 차지…민간기업, 사이버 보안 강화 절실 [8] IT동아갤로그로 이동합니다. 11.05 2075 2
4485 다 똑같이 생긴 USB, 색상·형태로 규격 구분 하는 방법은? [2] IT동아갤로그로 이동합니다. 11.05 5564 7
4484 [자동차와 法] 전기차와 자율주행차 시대를 향한 자동차 보험 규정의 변화와 전망 IT동아갤로그로 이동합니다. 11.05 4556 0
4483 [KIDP 울산] 휴원스, "뇌압비 측정 장비, 디자인 개선으로 완성도 높여" IT동아갤로그로 이동합니다. 11.05 215 0
4482 챕터코리안 “한국어 교육으로 외국인 한국 정착 지원” [동국대학교 캠퍼스타운] IT동아갤로그로 이동합니다. 11.05 271 0
4481 [뉴스줌인] 갤럭시 S24 FE 출시, 성능∙가격 모두 좋은데 무게가 좀? [12] IT동아갤로그로 이동합니다. 11.04 2741 0
4480 희비 교차 중인 빅테크ㆍ반도체 기업 실적, 향후 시장은? IT동아갤로그로 이동합니다. 11.04 260 0
4479 [스케일업] 클리카 [2] AI 모델 최적화를 위한 여정, 클리카의 '딥러닝 연구원' 이야기 IT동아갤로그로 이동합니다. 11.04 221 0
4478 1종 자동면허 시험 본격 시행...기능시험에 전기차 배치도 추진 IT동아갤로그로 이동합니다. 11.04 219 0
4477 갤럭시 스마트폰 바탕 화면·앱·폴더 활용 한 눈에 IT동아갤로그로 이동합니다. 11.04 260 0
4476 어린이용 헤드폰 고를 때는 이렇게! [이럴땐 이렇게!] IT동아갤로그로 이동합니다. 11.04 216 0
4475 [주간투자동향] 라이드플럭스, 260억 원 규모 시리즈B 투자 유치 外 IT동아갤로그로 이동합니다. 11.04 601 0
4474 고려대 “해외 특허 플랫폼 수익화, 기술 보호·발전 동시에” [4] IT동아갤로그로 이동합니다. 11.04 2103 2
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2