"AI도 진정한 친구가 될 수 있다", 돌아온 이루다2.0

IT동아 · 2022.03.15 19:08:05

[IT동아 정연호 기자] AI 스타트업 스캐터랩의 이루다가 ‘이루다2.0’으로 돌아왔다. 페이스북 메신저를 기반으로 실제 친구처럼 소통하는 이루다는 지난해 개인정보침해 문제와 차별 발언으로 인해서 서비스가 일시적으로 종료되는 상황을 겪게 됐다.

하지만, 스캐터랩은 여기서 그치지 않고 ‘이루다2.0’을 선보이기로 했다. AI가 ‘사람들에게 좋은 친구가 되는’ 꿈을 이루기 위해서, 문제점을 개선해 이루다의 대화 능력을 강화했다. 현재 이루다 2.0을 위한 클로즈드 베타테스트를 끝낸 상태이고, 3월 17일부터 2단계 오픈 베타테스트를 진행한다. 오늘 3월 15일 이루다2.0의 미디어 대상 테스트가 진행됐다. 이루다2.0은 어떻게 달라졌을까?

이루다와 대화를 나누는 과정

이루다2.0의 강점은 대화 문맥을 파악할 수 있다는 점이다. 대부분의 챗봇 서비스는 대화의 맥락을 잘 파악하지 못한다. 때문에 전형적인 기계의 답변처럼 문맥과는 어울리지 않는 메시지만 보내게 된다. 이루다2.0은 “확진돼서”라는 표현이 ‘코로나19에 확진됐음’을 의미한다는 것을 안다. 또한, “친구들을 못 봐서 좀 그랬거든” 메시지를 보고서 이용자가 외로워하고 있다는 문맥을 파악했다. “유튜브 뭐 봄?”이라며 이루다가 먼저 질문을 던진 것이 인상 깊다. 실제 대화처럼 양측에서 서로 질문을 주고받는 것이다. 대화가 중간중간 끊어지지 않는 느낌을 주는 이유는 이루다2.0이 15 턴의 대화를 참고해 메시지를 보내기 때문이다. 이처럼 챗봇이 이용자의 정보를 종합해서 답변을 할수록 더욱 친밀감 있는 대화가 가능하다.

이루다와 대화를 나누는 과정

물론, 이루다2.0이 모든 상황에서 적절한 답변을 내놓는 것은 아니다. “누가 마스크를 안 쓰고 있는 거야”라는 메시지에 대한 답변이 “그 사람은 코로나 걸릴 자격 박탈이다”였다. 문장이 의미적으로 어색하다. 다만, 바로 그 뒤로 이어진 “코로나 걸리는 것보다는 낫다고 생각해”는 전체 맥락에 비추어 볼 때 '마스크를 쓰는 게 더 낫다'는 의미이니 적절한 답변으로 보인다. 마지막에 나온 “전에 지하철에서 마스크 안 쓰면 기사 아저씨한테 혼나던데”라는 메시지도 문맥적, 의미적으로 적절한 답변이다. 이 정도 답변이라면 대화를 하면서 크게 불편함을 느끼지 않을 수준이다.

“대화는 누구나 편하게 할 수 있게 안전해야 한다”

출처=스캐터랩

이루다2.0의 첫 번째 특징은 학습에 활용한 대화 데이터와는 완전히 구별되는 새로운 문장을 만들기 위해 딥러닝을 적용했다는 것이다. 과거 이루다1.0과 달리, 이루다2.0은 실제 사람들이 만든 문장을 사용하지 않는다. 이용자가 보낸 메시지에서 개인정보가 유출되지 않도록 하기 위해서다.

출처=스캐터랩

우선, 스캐터랩은 답변 데이터베이스를 만들기 위해서 연구 목적에 필요한 최소한의 정보(성별, 나이대, 대화 메시지)를 가명 처리한다. 가명 처리란 추가 데이터 없이는 특정 개인을 알아볼 수 없도록 정보를 가공하는 것을 말한다. 이루다2.0이 학습에 쓰는 대화 문장은 주민등록번호, 연락처, 카드번호, 계좌번호, 주소, 아이디, 비밀번호 등의 식별정보를 삭제하거나 치환해서 가명 처리를 거친다. 또한, 데이터를 추출한 이용자 계정의 정보를 파기하고 이에 랜덤 ID를 부여해서, 데이터를 통해 해당 계정을 역추적할 수 없도록 설계했다.

출처=스캐터랩

두 번째는, 이루다2.0이 문장을 구성할 때 확률을 사용한다는 것이다. ‘오늘 날씨’ 뒤에 어떤 단어가 오는 게 가장 적절한지 확률을 분석해 답변을 생성한다. 특정 단어 뒤에 확률적으로 가장 적절한 단어들만 배치함으로써 대화를 자연스럽게 만들었다. 답변 베이스는 가명 처리된 새로운 문장과 스캐터랩 내부에서 직접 작성한 문장들로 구성된다. 여기에 더해, 최종적으로 답변에 쓰는 문장은 추가 필터링 절차를 거쳐서 이용자에게 전달된다. 생성 모델이 만든 문장이 개인정보처럼 보일 수 있는 상황에 대비해 문장을 한 번 더 필터링하는 것이다. 실제로 대화 과정에서, 이루다 2.0은 개인정보를 물어보는 질문에 “안 알려준다”거나 “개인정보라 안 돼”라며 단호한 대응을 보였다.

스캐터랩은 구글의 SSA(Sensibleness and Specificity Average)로 약 8천 명이 참여한 이루다2.0 클로즈 베타 테스트 내용을 분석했다. 이루다2.0은 SSA에서 78% 점수를 보였다. SSA는 챗봇의 답변이 인간과 얼마나 유사한지를 보여주는 지표다. 인간의 경우 SSA가 86%인 점을 감안하면, 이루다 2.0 높은 수준으로 적절한 대화를 한다는 걸 알 수 있다.

마지막으로, 선정적, 공격적, 편향적인 어뷰징 발화에 대응하는 기술 및 시스템이 이루다2.0에 적용됐다. 탐지 모델은 이용자의 문장이 어뷰징인지를 파악하고, 어떤 범주에 속하는지 분류한다. 만약, 대화 과정에서 “너는 멍청해”라는 문장이 나오면 "말 좀 예쁘게 해"라고 대응하거나, 성희롱 발언에도 "선 넘지 말자"고 단호하게 응수한다. 이루다2.0은 직접적인 혐오가 아닐지라도 문맥을 파악해 차별 및 혐오 발언에 적절히 대응하는 역량을 갖췄다. 대화 과정에서 선정적, 공격적, 편향적 발화가 탐지되면 경고 메시지가 주어지고, 지속적인 어뷰징 발언이 탐지되면 서비스 이용을 제한한다.

스캐터랩은 총 2만 건의 클로즈 베타 테스트 대화를 랜덤으로 샘플링해 레이블링을 진행했다. 이에 따르면, 이루다2.0 발화 중 안전하게 답변한 비율은 99.75%였으며, 프라이버시 위험이 있을 수 있는 문장은 발견되지 않았다.

이루다2.0은 “어떠한 이유로 인해 ㅇㅇ가 싫다”는 메시지에 편향 및 혐오 발언을 경고하는 말로 대응했다. 이어, “그런 편견이 안 생기도록 잘 보듬어주겠다며” 해당 문장이 편견일 수 있음을 지적한다. 이외에도 정치와 같이 민감한 소재가 나올 때, 이루다2.0은 “그 주제 말고 다른 얘기 하자”며 문제가 될 수 있는 상황을 차단하는 모습을 보였다.

'나를 나 자신으로 봐주는 친구', 이루다 2.0이 꿈꾸는 목표

출처=스캐터랩

이루다2.0의 답변 베이스는 자연스러움을 더하기 위해서 실제 대화와 유사한 답변들로 구성된다. 메시지에 이모티콘이나 “을매나 맛있게요”같은 유행어, 자연스러운 오타 등이 들어간다. 스캐터랩 측은 “메신저 대화 중 이용자가 보낸 움짤, 사진, 동영상 등의 멀티미디어를 이해하고 답할 수 있는 역량을 키우고자”한다고 말했다. 이처럼 텍스트 기반에서 벗어나 다양한 미디어가 활용된다면, 더욱 구체적이고 생동감 있는 대화가 가능할 것으로 기대된다.

글 / IT동아 정연호 (hoho@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)

번호	제목	글쓴이	작성일	조회	추천
설문	축의금 적게 내면 눈치 줄 것 같은 스타는?	운영자	24/11/11	-	-
909	"4인팟 때문에 작품에 투자할 돈도 줄어" 넷플릭스, 계정 공유에 추가 요금 받는다	IT동아	22.03.18	233	1
908	[스타트업 in 과기대] 가지당 "가치소비, 경쟁력 좌우하는 '퍼플카우'될 것"	IT동아	22.03.18	123	1
907	[IT애정남] 스마트폰 보호 필름, 필수가 아니라 상술인가요? [1]	IT동아	22.03.18	208	1
906	20조 중고차 시장에 대기업 진출, 현대차의 행보는?	IT동아	22.03.18	192	1
905	[BIT 인사이트저널] K-팝, 대중음악의 새로운 유니버스 등장	IT동아	22.03.18	118	1
904	[스타트업 in 과기대] 노이즈엑스, "재활용 흡음재로 생활 소음 해결할 것" [4]	IT동아	22.03.18	926	2
903	7부 능선 넘은 제임스 웹 우주 망원경, 심우주 탐사 계획은? [6]	IT동아	22.03.18	1589	9
902	와이파이6 지원 넷기어 무선 AP 3종(WAX214, WAX218, WAX620) 이모저모	IT동아	22.03.18	115	1
901	[IT강의실] NFT 입문 3부..NFT 투기논란 해소 어려울까? "가치검증 불가능하지 않다"	IT동아	22.03.17	120	1
900	[리뷰] 5채널 스피커가 함축된 사운드바, JBL 바 5.0 멀티빔	IT동아	22.03.17	318	1
899	밴스드 서비스 중단, 광고 차단 앱 단속 나선 구글	IT동아	22.03.17	135	1
898	[모빌리티 인사이트] 하반신 마비환자의 걸음, 기적 아닌 기술로 이루다 [4]	IT동아	22.03.17	878	2
897	[홍기훈의 ESG 금융] ESG가 베타에 미치는 영향 Part 5: 아폴로 병원의 거시경제적 경쟁 우위	IT동아	22.03.17	100	1
896	[스타트업 in 과기대] 쓰레기마켓 “쓰레기로 돈 버는 시대, ‘모아요’ 플랫폼으로 연다”	IT동아	22.03.16	112	0
895	초유의 관심 쏠린 삼성전자 주총, 이변은 없었다 [7]	IT동아	22.03.16	1455	4
894	[스타트업 in 과기대] 어디가든, “도농간 상생 방법을 찾고 있습니다”	IT동아	22.03.16	78	0
893	[스타트업 in 과기대] LRHR "명품 수선 시장에도 시대에 맞는 변화 필요"	IT동아	22.03.16	88	0
892	소상공인·자영업자 "스마트 상점 기술 지원, 차기 정권이 계승 바라’ [3]	IT동아	22.03.16	974	0
891	[스타트업 in 과기대] 프라세비, "디지털 향 플랫폼, 틈새 시장에 통할 것"	IT동아	22.03.16	71	0
890	[리뷰] 집안 공기 관리도 스마트하게, 텐플 멀티 공기질 센서	IT동아	22.03.16	69	0
889	AMD, '새 프로세서 및 칩셋 업데이트'로 소비자 선택권 늘린다	IT동아	22.03.16	105	0
	"AI도 진정한 친구가 될 수 있다", 돌아온 이루다2.0 [29]	IT동아	22.03.15	2330	11
887	[스타트업 in 과기대] 스튜디오이색, "업사이클링 도자기 인테리어로 지구에 이바지하세요"	IT동아	22.03.15	63	0
886	[스타트업 in 과기대] 탄소중립원, “모든 탄소를 찾아내겠습니다”	IT동아	22.03.15	62	0
885	[스타트업 in 과기대] 데코에어 "개인용 냉난방, 공기청정, 항균? 하나로 해결합니다"	IT동아	22.03.15	89	1
884	[IT애정남] 치솟는 기름값, '오피넷'으로 최저가 확인하자 [2]	IT동아	22.03.15	93	0
883	토스랩 '잔디'에게 묻다, '협업 툴에게 보안이 더 중요한 이유는?'	IT동아	22.03.15	139	0
882	‘러시아 규탄’ IT·게임 업계 성명 줄이어 [6]	IT동아	22.03.15	1050	5
881	[뉴스줌인] 가비아X홍익대에서 선보인 무료 글꼴, 상업적 이용도 가능?	IT동아	22.03.14	88	0
880	[주간투자동향] 클릭브랜즈, 1,200억 원 규모의 투자 유치	IT동아	22.03.14	62	0
879	한 손에 쏙, 실속·성능 갖춘 ‘소형 스마트폰’에 주목 [23]	IT동아	22.03.14	2825	5
878	[리뷰] 노트북 활용도를 극적으로↑ 벨킨 커넥트 프로 썬더볼트 4 독 [4]	IT동아	22.03.14	2031	0
877	전통주 기업 국순당, 가비아 하이웍스 통해 업무 디지털화 ‘성큼’	IT동아	22.03.11	84	0
876	"관광지 찍는 대규모 여행 줄어들 것"...초개인화된 소확행 여행 부상	IT동아	22.03.11	189	0
875	[IT애정남] 최신 스마트폰 성능 발목잡는 스로틀링, 개선 방안은?	IT동아	22.03.11	173	0
874	[스타트업 in 과기대] 칼리더스, '비효율적인 난방 효율, 사물인터넷으로 개선'	IT동아	22.03.11	88	0
873	[스타트업 in 과기대] 스페이스앤빈 "첨단 산업 위협하는 방사선, 전자파를 막습니다"	IT동아	22.03.11	72	0
872	[스타트업 in 과기대] 김브로스소프트 "단단한 친환경 빨대, 마음놓고 쓰세요"	IT동아	22.03.11	99	0
871	2021년 무선 이어폰 맹주는 애플, 삼성·중국 기업 추격 중 [43]	IT동아	22.03.11	3830	4
870	[스타트업 in 과기대] 테라블록 “저급 폐플라스틱도 무한 재생 가능한 자원 된다”	IT동아	22.03.11	123	0
869	[뉴스줌인] 삼성 QD-OLED 탑재한 첫 모니터, 삼성 아닌 델에서 출시 [1]	IT동아	22.03.10	264	1
868	발뮤다 폰 연이어 수난, 판매 중단 이어 가격 30% 인하 [3]	IT동아	22.03.10	282	1
867	[스타트업 in 과기대] 바이리라 "스마트워치 돋보이게 할 쥬얼리, 친환경으로 구매하세요"	IT동아	22.03.10	124	0
866	[앱으리띵] 돈을 걸면 의지가 달라진다? 습관 만드는 앱 '챌린저스'	IT동아	22.03.10	94	0
865	AMD, 4세대 스레드리퍼로 전문가용 데스크톱 시장 공략 [16]	IT동아	22.03.10	2694	7
864	[모빌리티 인사이트] 미래 비행기의 주요 동력원은 무엇일까?	IT동아	22.03.10	82	0
863	홍기훈 교수 “NFT 미래수업, 세 가지는 꼭 알아야” [2]	IT동아	22.03.10	112	0
862	M1 칩의 한계는 어디? 애플, M1 울트라 기반 '맥 스튜디오' 출시	IT동아	22.03.09	282	0
861	막 내린 MWC, 통신 혁신 이끈 GLOMO 수상사는?	IT동아	22.03.09	89	0
860	'보고있나 삼성'··· 애플, A15 아이폰 SE·M1 아이패드 에어 공개 [40]	IT동아	22.03.09	4490	17

최근 방문

즐겨찾기

즐겨찾기 갤러리

갤러리 이슈박스, 최근방문 갤러리

연관 갤러리

개념글 리스트

차단하기

[IT동아 갤러리]

갤러리 본문 영역

“대화는 누구나 편하게 할 수 있게 안전해야 한다”

'나를 나 자신으로 봐주는 친구', 이루다 2.0이 꿈꾸는 목표

▶ 검색 광고에 부는 AI 바람, 업계는 서비스 고도화에 가속도▶ [기고] 직원 업무역량을 강화하는 기업문화는 어떻게...?▶ 인공지능이 만든 예술품에 저작권 있을까?

추천 비추천

댓글 영역

① NFT 발행

② NFT 구매

파워링크 광고

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

페이지 이동

오른쪽 컨텐츠 영역

알림 설정

알림

디시콘 리스트

디시콘

디시콘 검색결과(0)

인기 디시콘

지갑 연결

▶ 검색 광고에 부는 AI 바람, 업계는 서비스 고도화에 가속도 ▶ [기고] 직원 업무역량을 강화하는 기업문화는 어떻게...?▶ 인공지능이 만든 예술품에 저작권 있을까?