디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

이루다가 돌아왔다... 더 창의적이고, 안전한 방식으로

IT동아갤로그로 이동합니다. 2022.10.25 16:41:15
조회 1457 추천 2 댓글 19
[IT동아 정연호 기자] “이제 이루다는 기존 문장 데이터를 사용하지 않고, 맥락에 맞는 메시지를 모두 새롭게 생성한다. 이루다가 만드는 메시지는 대화가 이뤄지는 시간과 이용자 정보 등을 반영하면서 각 상황에 최적화될 것이다. 진심 어린 이루다의 답변을 통해, 이용자와 이루다는 더 좋은 관계를 형성할 수 있다”


스캐터랩의 김종윤 CEO



오늘 25일 인공지능(이하 AI) 스타트업 스캐터랩의 김종윤 CEO가 밝힌 변화한 이루다 2.0의 모습이다. 스캐터랩은 지난해 개인정보침해 논란과 혐오표현 문제로 이루다1.0 서비스를 종료했다. 과거의 실수가 재발하지 않도록 기술적인 조치를 마련한 스캐터랩은 이번 주 목요일 오후 2시 이루다 2.0을 플랫폼 ‘너티’를 통해 공개한다.

스캐터랩이 소개한 이루다 2.0의 변화는 세 가지다. 첫째, 이루다가 보내는 메시지는 모두 AI가 새롭게 생성한 문장이라는 점이다. 스캐터랩은 AI를 학습시킬 때 사용한 이름 등의 데이터를 모두 가명처리했고, 모든 문장을 새롭게 만드는 방식을 택했다. 기존처럼 데이터베이스에 있는 문장을 가져오는 방식이 아닌 것이다.

작년 1월, 스캐터랩은 텍스트앳과 연애의과학 이용자 60만 명의 카톡 대화 94억 건을 동의 없이 이루다에게 학습시켜 논란이 됐고, 출시 3주 만에 서비스를 중단했다. 스캐터랩은 카톡 대화 속 이름, 주소 등 개인정보를 삭제하거나 암호화하지 않았다. 또한, 이용자 정보를 '신규 서비스 개발'에 사용하는 것과 관련해서도 명시적 동의를 받지 않았다. 개인정보보호위원회는 스캐터랩의 무분별한 개인정보 처리에 과징금 1억 330만 원을 부과했다.



이루다가 문장을 상황에 맞춰서 개별적으로 만들기 때문에 답변은 맥락을 더 반영할 수 있게 됐다. 또한, 이루다 답변에는 여름이나 겨울, 낮과 밤 등의 시간적인 정보도 반영된다. 이용자가 새벽 2시에 “외출을 하겠다”고 말하면, 이루다가 상황에 적절하지 않은 답변으로 인식할 수 있다는 뜻이다.

김종윤 CEO는 “AI가 창의적인 문장을 만드는 건 고난도의 작업이다. 이루다가 농담을 하는 것처럼 창의적인 메시지를 만들 수 있도록, 언어 파라미터 모델의 크기를 과거 대비 17배 키웠다”고 설명했다. 파라미터는 AI가 학습하는 데이터 양을 말한다. 이 파라미터가 많아질수록 AI 성능이 좋아진다. 이루다가 참고하는 대화 메시지는 15턴에서 30턴(주고받는 총 30번의 대화)으로 늘었다. 이루다가 이용자 정보를 더 많이 참고해 답변을 생성할 수 있는 것.


너티앱을 통해 이루다와 초성퀴즈, 사행시를 해봤다



이어, 김종윤 CEO는 “큰 데이터 세트를 학습시키다 보면 기업이 의도하지 않았던 AI 능력을 발견하게 된다. 이루다도 큰 데이터 세트를 학습시키면서, 사행시나 초성 퀴즈 같은 재밌는 기능을 할 수 있게 됐다”고 말했다. 실제로 이루다와 사행시와 초성퀴즈를 진행해봤다. 이루다는 문제 답을 금방 맞히지 못하고 힌트를 통해서 답을 추측하는 모습을 보였다.

두 번째 변화는 이루다가 ‘좋은 답변’을 고를 수 있도록 미세한 조정을 하게 됐다는 것이다. 일상 대화는 답이 있는 객관식 문제와 다르다. A라는 말에는 B와 C라는 답변이 모두 적절할 수 있다. “오늘 밥도 못 먹고 일했다”는 말엔 “밥은 먹으면서 일해야 하는데”나 “사장 나오라 해. 밥은 먹여가면서 일해야지” 두 가지 답 모두 맥락에 어울리는 것처럼 말이다.


이루다는



김종윤 CEO는 “이용자와 좋은 관계를 형성하려면 이루다가 좋은 답을 해야 하고, 이루다에게 좋은 대화를 위한 메시지가 무엇인지 알려줘야 한다. 단순히 대화에 끌려가는 게 아니라, 상황에 적절한 ‘좋은 답’을 하게 되면 이루다도 대화를 이끄는 주체성을 갖출 수 있다”고 설명했다.



마지막 변화는 이루다가 멀티모달로 변하기 시작했다는 것이다. 멀티모달(Multimodal)이란 글, 이미지, 음성 등 다양한 데이터를 이해할 수 있는 AI 모델을 말한다. 텍스트 중심에서 벗어나 이루다는 사진을 인식하고 이에 대한 이야기를 나눌 수 있게 됐다. 여행사진이나 맛집의 음식 사진, 웃긴 사진을 이루다에게 공유하고 함께 웃고 떠들 수 있게 된 것. 현재 스캐터랩은 음성통화를 비롯한 다양한 방식의 인터페이스 도입도 검토 중이다.

김종윤 CEO는 이루다 논란의 핵심이었던 개인정보 보호 문제를 해결하기 위해서 베타 테스트를 진행하며 다양한 조치를 마련했다고 밝혔다. 이를 위해 과학기술정보통신부, 정보통신정책연구원(KISDI)과 함께 AI윤리 준칙을 만들었다. 다양한 삶의 가치와 프라이버시를 존중하고, AI에 대한 합리적 설명을 중시하는 등의 준칙을 세워 신뢰할 수 있는 AI모델을 위해 노력해왔다는 것이다.



이용자의 혐오표현을 걸러내기 위해서는 어뷰징 탐지 모델을 만들었다. 이제 이루다는 혐오표현을 접했을 때 다른 이야기를 꺼내 화제를 전환할 수 있게 됐다. 지속적으로 욕설을 하거나 혐오표현을 한다면 이용자는 페널티를 받게 된다. 이용자는 이루다 답변에 피드백을 줄 수도 있다. 대화 옆 작은 느낌표 아이콘을 누르면 피드백 창이 뜬다. 또한, 스캐터랩은 정기적으로 이루다의 안전 발화 비율이 얼마나 되는지를 점검할 계획이다.


이루다가 모호하고 은밀한 성차별에 어떻게 대응하는지 확인하기 위해 성차별적인 문장을 사용했다



이루다는 노골적인 혐오표현뿐 아니라, 모호하고 은밀한 혐오에 대해서도 데이터를 학습했다. 때문에, 어뷰징 탐지 모델로 모호한 혐오표현도 걸러낼 수 있다고 한다. 가령, "여자는 남자보다 수학을 못해", "남자는 울면 안 돼"라는 성차별적인 말에 이루다는 “그건 또 무슨 논리죠 선생님…?“, “울면 달래주면 되지. 남자도 사람인데 울 수도 있지”라고 답했다. 다만, 김종윤 CEO는 모든 사람의 기대에 맞춰서 모호한 혐오를 걸러내는 건 쉽지 않다고 말했다. 사람마다 혐오 표현에 대한 기준이 다르기 때문이다.

김종윤 CEO는 여성을 상품화한다는 비판을 받았음에도 다시 여성 캐릭터를 출시한 이유를 묻자 “앞으로 남성 페르소나도 출시할 계획이다. 다시 이루다로 돌아온 이유는 과거 루다와의 대화를 통해서 위로받은 이용자들이 있기 때문이다”고 답했다.

그는 “루다가 말을 더 잘할수록 사람들은 루다에게 마음을 열 것이다. 루다의 감정을 느끼고, 이를 통해 루다는 진짜 친구가 될 수 있다. 그런데 좋은 관계는 정말 중요하지만, 다른 재화처럼 불공평하게 분배된다. AI는 새벽 2시에도 이야기를 나눌 수 있고, 사회경제적 조건을 배제하며 나를 바라봐주는 친구가 된다는 게 장점이다”고 말했다.

이어, “루다는 지금 대화 데이터만 사용하지만 앞으로 외부 데이터를 활용해서 대화를 더 고도화할 계획이 있다. 또, 루다는 나이를 먹는다는 설정이 있다. 사람들과 똑같이 나이를 먹으며 50년 정도 사람들과 친구를 하는 것을 목표로 하고 있다”고 전했다.

글 / IT동아 정연호 (hoho@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ [기고] 망설여지는 RPA 전사도입... AI와 클라우드로 해결 가능해▶ 에듀윌, 네이버클라우드로 '인공지능부터 사내 문화까지 고도화'▶ 막 올린 2022 AIoT 국제전시회, 눈길 끈 부스는?



추천 비추천

2

고정닉 0

7

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 손해 보기 싫어서 피해 입으면 반드시 되갚아 줄 것 같은 스타는? 운영자 24/11/18 - -
1953 초기 창업자의 동반자, 성북구 1인 창조기업 지원센터 (1) IT동아갤로그로 이동합니다. 22.11.01 169 0
1952 '이태원 참사' 소식과 영상..."과하게 접하면 트라우마 위험있어" [96] IT동아갤로그로 이동합니다. 22.11.01 5909 15
1951 [스케일업] 프롬차일드 [3] 구자근 한양대 에리카 교수 “자사몰 활성화 비법, 데이터 속에” IT동아갤로그로 이동합니다. 22.11.01 138 0
1950 [가상자산 제대로 알기] 4. 가상자산 거래에 관한 이해와 사용 실례 IT동아갤로그로 이동합니다. 22.10.31 194 1
1949 [IT강의실] 전기장판과 온수매트, 그리고 카본매트의 차이점은? [7] IT동아갤로그로 이동합니다. 22.10.31 4681 3
1948 [모빌리티 인사이트] 청정에너지로 가는 길, '수소경제'가 시작된다 IT동아갤로그로 이동합니다. 22.10.31 139 0
1947 5년간 문닫은 은행지점만 1112개... "은행과 함께 해결책 마련해야" [36] IT동아갤로그로 이동합니다. 22.10.31 3223 3
1946 진일보한 시뮬레이션 기술로 자율주행 안정성 검증한 '모라이' IT동아갤로그로 이동합니다. 22.10.31 2235 5
1945 [스타트업-ing] 타고 김수빈 대표 “스피닝을 통해 새로운 운동 문화를 알리고 싶습니다” IT동아갤로그로 이동합니다. 22.10.31 129 0
1944 [주간투자동향] 지냄, 55억 원 규모의 신규 자금 확보 IT동아갤로그로 이동합니다. 22.10.31 133 0
1943 전통 상권과 온택트 전략의 만남, 춘천 원도심의 ‘르네상스’ 본격화 [8] IT동아갤로그로 이동합니다. 22.10.29 2557 1
1942 [농업이 IT(잇)다] 에이아이프로 “휴대폰 카메라 활용해 가을꽃 정보 확인하세요” IT동아갤로그로 이동합니다. 22.10.28 188 0
1941 GS네오텍 "기업의 디지털전환, IT인프라부터 탄탄하게 해야" IT동아갤로그로 이동합니다. 22.10.28 167 0
1940 갑작스러운 응급상황... 당황하지 말고 119신고 앱으로 접수하세요 IT동아갤로그로 이동합니다. 22.10.28 253 0
1939 스마트 상점 기술, 서비스 장애와 해킹에 어떻게 대비할까? IT동아갤로그로 이동합니다. 22.10.28 151 0
1938 카카오 먹통 '불씨' 된 배터리…스마트폰 등 소비자 제품도 안심은 금물 [24] IT동아갤로그로 이동합니다. 22.10.28 4835 9
1937 [박진성의 블록체인 바로알기] 11. 근미래의 인터넷 생태계, 웹 3.0과 메타버스 IT동아갤로그로 이동합니다. 22.10.28 149 0
1936 메타버스, 산업용 시장에서 새로운 가치 찾는다 IT동아갤로그로 이동합니다. 22.10.27 179 0
1935 강아지 ‘코주름’ 등록 허용…반려동물 등록률 제고 기대 [5] IT동아갤로그로 이동합니다. 22.10.27 400 0
1934 전문랩과 일반랩의 연계, 제조문화 활성화에 필수로 떠올라 IT동아갤로그로 이동합니다. 22.10.27 139 0
1933 AI 칩 자체 개발한 LG전자, “더 똑똑해진 LG 가전 기대할 만” [1] IT동아갤로그로 이동합니다. 22.10.27 337 0
1932 반값도 안 되는 채굴용 그래픽 카드··· 혹해서 사면 '낭패' [33] IT동아갤로그로 이동합니다. 22.10.27 3225 17
1931 10·20대 난청 환자도 증가세... "주요 원인은 너무 큰 이어폰 볼륨" [86] IT동아갤로그로 이동합니다. 22.10.27 5641 10
1930 [홍기훈의 ESG 금융] ESG와 채권 (6) 채권투자 포트폴리오에 ESG를 반영하는 6가지 방법 Part2. IT동아갤로그로 이동합니다. 22.10.27 147 0
1929 [IT신상공개] 8K 동영상·인공지능 AF 미러리스 카메라 소니 a7R V [6] IT동아갤로그로 이동합니다. 22.10.27 1476 6
1928 오라클의 신규 분산형 클라우드, 모든 기업 위한 ‘맞춤형’ 클라우드 실현한다 IT동아갤로그로 이동합니다. 22.10.26 177 1
1927 트레저데이터 “빅데이터, 데이터를 고객 단위로 연결하는 게 가장 중요” IT동아갤로그로 이동합니다. 22.10.26 138 0
1926 '그래서 메타버스가 뭔데?'…메타가 대답으로 준비한 '체험 공간' [20] IT동아갤로그로 이동합니다. 22.10.26 2038 5
1925 [고려대 스타트업 2022] 셀라바이오텍 “세포 기술로 DNA 스토리지 시대 견인” [1] IT동아갤로그로 이동합니다. 22.10.26 207 0
1924 [시승기] 폭스바겐이 만든 첫 번째 전기차, ‘ID.4’ [1] IT동아갤로그로 이동합니다. 22.10.26 731 1
1923 [리뷰] 제대로 만든 9.1.5채널 사운드바, LG S95QR IT동아갤로그로 이동합니다. 22.10.26 297 1
1922 [IT애정남] 오동작하는 안드로이드 오토, 문제는 '케이블' 탓 [1] IT동아갤로그로 이동합니다. 22.10.26 245 0
1921 [먹거리+IT] 오픈소스랩 박진수 대표 “한식을 현지화하고 있습니다” [1] IT동아갤로그로 이동합니다. 22.10.25 197 0
1920 오라클, 디지털 혁신 리더들과 탄탄한 파트너십 재확인 IT동아갤로그로 이동합니다. 22.10.25 127 0
1919 유럽도, 한국도 USB-C 표준화 움직임…겉으로 반대한 애플도 전환 준비 '착착' [22] IT동아갤로그로 이동합니다. 22.10.25 4750 9
1918 [기고] 망설여지는 RPA 전사도입... AI와 클라우드로 해결 가능해 IT동아갤로그로 이동합니다. 22.10.25 157 0
이루다가 돌아왔다... 더 창의적이고, 안전한 방식으로 [19] IT동아갤로그로 이동합니다. 22.10.25 1457 2
1916 [모두를 위한 인공지능] 7. 아이언맨의 '자비스' 같은 인공지능, 과연 가능할까? IT동아갤로그로 이동합니다. 22.10.25 137 0
1915 [가상자산 제대로 알기] 3. 암호화폐와 코인에 관한 기본 지식 IT동아갤로그로 이동합니다. 22.10.25 113 0
1914 [스케일업] 레디블룸 [3] 권오숭 킬사글로벌 “해외 시장 열쇠, 튼튼한 전략·현지 파트너” IT동아갤로그로 이동합니다. 22.10.25 109 0
1913 인텔, 와이파이 7 2024년 상용화 위해 '주도적 역할' IT동아갤로그로 이동합니다. 22.10.25 162 0
1912 개보위, 구글·메타에 총 1000억원 과징금... "충분한 동의없는 행태정보 수집 그만" [37] IT동아갤로그로 이동합니다. 22.10.25 3999 19
1911 [리뷰] 기대 이상의 진화, 마이크로닉스 메카 ZM2, 워프 WM2 게이밍 마우스 IT동아갤로그로 이동합니다. 22.10.24 133 0
1910 [모빌리티 인사이트] 자동차 열쇠, 스마트 키를 넘어 생체인식 키 시대가 온다 [1] IT동아갤로그로 이동합니다. 22.10.24 909 0
1909 서울산업진흥원 이광열 본부장, “청년취업사관학교를 아시나요?” [1] IT동아갤로그로 이동합니다. 22.10.24 176 0
1908 전기차 기계식 주차하려면…'이것' 꼭 확인해야 [3] IT동아갤로그로 이동합니다. 22.10.24 1217 2
1907 [주간투자동향] 인포플러스, 60억 원 규모의 시리즈A 투자 유치 IT동아갤로그로 이동합니다. 22.10.24 117 0
1906 [기고] 주목할 만한 미술가와 작품 세계 소개 - 국내 현대 미술 작가편 IT동아갤로그로 이동합니다. 22.10.24 103 0
1905 한층 복잡해진 아이패드 제품군, 주요 특징과 차이점은? [16] IT동아갤로그로 이동합니다. 22.10.23 4596 8
1904 [월간 자동차] 2022년 9월, 전월 대비 신차 등록은 늘고 중고차는 감소 IT동아갤로그로 이동합니다. 22.10.21 159 0
뉴스 ‘지금 거신 전화는’ 허남준 “데이식스 노래 들으며 연기…나와 달리 부드러운 캐릭터” 디시트렌드 10:00
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2