디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

구글 “음성 인공지능 USM으로 세계 언어 장벽 허문다”

IT동아갤로그로 이동합니다. 2023.03.08 09:00:57
조회 1084 추천 5 댓글 9
[IT동아 차주경 기자] 구글이 100개 이상의 언어를 자동으로 인식하고, 이를 번역하거나 자막으로 만드는 음성 인공지능 ‘USM(Universal Speech Model)’의 발전 현황을 공개했다. 구글은 USM의 개발 상황과 성과, 학습 구조와 개선 계획을 함께 소개하면서 연구자들에게 API(Application Programming Interface, 앱 개발 도구) 접근 권한도 준다고 밝혔다.


구글 1,000개 언어 이니셔티브 프로그램 소개 사진. 출처 = 구글 블로그



USM은 구글이 2022년 11월 공개한 ‘1,000개 언어 이니셔티브’를 현실로 이끌 첫 기술이다. 1,000개 언어 이니셔티브는 세계 각국의 언어 1,000개를 지원하는 인공지능 모델이다. 당시 구글은 USM의 개념을 함께 설명했는데, 이번에는 USM이 어떤 방식으로 얼마나 많이 공부했고 어느 정도의 능력을 발휘했는지 밝혔다.

구글 USM은 지금까지 300개 이상의 언어로 말한 목소리를 1,200만 시간 분량, 문장을 280억 개 이상 분석해 공부했다. 구글은 영어와 중국어 등 세계 주요 언어는 물론, 세계에서 2,000만 명 미만이 쓰는 소수 언어에 이르기까지 다양한 종류의 목소리와 문장을 가르쳤다고 강조했다.

각기 다른 언어 300여 개를 인공지능에게 가르치는 것은 여간 어려운 일이 아니다. 쓰는 사람이 적은 소수 언어는 목소리와 문장 데이터 자체를 구하기 어렵다. 이 데이터를 구했다고 해도, 이것을 인공지능에게 가르칠 때 필요한 레이블(분류 기록)의 지정 작업이 또 하나의 난관이다. 데이터가 많을수록, 분석하기 까다로울수록 레이블 지정에 수고와 비용이 많이 든다.


구글 USM이 배운 세계 각국의 언어들. 출처 = 구글 블로그



수많은 언어 데이터를 알맞게, 그리고 효율 좋게 분석해서 인공지능에게 가르칠 알고리듬(명령을 수행하는 절차)도 찾아내야 한다. 이 알고리듬은 수많은 데이터를 원활하게 받아들여야 하며 수시로 개선해도 교육에 영향을 주지 않아야 한다. 새로운 언어(데이터)의 목소리와 문장을 접해도 혼동하지 않고, 이전과 같은 방식으로 받아들이는 유연성도 발휘해야 한다.

구글은 먼저 300여 개 언어의 목소리 데이터 1,000만 시간 분량을 레이블 지정 작업 없이 USM에게 가르쳤다. 여기에 가장 많은 자원을 할당했다. 이어 두 번째로 300여 개 언어의 문장 데이터 280억 개를 가르치면서 이를 분석하는 인코더(데이터를 신호로 바꾸는 기능), 목소리 인코더와 문장 인코더를 합치는 알고리듬을 새로 적용했다. 동시에 레이블 지정 작업을 하지 않은 목소리 데이터, 레이블 지정 작업을 한 목소리 데이터(200만 시간 분량)와 문장 데이터 모두를 USM에게 가르쳤다. 세 번째로 USM을 미세 조정(기존 데이터로 인공지능을 다시 훈련시키는 절차)하면서 알고리듬이 얼마나 모델링(인공지능이 데이터를 분석해 알고리듬을 만드는 과정)을 잘 하는지 검증했다.


구글이 USM을 가르친 과정. 출처 = 구글 블로그



구글은 USM의 능력을 파악하려고 유튜브의 다국어 목소리 데이터를 제시했다. 이 다국어 목소리 데이터는 73개 언어로 구성됐는데, 각 언어당 3,000시간 미만의 분량만 있을 정도로 규모가 작았다. 그럼에도 구글 USM은 다국어 목소리 데이터를 듣고 평균 30% 미만의 단어 오류율(WER, Word Error Rate, 음성 인식이나 기계 번역의 성능을 측정하는 기준)을 기록했다. 이는 지금까지 나온 음성 인공지능 가운데 가장 우수한 수치다. 구글 USM은 음성 번역도 잘했다. BLEU(BiLingual Evaluation Understudy, 언어간 기계 번역의 품질을 평가하는 기준)실험 결과, 여기에서도 지금까지 나온 음성 인공지능 가운데 가장 우수한 성적을 냈다.

세계에는 7,000개 이상의 언어가 있다고 알려졌다. 구글 USM은 극소수 사람만 쓰는 언어라 해도, 인공지능이 원활하고 정확하게 다룬다는 것을 증명했다. 사어(사라진 언어)를 다룰 가능성도 있다. 구글 USM이 고도화를 거쳐 언어의 장벽을 허물면, 세계인 누구나 편리하게 소통하는 시대가 열릴 것으로 기대한다.

구글은 “USM은 세계의 정보를 체계화해서 누구나 쉽게 접근하도록 돕는 중요한 기술이다. 이번 성과는 1,000개 언어 이니셔티브를 구축할 토대가 될 것이다.”라고 밝혔다.

글 / IT동아 차주경(racingcar@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 해외여행에서 외국어 소통, 번역앱으로 이렇게![이럴땐 이렇게!]▶ 디지털 취약 해소할 배리어 프리·인공지능 키오스크 나온다▶ 인공지능, 위성 통신 시대 오나…MWC 2023에서 확인한 미래 키워드



추천 비추천

5

고정닉 0

2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
2552 물류의 변화, 도심 속으로 들어 온 물류거점 IT동아갤로그로 이동합니다. 23.04.10 1565 1
2551 [뉴스줌인] DDR5 지원하는 기가바이트의 H610 메인보드 출시, 쓸 만할까? IT동아갤로그로 이동합니다. 23.04.08 124 0
2550 AI로 악플잡는 네이버·카카오, 남은 과제는? [55] IT동아갤로그로 이동합니다. 23.04.07 4329 5
2549 KISA, 실생활 서비스로 블록체인 대중화 노린다 IT동아갤로그로 이동합니다. 23.04.07 99 0
2548 [농업이 IT(잇)다] 신성랩메디컬 “소재가 힘, 나노콜라겐을 세계로” IT동아갤로그로 이동합니다. 23.04.07 84 0
2547 강화하는 스마트폰-PC 연결성, 왜 기업들은 지금 '연결성' 기능을 내는가? [5] IT동아갤로그로 이동합니다. 23.04.07 1709 2
2546 AMD 자일링스, ASIC 기반 알베오 미디어 가속기 'MA35D' 공개 IT동아갤로그로 이동합니다. 23.04.06 86 0
2545 [리뷰] ‘진짜’ 미국 선생님들 수업이 한가득, ‘아웃스쿨’ IT동아갤로그로 이동합니다. 23.04.06 126 0
2544 지금 지원할 수 있는 예비 창업자 프로그램 IT동아갤로그로 이동합니다. 23.04.06 351 0
2543 공공배달앱 대부분이 외면받아… 업계 “홍보·수익방안 마련해야” [24] IT동아갤로그로 이동합니다. 23.04.06 1776 5
2542 [리뷰] AMD 라이젠 7 7800X3D 써보니··· '게이밍에선 16코어 CPU도 넘어서' [6] IT동아갤로그로 이동합니다. 23.04.05 1256 0
2541 델 테크놀로지스, 2023 기업용 신제품 공개... "국내 PC 시장 3위 목표" IT동아갤로그로 이동합니다. 23.04.05 210 0
2540 [스타트업-ing] 엑스온 장원익 대표, “버추얼 스튜디오가 가져 온 변화” [2] IT동아갤로그로 이동합니다. 23.04.05 822 0
2539 카산도 “인공지능·스마트 프랜차이즈 될 것” IT동아갤로그로 이동합니다. 23.04.05 107 0
2538 [IT신상공개] S10급 성능의 보급형 스마트폰? 갤럭시 A34, 살 만할까? [27] IT동아갤로그로 이동합니다. 23.04.04 2467 4
2537 스타트업 창업 전 알아야 할 투자 라운드 특징 IT동아갤로그로 이동합니다. 23.04.04 168 0
2536 인기 인공지능 서비스 연이어 중단, 업계 “자정할 것” [15] IT동아갤로그로 이동합니다. 23.04.04 2291 3
2535 [뉴스줌인] 실속형 PC용 보급형 메인보드 칩셋, 'AMD A620' 이모저모 [7] IT동아갤로그로 이동합니다. 23.04.03 1766 1
2534 [뉴스줌인] 두나무, ‘크립토 겨울’ 실적 급감에 수익 다각화 모색 IT동아갤로그로 이동합니다. 23.04.03 126 0
2533 “비싼 배달비·수수료, 배달앱 못 쓰겠다” 불만 터진 이용자들 [35] IT동아갤로그로 이동합니다. 23.04.03 2889 7
2532 매년 갱신하는 자동차 보험, 한 눈에 비교하려면 이렇게![이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 23.04.03 1085 1
2531 [주간투자동향] 스탁키퍼, 58억 원 규모의 시리즈A 투자 유치 [1] IT동아갤로그로 이동합니다. 23.04.03 178 0
2530 [르포] 'UAM·드론·전장·전기 이륜차 한 자리에'··· '서울모빌리티쇼'의 또 다른 볼 거리는? IT동아갤로그로 이동합니다. 23.03.31 127 0
2529 [IT애정남] 이어폰, 한쪽만 들어도 되나요? IT동아갤로그로 이동합니다. 23.03.31 330 1
2528 [농업이 IT(잇)다] 팜커넥트 “농업 데이터, 선진 농업 첫걸음” IT동아갤로그로 이동합니다. 23.03.31 125 0
2527 [리뷰] 상위 1% 성능, MSI 타이탄 GT77HX 13VI로 살펴본 13세대 인텔 코어 i9-13950HX [14] IT동아갤로그로 이동합니다. 23.03.30 1939 4
2526 AWS코리아 "스타트업 해외 진출 고민, AWS 인프라로 적극 지원할 것" IT동아갤로그로 이동합니다. 23.03.30 129 0
2525 헤어테크 기업 ‘부드러운돌멩이’, "NHN 협업 툴 두레이로 디지털화 대응" IT동아갤로그로 이동합니다. 23.03.30 105 0
2524 S23 출시하며 스마트싱스 스테이션 뿌린 삼성, ‘매터’가 뭐길래? [4] IT동아갤로그로 이동합니다. 23.03.29 1078 0
2523 홍익대학교 이근 미술대학장, “시뮬레이션할 수 있는 디자인이 필요합니다” [26] IT동아갤로그로 이동합니다. 23.03.29 1746 16
2522 스타트업 창업자에게 유용한 투자 유치 관련 정보 IT동아갤로그로 이동합니다. 23.03.29 160 0
2521 [리뷰] 손 맛도 살리고 편의성도 OK, 마이크로닉스 메카 ZK1 기계식 게이밍 키보드 [11] IT동아갤로그로 이동합니다. 23.03.28 1894 0
2520 [농업+IT=스마트팜] 4. 환경 데이터 수집용 센서 구축하기 (1) IT동아갤로그로 이동합니다. 23.03.28 130 0
2519 택시 서비스 기업 “요금 나눠서 여럿이 싸게 타세요” [12] IT동아갤로그로 이동합니다. 23.03.28 2037 0
2518 일상에 스며든 블록체인 서비스 IT동아갤로그로 이동합니다. 23.03.28 122 0
2517 [메타버스에 올라타자] 3. 전 세계 메타버스 시장 현황 IT동아갤로그로 이동합니다. 23.03.28 183 0
2516 [마인드테크 시대가 온다] 3. 명상테크, 스스로하는 마인드 케어 IT동아갤로그로 이동합니다. 23.03.28 103 0
2515 웨스턴디지털, '샌디스크 프로페셔널' 라인업 추가··· "전문가용 경험 확대" IT동아갤로그로 이동합니다. 23.03.28 130 0
2514 日 JOLED 사실상 파산, 韓·中 OLED 2파전 굳혀 [60] IT동아갤로그로 이동합니다. 23.03.28 3218 16
2513 레드햇 앤드류 해브굿 부사장 “파트너십 확대, 한국 기업 글로벌 진출 도울 것” IT동아갤로그로 이동합니다. 23.03.27 166 0
2512 [리뷰] 최대 96GB 통합 메모리로 성능·효율 다 잡았다, 애플 맥북 프로 16 [26] IT동아갤로그로 이동합니다. 23.03.27 2409 3
2511 [IT하는법] 껐다 켜는 게 다가 아니다, 알면 도움 되는 '시스템 소리' 설정 IT동아갤로그로 이동합니다. 23.03.27 149 0
2510 [주간투자동향] 크로커스, 64억 원 규모의 시리즈B 투자 유치 완료 IT동아갤로그로 이동합니다. 23.03.27 98 0
2509 모니터 돌리고 세워 쓰려면 이렇게![이럴땐 이렇게!] [8] IT동아갤로그로 이동합니다. 23.03.27 4575 10
2508 ‘보이지 않는’ 핵심 시스템을 개발합니다, 인포플라의 백엔드 개발자 이야기[스타트업人] IT동아갤로그로 이동합니다. 23.03.27 91 0
2507 [IT신상공개] 새 폴더블폰 화웨이 메이트 X3, 갤럭시Z 폴드4와 차이는? [29] IT동아갤로그로 이동합니다. 23.03.27 3112 3
2506 [뉴스줌인] 상업적 이용도 OK, 올해도 무료 글꼴 배포한 가비아 IT동아갤로그로 이동합니다. 23.03.24 148 1
2505 [IT애정남] 갤럭시 워치에 교통카드를 넣고 싶어요 [6] IT동아갤로그로 이동합니다. 23.03.24 1120 6
2504 [IT강의실] 알아두면 좋은 게이밍 이어폰 특징·사양 [7] IT동아갤로그로 이동합니다. 23.03.24 928 1
2503 [시드팁스] 스니커즈 정은애 대표, "실시간 초개인화 정보, 스트릿 캐스터가 답합니다" IT동아갤로그로 이동합니다. 23.03.24 97 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2