디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

라인의 경쟁력과 안정성, '함께 회고하는 개발 문화가 토대'

IT동아갤로그로 이동합니다. 2021.12.14 14:27:31
조회 51 추천 0 댓글 0
[IT동아 남시현 기자] “IT(정보 기술) 서비스에서의 장애는 기술의 문제며, 근본적인 문제의 원인을 파악하는 게 중요하다. 추정하거나 경험만 갖고 판단하는 게 아니라, 사실 관계와 로그(Log, 기록), 데이터를 기반으로 분석한 것을 토대로 논의해야 한다. 이것이 기본이자 핵심이다”


라인 플랫폼 엔지니어링 3팀 이수안 개발 리드. 출처=IT동아



라인플러스 사무실에서 만난 라인 플랫폼 엔지니어링 3팀 이수안 개발 리드에게 서비스 장애에 대한 근본적인 대처 방안을 묻자 돌아온 대답이다. 오늘날 서비스 장애는 모든 개발자들에게 주어진 숙제이자 성장책이다. 서비스 장애라는 어감이 부정적이기는 하지만, 의외로 장애는 서비스를 개선하는 과정에서 필연적으로 발생하는 현상이며 이를 극복하는 방법이나 과정이 더욱 중시되고 있다. 만약 서비스 장애가 발생하지 않는 사례가 있다면, 오히려 개발이 정체되어 있다고 보는 시각도 있을 정도다. 그렇다면 글로벌 기술 기업에서는 서비스 장애를 어떻게 받아들이고, 또 어떻게 극복해나가고 있을까?

장애에 대한 대처, 라인에게 듣다


라인(LINE)은 전 세계 2억 명의 이용자를 보유하고 있는 글로벌 서비스로, 설립 이후부터 지금까지 끊임없이 서비스 장애를 해결하기 위한 절차와 방안을 모색해왔다. 이날 인터뷰에 응한 이수안 개발 리드는 2005년 네이버에 합류해 사용자용 서비스를 개발해오다가, 2011년 라인 초창기부터 라인에 합류해 라인 플랫폼 서버를 개발하는 등 오늘날 라인의 중추를 만든 핵심 개발자 중 한 명이다. 이수안 개발 리드에게 라인의 서비스 장애 대처 방법부터 이를 극복해나갈 수 있는 원동력인 개발 문화에 대해 들어보았다.


Life on LINE은 라인의 슬로건이다. 출처=라인



이수안 개발 리드가 이끌고 있는 라인 플랫폼 엔지니어링 3팀은 한국과 일본 개발자들이 한 팀처럼 조직되어 있으며, 라인 앱 전체 트래픽을 다루는 ‘라인 플랫폼 서버’를 개발 및 관리한다. 라인 플랫폼 서버는 라인 내 메시징 플랫폼과 라인 서비스를 통해 로그인하는 계정 서버, 라인 스토어 및 라인 공식 계정, 개발자 플랫폼, 오픈 채팅 등 주요 서비스의 기반이 되는 서버다.

가장 먼저 라인의 장애 대책과 관련된 전반적인 흐름에 대한 설명을 부탁했다. 이수안 개발 리드는 “초창기에는 라인의 서버 전체가 내려가는 등의 문제도 있었지만, 지금은 그런 문제보다는 국소적인 장애들이 많이 발생한다. 특히 작은 문제 여러 개가 겹쳐서 큰 문제로 커지는 경우가 있기 때문에 장애의 수준과 관계없이 동일한 위기로 보고 해결하고 있다”라고 대답했고, 장애 처리 과정은 크게 세 단계로 구분했다. 일단 문제가 있으면 이를 인지한 다음, 장애에 대응해 복구에 돌입하고, 그다음 결과 보고서를 작성하는 게 큰 틀이다.


라인 플랫폼 엔지니어링 3팀 이수안 개발 리드. 출처=IT동아



문제를 인지하는 과정은 개발자가 직접 알람을 개발해 스스로 인지하기도 하지만, 누구든지 장애를 발견하면 서로 연락할 수 있는 전용 채널이나 협업 툴을 통해 소통하는 게 문화로 정착해있다. 또 내부에 모니터링 시스템이 있어서 모니터링 전문가가 개발자에게 연락을 주기도 한다. 이렇게 인지된 장애는 개발 리더들이 기틀을 잡고, 개발자들이 라인과 슬랙을 통해 실시간으로 내용을 공유해 문제를 해결한다. 마지막으로 해결 과정을 결과 보고서로 작성해 전파한다. 결과 보고서는 최소 1 근무일 이내 1차 보고가 원칙이며, 클라이언트의 동작 상태나 영향을 받은 숫자들, 실패 건수 등이 모두 분석된 문제 상황을 작성하고, 어떻게 대응했으며 어떤 과정을 도입했는지 등을 상세하게 적어 제출한다.

전 세계 사용자 2억 여명, 안정성 확보가 최우선



2019년 1월 1일 0시 0분 발생한 트래픽 스파이크에 대한 그래프. 출처=라인



라인이 철저한 문제 해결 과정을 수립한 이유는 서버 안정성(Reliability) 때문이다. 메신저 기능에서는 메시지가 제때 전송되고, 문제없이 동작하는 것이 서버 안정성의 의미다. 문제가 생기면 곧 서비스 자체의 신뢰성에 문제가 생기는데, 재작년에 이런 일이 있었다. 매년 1월 1일 0시 0분은 연간 트래픽의 최고치를 달성하는 시점이다. 그래서 개발자들은 3~4개월 전부터 이를 대비하지만, 2019년에는 평소 트래픽의 최대 3배에 달하는 초당 41만 건의 메시지가 쏟아져 메시지 도착 알림 일부가 유실되는 문제가 발생했다. 이후 문제점을 확인하고 6개월 이상 작업을 진행한 결과, 2020년과 올해에는 문제가 발생하지 않았다. 문제 해결의 배경에는 개발자들이 허심탄회하게 의견을 나누는 ‘장애 회고 미팅’이 있었다.

장애 회고 미팅은 결과 보고서를 놓고 사후에 문제점을 논의하는 과정으로, 직급 여하와 관계없이 누구나 참석해 의견을 낸다. 이수안 개발 리드는 “장애 회고 미팅은 실수나 책임을 묻는 자리가 아니라, 왜 문제가 발생했는지에 대한 사실 관계를 찾아가는 과정이다. 문제가 발생한 원인부터 확인된 배경, 문제가 된 설정을 반영한 이유 등에 대해 논의하고, 추후에 개선점까지 발굴한다”라고 말했다. 이 과정은 각국의 라인 개발자들이 참석하며, 전문 통역사가 배석해 영어로 작성된 장애 보고서를 토대로 질의 응답을 주고 받는다”라고 말했다.


라인의 개발 문화는 주인의식 갖기, 열린 자세, 신뢰와 존중으로 축약할 수 있다. 출처=라인



장애 회고 미팅이 자리 잡은 배경에는 라인의 개발자 문화가 있다고 말했다. 이수안 개발 리드는 “장애 회고 미팅은 라인의 세 가지 덕목인 주인의식 갖기(Take Ownership), 열린 자세(Be Open), 그리고 신뢰와 존중(Trust and Respect)을 모두 담은 과정이다. 문제에 대한 주인 의식과 해결을 위한 열린 자세, 그리고 개발자 간의 신뢰와 존중이 모두 녹아있다”라면서, “엔지니어가 성장하는 과정은 실수를 통해 배우고, 이를 놓치지 않는 것에서부터 시작한다. 문제가 생겨도 모두가 함께 있음을 믿고 도전할 수 있도록 하는 게 장애 회고 미팅의 의의”라고 답했다.

문제를 되짚는 문화가 곧 기업의 경쟁력



이수안 개발 리드는 ‘라인 데브 데이 2021’에서 장애 회고 미팅과 처리 과정 등을 소개한 바 있다. 출처=IT동아



이수안 개발 리드는 지난 11월 10일에서 11일 양일간 진행된 ‘라인 데브 데이 2021’에서 ‘라인 플랫폼 서버의 장애 대응 프로세스와 문화’라는 이름으로 서버 안정성에 대한 절차와 과정, 문화를 소개한 바 있다. 이날 인터뷰로 소개한 내용이 단순한 내부 절차에 그치지 않고, 개발자 생태계에 보탬이 되길 바라서다. 이수안 개발 리드는 “우리의 문화는 문제를 인정하는 것을 넘어서 무엇을 배웠는가를 논한다. 이런 문화 덕분에 문제가 발생해도 개인이 아닌 팀으로 움직이며, 개선의 대상이 시스템 오류로 끝나지 않고 팀의 문화와 절차, 더 나아가 시스템 자체가 된다”라고 말했다.

라인이 글로벌 기업으로 성장할 수 있었던 배경은 문제의 규모를 막론하고 놓치지 않는 섬세함, 그리고 작은 문제도 국경을 넘어서 의견을 나눌 정도의 열린 사고방식 덕분이다. 실제로 장애 회고 미팅을 진행하다 보면 한국과 일본, 대만 등 각국의 개발자들마다 문제를 바라보는 시선이나 성향이 달라서 서로 배우는 계기가 된다고 한다. 이러한 노력이 쌓일수록 개인은 발전을 거듭하며, 기업은 곧 경쟁력을 확보한다. 라인의 개발 문화가 그 어떤 기업보다도 회자되는 이유다.

글 / IT동아 남시현 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 카카오톡VS라인, 검색 기능은 어떻게 다를까?▶ 라인에 줄 선 신입 IT 개발자들, '네카라쿠배'가 뭐길래?▶ 라인 AI CEO와의 대담, '라인은 세상을 발전시키기 위해 인공지능을 연구'



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
615 [CES 2022] 엔비디아, GPU 라인업 확장··· RTX3050부터 3090 Ti까지 등장 [30] IT동아갤로그로 이동합니다. 22.01.05 2234 3
614 [CES2022] LG전자가 제시한 비전은? '스마트홈', 'ESG', '모빌리티' IT동아갤로그로 이동합니다. 22.01.05 143 0
613 [CES2022] 인텔, 노트북 및 데스크톱 12세대 코어 라인업 모두 공개 [2] IT동아갤로그로 이동합니다. 22.01.05 1163 1
612 [CES2022] AMD, 신형 노트북 CPU·GPU 공개··· 올 하반기 '젠4 CPU'도 공개 [19] IT동아갤로그로 이동합니다. 22.01.05 2671 19
611 [CES2022] CES2022에서 볼 수 있는 '올해 기술 트렌드'는? IT동아갤로그로 이동합니다. 22.01.04 106 0
610 [리뷰] 니콘의 부활 이끌 미러리스 카메라 Z9 [11] IT동아갤로그로 이동합니다. 22.01.04 759 5
609 "경쟁사 진출 환영" 자신감 드러낸 LG, OLED TV 1위 입지 굳힌다 IT동아갤로그로 이동합니다. 22.01.04 158 0
608 [리뷰] 다 함께 노래 즐기는 파티용 스피커, JBL 파티박스 온더고 [2] IT동아갤로그로 이동합니다. 22.01.03 925 0
607 [리뷰] 업계 최고들을 위한 노트북, 에이수스 젠북 프로 듀오 UX582HS [6] IT동아갤로그로 이동합니다. 22.01.03 1386 0
606 [리뷰] 눈 편안한 ‘웰빙’ 모니터, 벤큐 GW2785TC IT동아갤로그로 이동합니다. 21.12.31 112 0
605 [IT애정남] 애플케어+와 통신사 보험, 어떤 게 이득 클까? IT동아갤로그로 이동합니다. 21.12.31 1488 2
604 돌아온 이루다, '불편하지 않은 답변'이 가능하려면 [83] IT동아갤로그로 이동합니다. 21.12.31 5866 13
603 '더 나은 경험' 위해 온·오프라인 경계 허문 LG전자, CES 2022에서 빛날까? [1] IT동아갤로그로 이동합니다. 21.12.31 1560 0
602 박인서 에이비씨써클 "토양 병해 진단 키트로 세계 농업 부흥 이끌 것" IT동아갤로그로 이동합니다. 21.12.31 59 0
601 소유에 의미 두는 NFT, 디지털 작품으로 보는 건 어떨까? IT동아갤로그로 이동합니다. 21.12.31 112 1
600 주목할 사이버 위협, '5G 기반 IoT 해킹'.. 보안내재화 필요 IT동아갤로그로 이동합니다. 21.12.30 112 0
599 '올 한해 내가 가장 많이 들은 음악은?'... 스포티파이 연말결산 캠페인 '랩드' IT동아갤로그로 이동합니다. 21.12.30 81 0
598 "비대면 금융 뜬다", 그런데 소비자는 안전할까? IT동아갤로그로 이동합니다. 21.12.30 70 0
597 완전한 자율주행차 시대 눈앞, 핵심 키워드는 ‘V2X’ [1] IT동아갤로그로 이동합니다. 21.12.30 75 0
596 [모빌리티 인사이트] ‘교통약자’라는 단어가 없는 사회를 꿈꿉니다 IT동아갤로그로 이동합니다. 21.12.30 85 0
595 조각 투자 공식 통했다··· 샴페인 터뜨리는 '아트 테크' 시장 IT동아갤로그로 이동합니다. 21.12.30 147 1
594 2022년, 소상공인 위한 비대면·온라인 디지털화 지원 쏟아진다 [6] IT동아갤로그로 이동합니다. 21.12.30 1248 0
593 [스케일업] 파코웨어 (4) 메타버스 ‘컬러링 월드’ 누구나 즐기는 온라인 놀이터로 IT동아갤로그로 이동합니다. 21.12.30 57 0
592 인터넷 장애가 국가 대혼란을 야기하는 시대, 어떻게 대비해야 하나 [4] IT동아갤로그로 이동합니다. 21.12.29 1017 6
591 기업 눈높이에 맞는 'XR' 교육 시급··· 해결사로 등판한 'NIPA' IT동아갤로그로 이동합니다. 21.12.29 60 0
590 [스타트업-ing] 포인블랙 임지환 대표, "누구나 쉽게 비대면 교육을 진행할 수 있습니다" IT동아갤로그로 이동합니다. 21.12.29 54 0
589 대구창조경제혁신센터 이재일 센터장, "창업 권하는 사회··· 우리가 조력할 것" IT동아갤로그로 이동합니다. 21.12.29 80 0
588 [스케일업] 넥스트페이먼츠(3) AWS “스마트 상점 기업 해외 진출, 충분한 준비와 기술 필요 ” IT동아갤로그로 이동합니다. 21.12.29 57 0
587 [IT애정남] 집에서 전화가 잘 안 터지면? 실내 중계기로 해결 [1] IT동아갤로그로 이동합니다. 21.12.28 1005 0
586 [리뷰] NAS를 더 민첩하게, 씨게이트 아이언울프 525 M.2 NVMe SSD [5] IT동아갤로그로 이동합니다. 21.12.28 1309 0
585 '빛 좋은 개살구' 중고차, 완성차업계 진출로 해결되나? IT동아갤로그로 이동합니다. 21.12.28 62 0
584 [스케일업] “중대재해 없는 건설현장, 스마트인사이드가 물꼬 튼다” [1] IT동아갤로그로 이동합니다. 21.12.28 726 0
583 [주간투자동향] 차이코퍼레이션, 530억 원 규모의 추가 투자 유치 IT동아갤로그로 이동합니다. 21.12.28 67 0
582 투와이 "인테리어 B2B 시장에도 디지털 혁신 필요" IT동아갤로그로 이동합니다. 21.12.28 75 0
581 NIPA, XR 전문가 위한 '메타버스 캠퍼스'로 시장 성장 돕는다 IT동아갤로그로 이동합니다. 21.12.28 45 0
580 김준태 왓섭 "구독 서비스·고정비 고민, 이제 그만" IT동아갤로그로 이동합니다. 21.12.28 78 0
579 리브스메드 “혁신 수술 기구 아티센셜로 외과 로봇 수술 선도” [2] IT동아갤로그로 이동합니다. 21.12.28 1252 1
578 [DU 스타트업] 엔테로바이옴 “유산균 뛰어넘는 차세대 장내미생물 개발, 우리가 독보적” [1] IT동아갤로그로 이동합니다. 21.12.27 935 1
576 로와커피컴퍼니, "착하고 독창적인 커피로 시장 개척할 것" [5] IT동아갤로그로 이동합니다. 21.12.27 649 1
574 [스케일업] “IT 운영관리 스타트업 알릴 수 있는 창구였어요” IT동아갤로그로 이동합니다. 21.12.25 1390 0
573 자율주행차 관련 제도, 차량, 인프라까지 싹 바뀐다 IT동아갤로그로 이동합니다. 21.12.24 64 0
572 [IT애정남] 와이파이 이름 숨기기, 보안에 도움이 될까요? IT동아갤로그로 이동합니다. 21.12.24 91 0
571 [송대리의 잇(IT)트렌드] 냉동 인간, SF 영화 속 얘기만은 아니라고? IT동아갤로그로 이동합니다. 21.12.24 97 0
570 [DU 스타트업] 플루이드콤프 "높은 에너지 효율, 낮은 가격의 공기압축기" IT동아갤로그로 이동합니다. 21.12.24 69 0
569 [스케일업] ‘세이프웨이의 도전, 사람과 동행하는 저속 모빌리티 플랫폼’ IT동아갤로그로 이동합니다. 21.12.24 50 0
568 [DU 스타트업] 강승현 엔에스비에스 “노약자·장애인 돕는 ‘좋은 제품’을 세계로” IT동아갤로그로 이동합니다. 21.12.24 70 0
567 [DU 스타트업] 판도라 프로젝트 “스니커즈처럼, 한정판 피규어도 제값받고 거래해야” IT동아갤로그로 이동합니다. 21.12.24 76 0
566 키라(KIRA) 기라성 대표, "빛, 소리, 사물인터넷으로 살아있는 감성가구 만든다" [5] IT동아갤로그로 이동합니다. 21.12.24 1417 6
565 [스케일업] 에이치디에너지 (4) 상생 에너지 플랫폼, 꿈을 현실로 IT동아갤로그로 이동합니다. 21.12.24 65 0
564 [리뷰] LG 식물재배기는 정말 싹을 틔울까 - LG 틔운 [22] IT동아갤로그로 이동합니다. 21.12.23 1578 6
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2