3개 부문 수상
▲ (왼쪽부터) 강석주 교수, 김경훈 석사과정
본교 전자공학과에 재학 중인 김경훈 석사과정생(지도교수 강석주)이 ‘2020 네이버 AI RUSH 경진대회’에 참가하여 총 3개 부문에서 우수한 성적을 거두었다. 네이버가 주최하는 이번 대회는 자연어 처리와 이미지 분석, 음성 인식 등 다양한 분야의 문제들을 해결하는 AI 프로젝트로, 지난 7월부 터 2달에 걸쳐 진행되었다. 김경훈 학생은 자연어 처리 분야의 ‘스팸 메일 분류’ 문제에서 2등, 이미지 및 텍스트 처리 분야의 ‘음원 분류’ 문제에서 2등, 이미지 처리 분야의 ‘네이버쇼핑 리뷰 이미지 자동 태깅’ 문제에서 3등의 성적을 거두었고, 총상금 1,700만 원과 네이버 입사 시 서류 및 실기 시험이 면제되는 혜택을 받게 되었다.
김경훈 학생은 각 부문에서 자신만의 방식을 활용하여 문제 해결에 두각을 나타냈다. 먼저 ‘스팸 메일 분류’ 문제에서 제목보다는 본문에서 스팸 내용이 많다는 사전 경험을 활용하여 대회 초반부터 좋은 성적으로 시작하였고, 모델 학습 시 테스트 데이터셋과 유사한 분포도를 갖는 학습 데이터셋 샘플을 추출하여 학습할 수 있도록 하는 계층적 데이터 추출 방법을 활용하여 높은 성능을 달성했다. ‘음원 분류’ 문제에서는 음원뿐만 아니라 음원의 메타데이터인 앨범, 작곡가, 아티스트, 트랙 정보를 추가로 활용하였으며, 주파수 도메인과 시간 도메인에 대한 데이터 증강 방법을 사용하여 부족한 데이터셋 문제를 해결했다. 마지막으로 ‘쇼핑 리뷰 이미지 자동 태깅’ 문제에서는 분류 이미지 별로 데이터 분포가 불균형한 문제가 있었는데, 언더 샘플링(under sampling)을 적절히 활용하여 분포 문제를 해결하고 앙상블 기법을 통해 성능을 올렸다.
짧은 기간 동안 3개 과제에서 우수한 성적을 달성한 소감에 대해 김경훈 학생은 “프로젝트별로 해결해야 하는 문제점을 빨리 파악하고 실제 경험한 사전 지식을 적극 활용하여 다양한 실험을 해본 것이 도움이 되었다“고 말했다. 또한, 수상 소감 및 앞으로의 계획에 대해 “실제 연구현장에서 쓰이는 데이터를 직접 다뤄보며 머신 러닝 및 딥 러닝 기술을 상용 서비스에 접목할 때 어떠한 문제들을 연구하는지 알 수 있었던 좋은 기회였고, 이번 수상 경험을 바탕으로 다양한 분야에 심도 있는 연구에 매진할 것”이라고 전했다.