인공지능 · 디지털인문학 · 인터뷰 ·
[인터뷰] 언어의 장벽을 허무는 코드 – 학술대회 대상 부산소마고 권민재 학생을 만나다
"모든 연령대의 국민이 언어 장벽 없이 정보를 이해하고 소통할 수 있는 환경을 조성하는 데 기여할 것이다."
2026 동계 청소년 IT학술대회 디지털인문학 트랙 대상 수상한 부산소프트웨어마이스터고등학교 권민재 학생과의 인터뷰를 진행해 보았다.
소프트웨어 개발을 전공하면서 인문학적 주제인 '우리말 순화'에 관심을 갖게 된 특별한 계기가 있나요?
AI EXPO 2025 국제인공지능대전에 출품할 작품을 뽑는 교내대회를 나가기 위해 요즘 사회 문제는 어떤 것들이 있는지 살펴보았습니다. 그러다가 '외래어 남용'이라는 키워드가 눈에 들어왔고, "요즘 신조어도 많이 나오는 마당에 심각하긴 하지.." 라는 생각을 혼자 했었습니다.
그 후, 선생님과 얘기를 나누다가 우연히 생기부 작성에 대한 대화를 한적이 있었습니다. 저희 학교는 소프트웨어마이스터고등학교이기 때문에 "레거시 코드를 리팩토링했다.", "자바에서 코틀린으로 마이그레이션했다." 등의 외래어를 사용하며 수업을 진행할 수 밖에 없습니다. 하지만, 생활기록부에서는 교육부 지침상 외래어 사용을 자제해야 한다고 합니다.
이 말씀을 듣고, '우리말 순화'라는 것이 정말 일상 속에 필요하며 그 무엇보다 중요한 것이라고 느끼게 되었습니다.
'규제 샌드박스' 같은 단어가 누군가에게는 정보 격차를 심화시키는 장벽이 된다는 문제의식이 인상적입니다. 평소에도 일상 속 불편함을 기술로 해결하려는 습관이 있으신가요?
네, 있습니다. 저는 개발을 좋아하는 학생이기 때문에 Python을 통해서 자동화하는 것을 재밌어 합니다. 2025년 제가 부산소프트웨어마이스터고등학교의 부회장일 때, 선후배 간 멘토링을 진행하기 위해서 많은 양의 설문을 진행했던 적이 있습니다. 그 당시, 여러 정보들이 파편화 되어 있다보니 통계를 내기도 어려웠고, 한 눈에 보기도 정말 힘들었습니다.
이런 일상 속의 불편함을 해결하기 위해 Python과 Pandas를 이용하여 학생들의 정보를 조인하여 관리했던 기억이 있습니다. 사소한 불편함이더라도 그냥 지나치지 않고, 해결하려고 하는 제 태도가 이런 연구를 할 수 있게 뒷받침 해준 것 같습니다.
디지털 인문학 트랙은 기술만큼이나 '인간에 대한 이해'가 중요한데, 본인의 연구가 어떤 점 때문에 심사위원들의 마음을 움직였다고 생각하시나요?
제가 생각했을 때는 우리말 순화를 위해 개발한 복합 스코어링 RAG 기법을 검증하기 위해, 실제 국어 전공자분들을 섭외하여 진행했기 때문이라고 생각합니다. 디지털 인문학은 '인간의 감성, 감정'을 자극하는 것이 굉장히 중요하다고 생각합니다. 우리말이 순화가 잘 되었는지를 nDCG, LLM-as-a-Judge 등의 방식으로 검증하는 것은 인간이 이해하고 사용하는 언어를 판단하고, 점수 매기기에는 오히려 반발심이 생길 수도 있겠다는 생각이 들었습니다.
그렇기에, '본 연구의 RAG 기법을 통해 나온 순화어를, 실제 사람이 보고 마음에 끌려했다.' 라고 말씀드린 것이 마음을 움직이게 한 것 같습니다.
기존 사전 매칭 방식의 한계를 극복하기 위해 외래어의 음운적 구조를 학습한 LSTM 모델을 사용하셨습니다. '카라멜'이나 '캐러멜' 같은 변형 표기를 음절 단위로 쪼개어 학습하며 가장 기억에 남았던 '특이한 외래어'는 무엇이었나요?
저는 '빵'이라는 외래어가 가장 기억에 남습니다. 음운적 구조를 통해 학습시켜야 겠다고 가설을 세운 뒤, 실제 학습된 모델을 기반으로 F1-score를 측정하고 있었습니다. 그러던 중, '빵'이라는 단어가 외래어로 감지가 되었고, 저는 해당 단어가 외래어인 줄 몰랐기에 하루종일 어떻게 해결해야 할지 고민하고 있었습니다.
결국, 혼자서 해답을 찾지 못하고 제 파트너인 Gemini에게 도움을 구했습니다. 그러니 갑자기 Gemini가 "빵은 외래어니까 걱정 안 해도 돼!" 라고 말을 했습니다. '빵'이 외래어였다는 것을 알고, 한편으로는 "LSTM 모델이 학습이 잘 되었구나" 라는 기쁨이 있었지만, "난 이때까지 뭘 고민한거지" 라는 마음도 있었기에 '빵'이 가장 기억에 남는 특이한 외래어인 것 같습니다.
국립국어원 데이터뿐만 아니라 Google Trends의 실사용 빈도까지 반영하는 RAG 기반 시스템을 구축하셨습니다. "사람들이 실제로 쓰는 말"을 데이터에 포함하겠다고 생각한 아이디어는 어디서 얻으셨나요?
연구의 고도화를 위해 더 많은 정보를 찾던 중, 하나의 글을 발견했습니다. "외래어를 사용하는 이유가 무엇인가요?" 라는 질문에 많은 사람들이 "지금 있는 순화어들은 입에 안 붙어요.", "뭔가 외래어의 의미가 잘 나타나지 않은 것 같아요." 등의 답변을 하는 것을 보았습니다.
그 순간, "국립국어원에서 제공하는 순화어들을 그대로 RAG 시스템에 사용한다면 실제로 사람들이 잘 사용하지 않는 표현들을 추천하게 되는 것이 아닐까?" 라는 생각이 들었습니다. 그렇기에 순화어를 추천할 때, 순화어에 대한 사람들의 선호도(이해도), 실사용 빈도, 문맥 적합도를 복합 스코어링 기법을 통해 골고루 고려해야 겠다는 아이디어를 내게 되었습니다.
의미론적 캐싱 기법을 통해 응답 시간을 2.4초에서 0.8초로 획기적으로 줄이셨습니다. 실시간성이 중요한 공문서나 방송 환경을 고려한 실무적인 접근인데, 이 기법을 도입하기 전과 후의 사용자 경험 차이를 어떻게 체감하시나요?
복합 스코어링 기법을 적용한 RAG 시스템을 개발하고 있던 중, "문서 작성 환경에서 사용할 것을 고려하면 실시간성이 굉장히 중요한데, 많은 분들이 이 시간을 기다려주실까?"라는 생각이 들었습니다. 그리고 사실 사람들이 사용하는 외래어가 한정된 경우가 대부분이기에 "많이 사용되는 외래어는 좀 바로 반환하는게 효율적이지 않나?" 라는 생각이 들었습니다.
그렇기에, 한 번 만들어진 순화어가 다른 문장에서의 문맥에서 사용될 수 있다면 바로 반환시키는 '의미론적 캐싱 기법'을 연구하고 적용시켰습니다. 이를 실제 문서 편집기와 비슷한 환경에 API로 연결한 뒤, 사용을 해보았더니 정말 체감이 될 정도로 획기적인 단축이 되었다는 것을 느꼈습니다. 이번 경험 덕분에 더욱 사용자의 편의를 고려하는 개발자로 성장할 수 있었습니다.
부산대학교 국어교육과 전공자 53명을 대상으로 설문조사를 진행하셨습니다. 고등학생으로서 대학 전공자들에게 조언을 구하고 데이터를 수집하는 과정이 쉽지 않았을 텐데, 가장 큰 도움을 주신 분께 이 자리를 빌려 한마디 하신다면?
본 연구의 가장 큰 목적은 외래어를 우리말로 순화하는 것이기 때문에 '순화어가 외래어의 의미를 잘 가지면서 사람들의 선호에 맞게 추천되었는지?' 에 대한 검증이 가장 중요했습니다. 하지만 이를 일반인이 하기에는 전문적이지 않으며, 연구 결과가 일관되지 않게 될 것이라 생각했습니다.
그렇기에 국어 전공자 한 분 한 분을 모시기 위해, 저희 학교 국어 선생님이신 '진예빈 선생님'께 먼저 부탁을 드렸습니다. 근데 저희 선생님께서 연구를 정말 좋게 봐주시고, 도와주시기 위해 부산대학교 김중수 교수님 포함 국어교육과 전공자 52분을 연결해주셨습니다.
대상의 자리를 빌려 제 첫 연구가 성공적으로 끝날 수 있게 도와주신 부산소프트웨어마이스터고등학교 '진예빈 선생님', 부산대학교 '김중수 교수님' 외 국어교육과 전공자 52분께 다시 한 번 감사의 말씀을 드립니다.
부산소프트웨어마이스터고에서의 생활은 어떤가요? 기숙사에서 친구들과 코딩하다가 농담을 주고받기도 하나요?
네, 많이 주고 받는 것 같습니다. 저희 학교 학생들은 대부분 개발자를 목표로 하기 때문에 매일 밤마다 개발 공부를 하거나, 프로젝트를 하는 것 같습니다. 만약 혼자서 공부를 한다면 휴대폰과 침대의 유혹 때문에 목표했던 것을 이루지 못하고 끝나버리는 경우가 많지만, 마음이 잘 맞는 친구와 룸메이트를 한다면 더욱 열정이 생겨서 오래 하게 되는 것 같습니다.
저희 학교는 2인 1실로 기숙사를 이용합니다. 덕분에 한 명의 룸메이트와 끈끈한 유대관계를 형성할 수 있었으며, 서로 모르는 것은 바로바로 물어봐서 서로의 선생님이 되어준 적도 있었습니다.
가끔씩 심심하면 인스타그램에서 재밌는 코딩 관련 릴스를 보내는 문화도 있는 것 같습니다.
이메일 주소가 개인 도메인을 사용하시는 걸 보니 개발자로서의 정체성이 확고해 보입니다. 본인만의 포트폴리오 사이트나 블로그를 운영하는 노하우가 있다면요?
저는 포트폴리오를 노션(Notion)으로 관리하고 있습니다. 고등학교 1학년 때까지만 해도 포트폴리오 준비에 대한 생각을 하지 못해서 프로젝트가 끝난 후, 회고를 하지 않았습니다. 그렇게 "나는 다 기억나!" 라는 마음으로 1년을 보내고 포트폴리오를 만드려고 하니, 막상 아무것도 기억에 남지 않았습니다.
그때부터 모든 프로젝트에 대한 회고를 하기 시작했으며, 사소한 트러블 슈팅이더라도 모두 문서로 남겨두는 습관을 만들었습니다. 또한, 대회에 나갈 때도 그 대회가 어땠는지, 나는 준비한대로 잘 했는지, 질문은 어떤 것을 받았는지를 모두 복기하는 습관도 만들었습니다. 이런 습관 덕분에 포트폴리오를 만드는 것이 정말 쉬워졌습니다.
또한, 최근 제가 공부한 내용을 다른 사람들에게 알려주는 것에 흥미를 느꼈습니다. 그래서 claude와 함께 저만의 기술 블로그를 만들고 제 서버에 배포를 했습니다. 아직은 많은 글을 작성하지 않았지만, 시간이 날 때마다 차근차근 활동하려 합니다. 이 자리를 빌려 한 번만 홍보하고 가겠습니다. https://blog.kwon5700.kr 입니다. 감사합니다.
학교생활 중 가장 즐거운 시간은 언제인가요? 밤늦게까지 코딩이나 논문 작업을 할 때 힘이 되어준 최애 간식이나 습관이 있다면 소개해 주세요.
저는 석식을 먹은 후, 10교시가 시작하기 전까지의 쉬는 시간을 정말 좋아합니다. 저희 학교는 노을이 정말 예쁩니다. 가끔씩 밥을 빨리 먹고, 제가 좋아하는 노래를 들으며 운동장을 걷다보면 노을이 지는 것을 볼 수 있을 때가 많습니다. 하루종일 노트북과 패드만 보며 개발 또는 연구를 하다가 노을을 바라보면 그 순간만큼은 아무생각 안 들고 행복해집니다.
저희 학교는 11시쯤 소등을 합니다. 그 후에는 기숙사 방에서 자유롭게 있을 수 있으며, 대부분의 학생들은 그 시간에 프로젝트나 공부를 하며 지내고 있습니다. 그렇게 1~2시간이 지나면 입도 좀 심심해 지고, 집중도 안 됩니다. 저는 그럴 때, 몰래 일요일 입소날에 사온 '꼬북칩 초코맛'을 꺼내서 룸메랑 나눠 먹습니다. 달달한 간식을 먹어야지 힘이 나기 때문에 여러분들도 연구하실 때, '꼬북칩 초코맛' 드셔보시길 강력히 추천드립니다.
만약 졸업 후 바로 취업하게 된다면, 가장 가고 싶은 기업이나 연구소는 어디인가요? 그곳에서 어떤 문제를 해결하는 엔지니어가 되고 싶으신가요?
저희 학교는 3학년 재학 기간 중 취업을 목표로 하고 있습니다. 그렇기에 저도 취업을 목표로 하고 있는 중입니다. 아직까지 가고 싶은 기업이나 연구소를 정하지는 못 했습니다. 다만, 2학년 수학여행으로 실리콘밸리를 갔던 경험이 제 마음을 울렸기 때문에 추후에 실리콘밸리 AI 엔지니어가 되는 것을 장기적인 목표로 하고 있습니다.
취업을 했을 때, 저는 그곳에서 딱딱한 데이터로 사람들을 부드럽게 이해키시는 AI를 개발하는 엔지니어가 되고 싶습니다. 이번 연구에서도 사람들이 AI가 추천해주는 순화어를 보고, 선호하며 실사용성 있다고 말하도록 노력했습니다. 아직까지 AI를 부정적으로 생각하시는 분들이 많은 것으로 알고 있습니다. 그렇기에 저는 궁극적으로 '사람과 AI 사이의 간극을 줄여주는 AI 엔지니어'가 되고 싶습니다.
연구 과정에서 참고한 수많은 논문 저자들 중 가장 영감을 준 인물이나, 본인이 닮고 싶은 엔지니어 상이 있다면 무엇인가요?
저는 '리누스 토르발스'라는 개발자를 존경하고 있습니다. '리누스 토르발스'는 리눅스 커널과 Git을 개발한 사람입니다. 현재 리눅스 커널과 Git은 개발자에게 없어서는 안 될 존재들입니다. 그 말은 즉, 그가 마음만 먹었다면 엄청난 돈을 벌 수 있었다는 것입니다. 하지만, 그럼에도 불구하고 그는 이 모든 것을 오픈소스로 공개함으로써 수많은 개발자가 함께 발전시킬 수 있는 기반을 만들었습니다.
이러한 모습은 저에게 금전적 이익보다 공동체의 발전을 더 높이하게 된 큰 울림이 되었습니다. 저 역시 현재는 돈보다 명예와 기여의 가치를 더 소중히 여기며, AI를 통해 사회에 긍정적인 영향과 혁신을 남기고자 노력하고 있습니다.
이번 연구를 진행하며 선생님이나 친구들에게 받았던 도움 중 가장 기억에 남는 말이 있다면 무엇인가요?
저희 지도교사이신 '박소영 선생님'께서 저에게 해주셨던 말인 "해보는 거지" 라는 말이 가장 기억에 남습니다. 사실 큰 의미를 담은 말은 아닙니다. 하지만 어떻게 해야하고, 뭐부터 시작해야 할지 모르겠는 상황에서 제가 무엇이든 시작할 수 있게 첫 단추를 끼워주셨습니다.
저는 평소 완벽해야 한다는 강박이 조금 있습니다. 그렇기에 완벽하지 않으면 시작하기를 무서워하는 경우가 있었습니다. 이런 상황에서 선생님께서 그냥 해보는 거라고 말씀해 주셨고, 그 덕분에 실패와 불완전함이 별게 아니라는 것을 느끼며 성장할 수 있었습니다. '박소영 선생님' 덕분에 제 첫 연구가 성공적으로 끝날 수 있었던 것 같습니다. 앞으로도 꾸준히 노력하겠습니다. 다시 한 번 감사드립니다.
'한국어 특화 LLM'을 활용해 더 자연스러운 순화어를 추천하겠다는 계획을 밝히셨습니다. 민재 학생이 만들고 싶은 '언어 장벽 없는 세상'의 최종 모습은 어떤 것인가요?
본 연구는 아직까지 일반적인 사람들이 선호하며 제일 많이 사용하는 순화어 데이터를 기반으로 외래어를 순화해주는 한계가 있습니다. 이는 세대, 전공, 배경 등을 고려하지 않았다는 것을 의미합니다. 제가 꿈꾸는 언어 장벽 없는 세상의 최종 모습은 '세대, 전공, 배경에 관계없이 누구나 같은 정보를 같은 깊이로 이해할 수 있는 환경을 제공하는 것'입니다.
단순히 어려운 외래어로 인해, 누군가가 정보의 습득과 배움의 기회를 잃는다면 그것은 정보의 문제가 아니라 언어의 문제라고 생각합니다. 전공 단어, 배경지식 등으로 인한 외래어를 어떻게 순화해야 할지는 계속 생각해 봐야 할 과제입니다.
이를 위해 저는 세대, 전공, 배경을 함께 고려하는 맞춤형 순화 모델로 발전시키는 것을 최종 목표로 삼고 있습니다. 궁극적으로는 언어가 누군가를 소외시키지 않고, 모두를 연결하는 다리가 되게 만드는 것이 제가 생각하는 '언어 장벽 없는 세상의 최종 모습'입니다.
인문학적 소양과 기술적 역량을 결합하는 '디지털 인문학' 분야에 도전하려는 후배들에게 해주고 싶은 조언이 있나요?
'디지털 인문학'은 중·고등학생이 연구하기에 가장 적합한 분야라고 생각됩니다. 학교에서 배우는 국어, 사회, 역사 등 모든 인문학적인 요소와 연관지을 수 있으며 학교에는 여러분들을 도와주실 많은 선생님들이 계시기 때문입니다.
만약 후배님들께서 '디지털 인문학'에 도전하시려고 한다면, '어떻게 하면 연구를 보는 사람의 마음을 울릴 수 있을까?' 라는 고민을 해보시는 것을 추천드립니다. 실제 연구를 보는 것도 사람이고, '인문학'이라는 단어 자체도 '인간의 근원적인 문제와 표현 활동을 탐구하는 학문'이기 때문입니다.
고민하고 계신다면 그냥 시작해 보는 것을 추천드립니다. 여러분들 스스로를 믿고, 좋아하는 연구를 계속 하다보면, 원하는 결과 꼭 이루실 수 있을 겁니다. 응원합니다.
한국정보기술신문 인공지능분과 김주호 기자 news@kitpa.org