인공지능 · 인터뷰

[인터뷰] 데이터로 읽는 대한민국의 내일 – 학술대회 금상 전남과고 문윤주·윤창빈·이도운 학생을 만나다

2026년 3월 22일
5분
thumbnail.webp
"OpenAlex를 활용한 분석 과정을 통해 세계 연구 구조 속에서 대한민국 연구의 강점과 한계를 분야별로 드러내고, 정량 지표를 어떻게 해석해야 하는지에 대한 기초적 시사점을 제공한다."
2026 동계 청소년 IT학술대회 빅데이터분석 트랙 금상 수상한 전남과학고등학교 문윤주·윤창빈·이도운 학생과의 인터뷰를 진행해 보았다.
단체jpg - 1412윤창빈.jpg
전남과학고등학교 문윤주·윤창빈·이도운 학생

고등학생으로서 전 세계 연구 트렌드와 '대한민국 연구 경쟁력'이라는 다소 거시적인 주제를 선택하기 쉽지 않았을 것 같습니다. 이 거대한 질문에 답해보기로 결심한 결정적인 계기는 무엇인가요?

저희는 과학고에서 R&E, 탐구논문 등 다양한 연구 활동을 하면서 자연스럽게 “우리나라의 연구 수준은 세계에서 어느 정도 위치에 있을까?”라는 질문을 자주 하게 되었습니다. 주변 친구들 역시 각자의 연구 주제를 가지고 활동하다 보니, 개별 연구를 넘어 국가 전체의 연구 역량과 구조에 대한 궁금증이 생겼습니다.하지만 관련 자료를 찾아보면 대부분 논문 수나 국가 순위 중심으로만 제시되어, 실제 연구의 영향력이나 분야별 강점과 약점을 충분히 이해하기는 어려웠습니다. 특히 과학고에서 연구를 직접 경험할수록, 단순한 수치만으로 연구 수준을 평가하는 것이 적절한지에 대한 의문이 들었습니다.
그래서 막연한 인식이 아니라, 공개 데이터를 활용해 전 세계 연구 흐름 속에서 대한민국의 위치를 구조적으로 분석해보고자 했고, 이러한 문제의식이 이번 연구의 출발점이 되었습니다.

유료인 Scopus나 Web of Science 대신 공개 데이터베이스인 'OpenAlex'를 선택하셨습니다. 오픈 소스 데이터가 과학 기술의 대중화와 연구에 어떤 가치를 준다고 생각하시나요?

OpenAlex를 선택한 가장 큰 이유는 접근성과 투명성입니다. 기존의 Scopus나 Web of Science는 유료 데이터베이스이기 때문에 개인이나 학생이 활용하기에는 한계가 있습니다. 반면 OpenAlex는 누구나 동일한 데이터를 활용할 수 있고, 분석 과정과 결과를 공개하면 다른 사람도 동일한 결과를 재현할 수 있습니다. 저희는 이러한 공개 데이터 환경이 연구의 문턱을 낮추고, 학생이나 개인 연구자도 실제 연구에 참여할 수 있도록 만든다는 점에서 큰 의미가 있다고 생각합니다. 오픈 소스 데이터는 과학기술 연구를 더 많은 사람에게 열어주는 중요한 기반이라고 생각합니다.

세 분의 역할 분담은 어떻게 이루어졌으며, 의견 충돌이 있을 때는 어떻게 해결하셨는지 궁금합니다.

데이터 수집과 전처리, 분석 코드 작성, 시각화와 결과 정리 등으로 역할을 나누어 연구를 진행했습니다. 의견 차이가 있을 때는 단순히 토론으로 결론을 내기보다는, 서로 다른 방법을 실제로 적용해 결과를 비교하는 방식을 사용했습니다. 데이터를 기준으로 판단하다 보니 자연스럽게 합의에 도달할 수 있었고, 이러한 과정이 연구의 신뢰성을 높이는 데에도 도움이 되었습니다.

반도체 분야는 세계 3위권의 고효율 성과를 보인 반면, 인문학 분야는 지표가 낮게 나타났습니다. 단순히 "숫자가 낮으니 실력이 없다"고 결론짓지 않고 "데이터베이스 포착의 한계"로 해석한 통찰력이 돋보입니다. 이런 비판적 사고는 어떻게 기르게 되었나요?

연구를 진행하면서 가장 많이 고민한 부분은 “이 숫자가 무엇을 의미하는가?”였습니다. 특히 인문학 분야는 단행본 중심의 출판 구조나 국내 언어 사용 비중이 높기 때문에, 국제 학술 데이터베이스만으로 평가할 경우 실제 연구 활동이 과소 반영될 수 있다고 판단했습니다.
단순히 수치를 비교하는 것이 아니라, 그 수치가 만들어진 구조와 학문 분야의 특성을 함께 이해하려고 노력했습니다. 저희의 분석 주제 자체도 단순한 성과 비교가 아니라, 각 분야의 연구 환경과 특성을 고려한 구조적 비교에 초점을 두고 있었습니다. 이러한 관점을 바탕으로 결과를 해석하다 보니, 숫자 자체보다 그 뒤에 있는 연구 환경과 데이터의 한계를 함께 보는 것이 중요하다는 점을 배울 수 있었습니다.

분석 과정을 하나의 스크립트로 통합해 누구나 결과를 재현할 수 있게 설계하셨습니다. '나만 아는 분석'이 아닌 '공유하는 연구'를 지향하게 된 이유가 있나요?

저희는 결과보다 분석 과정이 더 중요하다고 생각했습니다. 같은 데이터를 사용하면 누구나 동일한 결과를 얻을 수 있어야 연구의 신뢰성이 높아진다고 판단했습니다.
그래서 데이터 수집부터 전처리, 분석, 시각화까지의 과정을 하나의 스크립트로 통합하여, 동일한 조건에서 결과를 재현할 수 있도록 설계했습니다. 연구는 개인의 결과가 아니라 공유되고 검증될 수 있어야 한다고 생각합니다.

학교 기숙사에서 늦은 밤까지 데이터 수집을 돌려놓고 기다리던 순간들이 있었을 것 같습니다. 지루한 데이터 수집 시간을 버티게 해준 팀원들만의 '소울 푸드'나 즐거움이 있었나요?

이도운: 주로 코드를 실행시키고 지켜볼 땐 버거킹에서 치킨 버거랑 감자튀김을 먹으면서 기다렸던 것 같습니다.
윤창빈: 달달한 초콜릿이나 하리보 젤리를 먹으며 머리를 환기하려 했습니다. 팀원들과 함께 학교 이야기와 미래에 관한 이야기를 하며 즐거움을 찾았습니다.
문윤주: 음식보다는 딸기 라떼 같은 음료수를 많이 먹었던 것 같고, 학교생활과 학교 졸업 이후에 관한 얘기들을 했었습니다.

팀원 중 '꼼꼼한 데이터 정제 전문가'는 누구이고, '화려한 시각화 마스터'는 누구인가요? 서로의 개발 스타일을 한 단어로 표현한다면?

이도운: 윤주는 빠른시간안에 원하는 결과를 뽑아내지만, 좀 꼼꼼하진 않아 이번에 시각화 쪽에서 큰 역할을 했습니다. 창빈이는 논문 검토 등 섬세한 작업에서 좋은 역량을 지녔습니다.
윤창빈: 윤주는 데이터 시각화를 잘합니다. 게으른 천재라고 할 수 있을 것 같네요. 도운이를 표현하자면 뭐든 해낼 수 있는 친구입니다. 무언가 같이 하자 하면 함께 하고, 무엇이든 되게 하는 역량을 가지고 성과를 냅니다.
문윤주: 도운이는 뭔가를 믿고 맡길 수 있는 친구 같습니다. 데이터 분석이든, 자료 찾기든 도운이에게 믿고 맡겨 두면 항상 결과가 따라오고 마음속으로 이건 해결했다고 생각하며 안심이 되기도 하더라고요. 창빈이는 대회를 알아오기도 하고, 사람을 모으기도 하며, 일정에 따라 차분하게 계획을 세우고, 생각지도 못한 부분에서 바꿀만한 부분이나 개선할 만한 부분을 찾는 리더십을 가진 것 같습니다.

논문 마지막에 인용 네트워크 분석이나 특허 데이터 연계 등 향후 연구 방향을 언급하셨습니다. 대학에 진학해서도 이 연구를 확장해보고 싶은 생각이 있으신가요?

대회 진행 중에 저희의 분석에 대해 부족한 점에 대해 몇가지 알려주셨습니다. 예를 들면 2025년의 인용수와 2023년의 인용수는 논문이 나온 기간이 달라 인용수에 대해 차이가 생길 수 있다는 점을 처리하지 않은 점 같은 부분을 보완하면 더 좋은 연구가 될 수 있을 것 같습니다. 이러한 부분들을 바탕으로 졸업하기 전에 연구를 확장해 보는 것이 좋을 것이라 생각합니다.

대한민국 연구 경쟁력을 분석해본 사람으로서, 10년 뒤 여러분은 어떤 분야에서 대한민국의 경쟁력을 높이는 사람이 되어 있을까요?

이도운: 아무래도 컴퓨터 쪽에 관심이 많다 보니 컴퓨터 보안이나 AI쪽 분야에서의 경쟁력을 책임지는 사람이 되고 싶습니다.
문윤주: 이번 연구를 통해서 우리나라에서 쓰여진 몇몇의 고인용 논문들은 직접 읽어보기도 하였는데, 저는 그 중에서 흥미가 생겼던 부분이자, 우리나라가 전 세계에서 선두하고 있는 반도체 분야에서 경쟁력을 높이고 있을 것 같습니다.
윤창빈: 전자공학 또는 반도체 분야 쪽에서 활동할 것 같습니다. 사람들에게 혁신적인, 예를 들어 계산방식이 기존과 다른 노이즈를 활용한 반도체를 상용화 하는 것과 같이 사람들을 놀래키고, 세상에 도움이 될 수 있는 영향력을 가진 대한민국의 경쟁력을 높이는 사람이 되고 싶습니다.

"파이썬도 모르는데 빅데이터 분석을 할 수 있을까?" 고민하는 후배들에게 가장 먼저 설치하라고 권하고 싶은 라이브러리나 공부법이 있다면 무엇인가요?

빅데이터 분석을 처음 시작하는 후배들에게는 복잡한 모델보다 Python의 pandas나 matplotlib 같은 기본적인 데이터 처리 도구부터 직접 다뤄보는 것을 권하고 싶습니다. 데이터를 직접 정리하고 시각화해 보는 경험이 가장 좋은 출발점이라고 생각합니다.

이번 연구를 진행하며 선생님이나 친구들에게 받았던 도움 중 가장 기억에 남는 말이 있다면 무엇인가요?

지도 선생님께서 “결과보다 왜 그런 결과가 나왔는지를 설명할 수 있어야 한다” 라고 말씀해주신 것이 가장 기억에 남습니다. 이 말이 연구 방향을 잡는 데 큰 도움이 되었습니다.

지금 이 순간에도 전남과학고 진학을 꿈꾸며 입시 공부에 매진하고 있을 후배들에게, "과학고에 오면 단순히 공부를 잘하는 것을 넘어 이런 멋진 연구를 할 수 있다"는 동기부여의 한마디를 해준다면 무엇일까요?

과학고에서는 정답을 맞히는 공부를 넘어, 스스로 질문을 만들고 데이터를 통해 답을 찾아가는 경험을 할 수 있습니다. 궁금한 점이 있다면 직접 확인해보는 과정 자체가 큰 성장으로 이어진다고 생각합니다!
한국정보기술신문 인공지능분과 김주호 기자 news@kitpa.org