인공지능 · 교육 · 학제간융합 ·
국립중앙도서관, AI 기반 검색서비스로 KDC 분류체계 혁신 선도
'AI 기반 요약 및 검색' 시범서비스 개시...6,400여 권 공공간행물에서 답 찾는 인공지능 검색 도입
[한국정보기술신문] 한국십진분류법(KDC)은 1964년 처음 제정된 후 60여 년간 대한민국의 대표적인 도서분류체계로 자리잡아왔다. 한국도서관협회 분류위원회에서 간행하는 이 분류법은 듀이십진분류법을 기반으로 하되 한국의 정보환경에 맞도록 주류 배열과 조기표를 추가하여 조정되었다. 현재 국내 공공도서관의 90% 이상이 KDC를 사용하고 있으며, 대학도서관에서도 동양서 분류에 광범위하게 활용되고 있다.
KDC는 모든 지식 분야를 총류(0), 철학(1), 종교(2), 사회과학(3), 자연과학(4), 기술과학(5), 예술(6), 언어(7), 문학(8), 역사(9)와 같이 10개의 주류로 1차 구분한 다음, 각 주류를 다시 10개로 나누어 강목으로 세분화하는 십진분류법의 원리를 따른다. 현재 사용되고 있는 KDC 6판은 2013년에 발행되어 전국 도서관에서 표준 분류체계로 활용되고 있다.
국립중앙도서관의 AI 검색 혁신
국립중앙도서관은 최근 'AI 기반 요약 및 검색' 시범서비스를 개시하여 도서관 서비스의 디지털 혁신을 주도하고 있다. 이 서비스는 인공지능이 이용자의 질문을 이해하고 해당 질문에 대한 답을 도서의 본문 속에서 찾아 제시해주는 혁신적인 기능을 제공한다. 예를 들어 "인공지능이 창작한 음악의 저작권은 누구 소유?"라는 질문을 검색창에 입력하면, 소장 도서의 본문에서 관련 답변을 찾아 제시한다.
이번 시범 서비스는 국립중앙도서관 소장 공공간행물 6,400여 권의 본문 속에서 답을 찾을 수 있도록 개발되었다. 이를 통해 이용자는 알고 싶은 내용을 사람에게 질문하듯이 문장 형태로 질문함으로써 방대한 도서 자료 속에서 원하는 답을 신속하게 찾을 수 있게 되었다.
이번 AI 검색 서비스는 기계독해(Machine Reading Comprehension) 및 도서·논문 생성요약(Abstractive Summarization)을 위한 '인공지능 학습용 데이터 구축' 사업의 결과물로 만들어졌다. 국립중앙도서관은 지난해 AI 전문기업인 ㈜포티투마루, ㈜바이브컴퍼니와 업무협약을 체결하고, 소장자료 중 저작권의 제한이 없는 공공간행물과 오픈액세스 논문 약 5만여 건을 AI 데이터 구축을 위한 원천 데이터로 제공하였다.
이를 통해 기계독해 AI 데이터 100만 건, 요약 AI 데이터 20만 건이 구축되었으며, 구축된 데이터는 AI Hub를 통해 누구나 이용할 수 있도록 공개된다. 이는 국가 차원의 AI 인프라 구축에도 기여하는 의미있는 성과로 평가받고 있다.
도서관 빅데이터 활용사례의 확산
국립중앙도서관은 매년 '도서관 빅데이터 우수 활용사례 및 아이디어' 공모전을 개최하여 도서관 데이터와 공공데이터를 활용한 혁신적인 서비스 개발을 촉진하고 있다. 이 공모전은 공공도서관을 포함한 전 관종 도서관, 민간기업, 개인을 대상으로 하며, 특히 도서관 데이터와 공공데이터 융합을 통한 테마 데이터 분석에 중점을 두고 있다.
'도서관 정보나루'와 '사서의사결정지원서비스 솔로몬' 등의 빅데이터 서비스를 통해 전국 공공도서관의 주요 현황과 서지 데이터, 대출 데이터, 대출도서 순위 등 다양한 유형의 도서관 빅데이터가 제공되고 있다. 지역대표도서관을 중심으로 총 38개 협력도서관에서 수집된 183만여 건의 도서관 데이터가 분석 플랫폼을 통해 활용되고 있다.
AI 시대 사서의 역할 변화
국립중앙도서관은 최근 '도서관 인재 역량 개발 강연회'를 개최하여 'AI 시대에 도서관의 역할 변화와 미래 발전 방향'을 모색했다. 이 강연회에서는 AI 기술이 도서관 환경에 미치는 영향과 디지털 전환 시대의 사서 역할을 중심으로 논의가 이뤄졌다.
생성 AI 환경에서 도서관은 정보 편향의 문제를 극복하고 정보 불평등 해결에 기여할 수 있는 중요한 역할을 담당하게 되었다. 도서관이 보유한 균형적인 시각을 통해 상용 AI 서비스가 가져올 수 있는 편향성과 불평등 문제를 완화하는 데 도움을 줄 수 있다.
국립중앙도서관의 국가전자도서관은 디지털 컬렉션을 통해 디지털서고, 책·사람·세상, 세계의 도서관, 전시컬렉션 등 다양한 주제와 형식으로 디지털 지식정보의 통합검색 서비스를 제공하고 있다. 국립중앙도서관 소장원문을 유형별, 주제별로 큐레이션하여 제공하는 시스템이 구축되어 있다.
디지털도서관은 노트북 이용석, 원문 DB석, 미디어자료이용석, 스튜디오, 미디어편집석, 세미나실 등 다양한 공간으로 구성되어 있으며, 각각 온라인 예약 시스템을 통해 이용할 수 있다. 특히 미디어편집석에서는 포토샵이나 프리미어프로 등의 전문 프로그램을 활용한 창작 활동이 가능하다.
해외 도서관 AI 활용 동향
대만국립공공정보도서관(NLPI)은 2024년 8월 말 대규모언어모델 GPT-4o와 임베딩 모델 기술을 결합한 'AI 도서 추천' 서비스를 출시했다. 이 서비스는 도서관 소장 자료의 서지 특징과 이용자의 독서 취향을 분석한 다음 맞춤형 추천 도서 목록을 제공하는 혁신적인 서비스로 주목받고 있다.
미국의 피어스 카운터 도서관, 오마하 공공도서관, 덴버 공공도서관 등 많은 도서관이 커뮤니티 커넥트 웹 솔루션을 활용하여 지역의 인구 통계 데이터를 분석하고 있다. 이를 통해 지역주민들의 관심사와 이용 요구를 파악하여 적합한 서비스를 제공하고 있다.
KDC 분류체계의 지속적 개선
2019년 연구에 따르면 어린이도서 분류를 위한 KDC 6판의 개선 방안이 제시되었다. 서울시교육청 20개 도서관의 어린이도서 주제별 통계 분포를 바탕으로 중분류, 소분류로 간략화할 분야와 세분화가 필요한 항목들이 분석되었다. 이러한 연구는 향후 KDC 개정 시 어린이도서의 간략판 개발에 기여할 것으로 기대된다.
KDC의 장점 중 하나는 한국의 실정에 가장 잘 맞도록 설계되었다는 점이다. 서양 위주로 편성된 DDC와 달리 한국이 제일 앞에 배치되어 있고, 세계의 다른 지역도 비교적 균형있게 배치되어 있어 검색이 용이하다.
도서관 빅데이터 분석활용 시스템을 통해 각종 데이터 분석을 기반으로 도서관 특성에 적합한 수서 업무를 지원하고, 다른 도서관과의 연계를 통한 빅데이터 분석 결과가 제공되고 있다. 이용자 데이터를 활용하여 도서 검색 및 이용자별 독서 성향을 분석하고 이에 따른 맞춤형 도서 추천 기능을 제공하는 서비스도 개발되었다.
전문도서관의 디지털 전환 동향
한국전문도서관협의회는 "디지털 전환 시대를 대비한 전문도서관의 활동"이라는 주제로 세미나를 개최했다. 이 세미나에서는 디지털 큐레이션 성숙도 측정 모델 개발, 일제강점기 농업관련 자료의 디지털이미지 구축, 빅데이터를 활용한 주제 분야 트렌드 예측 등이 발표되었다. 이러한 사례들은 전문도서관에서도 소장 자료의 디지털화와 데이터 관리 및 활용에 대한 관심이 높아지고 있음을 보여준다.
국가도서관통계시스템을 통해 전국 등록 공공도서관의 관리 운영 현황이 체계적으로 수집되고 분석되고 있다. 2024년 기준 공공도서관 통계조사 결과보고서와 운영평가 지침 등이 정기적으로 발표되어 도서관 정책 수립의 근거자료로 활용되고 있다.
이러한 통계 데이터는 KDC 분류체계와 연계되어 국내 지식 생산 동향과 이용자 선호도를 파악하는 중요한 자료로 활용되고 있다.
김희섭 국립중앙도서관장은 "인공지능 대전환의 시대를 맞이하여 도서관이 AI 데이터 중심 지식 허브로 도약할 수 있도록 사서들의 AI 리터러시 역량 강화를 적극 지원하겠다"고 밝혔다. 국립중앙도서관은 더 많은 자료를 대상으로 '책에서 답을 찾는 인공지능 검색'이 가능해지도록 서비스를 확대해 나간다는 계획이다.
빅데이터는 도서관의 비전과 전략 수립에 도입하거나 지역사회를 지원하고 맞춤형 정보서비스를 제공하기 위한 근거를 제시하는 등 효과적으로 활용될 수 있다는 연구 결과가 제시되었다. 다만 데이터의 정확성이나 신뢰성, 개인정보보호, 윤리적 이슈 등에 대한 지속적인 관심과 대응이 필요하다.
생성 AI 환경에서 도서관은 지식의 보고이자 지식의 대중화를 위한 공간이라는 전통적 역할을 지속하면서도, 정보 편향성 해결과 정보 불평등 완화라는 새로운 사회적 역할을 담당하게 되었다. KDC는 이러한 변화를 뒷받침하는 핵심 인프라로서 그 가치가 더욱 높아지고 있다.
한국정보기술신문 인공지능분과 김주호 기자 news@kitpa.org