한국정보기술진흥원한국인공지능올림피아드 (KOAI) 2026 개최안내

ZIP 파일 용량 30% 줄이는 기술 공개...호환성 유지하면서

개발자 에반 한이 ZIP 파일 크기를 대폭 줄이면서 호환성은 유지하는 ZIP Shrinker 도구를 공개했다.
[한국정보기술신문] 개발자 에반 한이 ZIP 파일을 더 작게 압축하면서도 기존 추출 프로그램에서 호환되도록 하는 ZIP Shrinker 도구를 발표했다. ZIP 파일은 여러 파일을 묶어 저장하는 형식으로 널리 쓰이는데, 불필요한 메타데이터 때문에 용량이 낭비되곤 한다.
beatriz-perez-moya-XN4T2PVUUgk-unsplash.jpg
Unsplash 제공

세 가지 최적화 기법

ZIP Shrinker는 세 가지 방식으로 파일 크기를 줄인다. 첫째는 고성능 재압축 알고리즘인 libdeflate를 사용한다. 각 파일에 더 많은 계산 시간을 투자해 더 높은 압축률을 달성한다. 둘째는 ZIP 파일에 포함된 주석 같은 불필요한 메타데이터를 제거한다. 셋째는 디렉터리 항목을 별도로 저장하지 않는다. 대부분의 추출 프로그램이 파일 경로에서 폴더 구조를 유추할 수 있기 때문이다.

실제 효과 입증

한의 테스트 결과, 리눅스 소스코드는 5.62% 크기 감소를 기록했고, 안드로이드 앱 패키지는 30.06% 감소 효과를 보였다. ZIP 기반 형식인 APK, EPUB, JAR 파일에도 동일하게 적용할 수 있다.

호환성 완벽 유지

가장 중요한 특징은 표준 ZIP 추출 도구와의 완벽한 호환성이다. 압축된 파일도 일반 추출 프로그램으로 정상 작동한다. 이는 서비스 운영자들이 사용자들에게 불편을 주지 않으면서도 저장 비용과 네트워크 전송 비용을 절감할 수 있음을 의미한다.

대규모 데이터 서비스에 유용

특히 프로젝트 구텐베르크 같은 대량의 파일을 배포하는 서비스나, 클라우드 스토리지 서비스들에 실질적인 가치를 제공할 수 있다. 서버 저장 공간 절감과 다운로드 대역폭 감소는 직접적인 운영 비용 절감으로 이어진다.
한국정보기술신문 정보기술분과 최수하 기자 news@kitpa.org

함께 읽으면 좋은 기사

하와이 마우나로아 5월 평균 CO2 432.34ppm '역대 최고'...전년比 1.83ppm 상승, 최근 3년 기록적 급증세는 다소 꺾여

하와이 마우나로아 5월 평균 CO2 432.34ppm '역대 최고'...전년比 1.83ppm 상승, 최근 3년 기록적 급증세는 다소 꺾여

학제간융합 4
CU 편의점 택배 BGF네트웍스 해킹, 고객 개인정보 무더기 유출...웹 취약점 뚫려 연계정보(CI)까지 노출, 크리덴셜 스터핑 2차 피해 우려

CU 편의점 택배 BGF네트웍스 해킹, 고객 개인정보 무더기 유출...웹 취약점 뚫려 연계정보(CI)까지 노출, 크리덴셜 스터핑 2차 피해 우려

정보보안 3
칙센트미하이 몰입 이론, 도전과 역량 균형 이룰 때 최고의 행복 경험...몰입 위한 8가지 조건 제시

칙센트미하이 몰입 이론, 도전과 역량 균형 이룰 때 최고의 행복 경험...몰입 위한 8가지 조건 제시

교육 3
무료 인증서기관 '렛츠인크립트', 양자내성 웹 보안 전환 청사진 공개...'머클트리 인증서'로 접속 데이터 안 늘리고 양자 위협 대비, 2027년 정식 도입 목표

무료 인증서기관 '렛츠인크립트', 양자내성 웹 보안 전환 청사진 공개...'머클트리 인증서'로 접속 데이터 안 늘리고 양자 위협 대비, 2027년 정식 도입 목표

인공지능 · 정보보안 4
구글, 노트북서 구동되는 멀티모달 AI '젬마 4 12B' 공개...인코더 없는 통합 구조로 음성·이미지 직접 처리

구글, 노트북서 구동되는 멀티모달 AI '젬마 4 12B' 공개...인코더 없는 통합 구조로 음성·이미지 직접 처리

인공지능 2
UC버클리 컴퓨터과학 수업서 낙제율 급등...교수들 "AI 과의존·수학 기초 부족이 원인"...CS 10 낙제 35%로 학과 기준 5배, 한 강의는 AI·인터넷 허용 시험까지

UC버클리 컴퓨터과학 수업서 낙제율 급등...교수들 "AI 과의존·수학 기초 부족이 원인"...CS 10 낙제 35%로 학과 기준 5배, 한 강의는 AI·인터넷 허용 시험까지

교육 · 인공지능 4
프로그래밍 언어 '엘릭서' 1.20 공개...타입 표기 없이도 모든 코드 자동 검사해 '확정 버그' 잡아낸다...개발자가 따로 손댈 일 없이 오탐도 적어, 4년 연구의 첫 결실

프로그래밍 언어 '엘릭서' 1.20 공개...타입 표기 없이도 모든 코드 자동 검사해 '확정 버그' 잡아낸다...개발자가 따로 손댈 일 없이 오탐도 적어, 4년 연구의 첫 결실

정보기술 4
호주 연구진, 격자 지도 경로 탐색 'A*' 최대 수십 배 빠르게 하는 '점프 포인트' 기법 발표...최적 경로 보장하면서 사전 작업도 추가 메모리도 필요 없어

호주 연구진, 격자 지도 경로 탐색 'A*' 최대 수십 배 빠르게 하는 '점프 포인트' 기법 발표...최적 경로 보장하면서 사전 작업도 추가 메모리도 필요 없어

인공지능 5
한국어로 AI 쓰면 토큰 3~5배 더 소비…같은 구독료에 받는 서비스는 3분의 1, "영어로 묻고 한국어로 받아라"

한국어로 AI 쓰면 토큰 3~5배 더 소비…같은 구독료에 받는 서비스는 3분의 1, "영어로 묻고 한국어로 받아라"

인공지능 · 오피니언 4
마이크로소프트, 상시 작동 AI 에이전트 '스카우트' 공개...오토파일럿 첫 제품으로 팀즈·아웃룩 등 M365 전반 연동, 프런티어 통해 실험 출시

마이크로소프트, 상시 작동 AI 에이전트 '스카우트' 공개...오토파일럿 첫 제품으로 팀즈·아웃룩 등 M365 전반 연동, 프런티어 통해 실험 출시

인공지능 3
게임 트리 알고리즘, 인공지능 의사결정의 뼈대로 주목...미니맥스·알파베타 가지치기가 핵심 원리

게임 트리 알고리즘, 인공지능 의사결정의 뼈대로 주목...미니맥스·알파베타 가지치기가 핵심 원리

인공지능 2
정부, 8천억대 국산 '온디바이스 AI반도체' 개발 국책사업 확정...자동차·가전·로봇·방산 4대 업종에 풀스택 지원, 6월 공고해 7월 착수

정부, 8천억대 국산 '온디바이스 AI반도체' 개발 국책사업 확정...자동차·가전·로봇·방산 4대 업종에 풀스택 지원, 6월 공고해 7월 착수

인공지능 · 반도체 · 유관기관 3