한국정보기술진흥원
한국정보기술신문
thumbnail

인공지능 · 정보보안 ·

LLM 에이전트, 익명 온라인 계정 신원 추적 가능, 대규모 탈익명화 현실화...익명 게시물 몇 개만으로 거주지·직업·관심사 추론 후 웹 검색으로 신원 특정

발행일
읽는 시간2분 24초

연구진, 레딧·링크드인·익명 인터뷰 데이터셋 대상 실험서 높은 정밀도 확인

[한국정보기술신문] 대형언어모델(LLM) 에이전트가 익명 온라인 게시물만으로 실제 사용자의 신원을 특정할 수 있다는 연구 결과가 나왔다. 연구자 사이먼 레르멘(Simon Lermen)이 2026년 2월 24일 발표한 논문 '대규모 온라인 탈익명화(Large-Scale Online Deanonymization with LLMs)'는 이 같은 공격 방식이 이미 실용적 수준에 도달했으며, 향후 수천만 명 규모의 플랫폼 전체로 확대될 수 있다고 경고한다.

연구진은 개인이 온라인에서 남기는 소수의 댓글로부터 LLM이 거주 지역, 직업, 관심사를 추론한 뒤 웹 검색을 통해 해당 인물을 찾아낼 수 있음을 실험으로 입증했다. 몇 가지 속성의 조합만으로도 한 사람을 고유하게 특정할 수 있다는 사실은 이미 알려져 있었지만, 데이터가 비정형 형태로 존재하는 경우가 많아 실제 탈익명화는 숙련된 조사자가 직접 단서를 추적해야 했다. 그러나 이번 연구는 LLM이 이 과정을 자동화하고 대규모로 수행할 수 있음을 보여준다.

두 가지 벤치마크 설계

연구팀은 실제 익명 사용자를 탈익명화하는 윤리적 문제를 피하기 위해 두 가지 프록시 벤치마크를 구축했다.

첫 번째는 '플랫폼 간 매칭'이다. 자신의 링크드인(LinkedIn)을 연결해 둔 해커뉴스(Hacker News) 계정에서 직접 식별 정보를 제거한 뒤, LLM이 익명화된 해커뉴스 계정을 올바른 링크드인 프로필과 연결할 수 있는지 측정했다. 임베딩 기반 검색으로 가장 유력한 후보 100개를 추린 후 LLM 추론 단계를 더하자 대부분의 계정을 높은 정밀도로 재식별하는 데 성공했다.

두 번째는 '분할 계정 매칭'이다. 레딧(Reddit) 사용자의 게시 이력을 시간 순서 또는 활동 커뮤니티(서브레딧) 기준으로 인위적으로 두 계정으로 나눈 뒤, LLM이 이를 다시 같은 사람의 것으로 연결할 수 있는지를 실험했다. LLM 임베딩과 추론을 결합한 방식은 서브레딧 활동 패턴과 메타데이터에 기반한 넷플릭스 프라이즈 방식의 기존 기준선을 크게 웃돌았다.

수만 명 규모로도 확장 가능

후보군이 수만 명으로 늘어나도 LLM 기반 공격의 정밀도는 완만하게만 감소했다. 연구진은 이를 바탕으로 충분한 컴퓨팅 자원이 주어진다면 이미 플랫폼 전체 규모의 공격이 가능하며, 미래 모델에서는 성능이 향상되는 동시에 비용은 더욱 낮아질 것이라고 전망했다. 연구팀은 1억 명 규모까지의 외삽 분석도 제시했다.

연구진은 앤트로픽(Anthropic)이 공개한 인터뷰어 데이터셋에도 탈익명화를 시도했다. 이 데이터셋은 과학자들의 AI 활용에 관한 익명 인터뷰를 담고 있다. 연구팀의 에이전트는 125명 중 9명을 수동 검증을 통해 신원 확인하는 데 성공했다. 해당 데이터셋에는 정답 데이터가 존재하지 않아 수동 검증 방식을 채택했다.

플랫폼·AI 기업·개인이 취할 수 있는 대응

연구진은 단기적으로 가장 효과적인 완화 수단은 데이터 접근 제한이라고 강조했다. 플랫폼은 API 접근에 대한 요청 속도 제한 적용, 자동화된 스크래핑 탐지, 대량 데이터 내보내기 제한 등을 통해 대규모 공격의 비용을 높일 수 있다. 또한 익명 계정도 실제 신원과 연결될 수 있다는 전제 아래 데이터 접근 정책을 수립해야 한다고 권고했다.

AI 기업 차원에서는 거부 가드레일과 사용 모니터링을 활용할 수 있으나 한계도 분명하다. 탈익명화 공격은 프로필 요약, 임베딩 계산, 후보 순위 지정 등 겉으로는 무해해 보이는 개별 작업으로 분해되기 때문에 오남용을 탐지하기 어렵다. 또한 오픈소스 모델의 경우 안전 가드레일 자체를 제거할 수 있어 이러한 완화책이 적용되지 않는다.

개인 이용자에게는 온라인에서 공유하는 세부 정보 하나하나가 신원 특정의 단서가 될 수 있음을 인식하는 강화된 보안 의식이 필요하다고 연구진은 조언했다. 거주 도시, 직업, 참석한 콘퍼런스, 틈새 취미 등의 조합은 종종 고유한 디지털 지문이 된다. 연구진은 "스마트한 조사자 팀이 당신의 게시물만으로 신원을 파악할 수 있다면, LLM 에이전트도 마찬가지이며 그 비용은 계속 낮아지고 있다"고 경고했다.

한국정보기술신문 인공지능분과 권지현 기자 news@kitpa.org