한국정보기술진흥원한국인공지능올림피아드 (KOAI) 2026 개최안내

구글, AI 사용자 시뮬레이터 현실성 격차 해결 연구 발표...ConvApparel 데이터셋 통해 인간-AI 대화 행동 패턴 분석

thumbnail.webp
구글 연구팀이 AI 사용자 시뮬레이터의 비현실적 행동 문제 해결 방안을 제시했다.
[한국정보기술신문] 구글 연구팀이 대화형 AI 개발에서 중요한 문제점인 LLM 기반 사용자 시뮬레이터의 비현실적 행동 패턴을 분석하고 개선 방안을 제시한 연구 결과를 4월 9일 발표했다. 이번 연구는 AI 시스템 훈련에 사용되는 가상 사용자들이 실제 인간과 얼마나 다르게 행동하는지를 정량적으로 측정했다.
ConvApparel_Hero.png
구글 리서치 제공

과도한 친절성과 인내심이 문제

현재 LLM 기반 사용자 시뮬레이터들은 실제 인간과 달리 지나치게 많은 말을 하고 일관된 성격을 보이지 않으며 명확한 선호도를 표현하지 못하는 문제를 보인다. 특히 AI 에이전트가 도움이 되지 않거나 혼란스러운 응답을 해도 과도한 인내심을 보이는 비현실적 행동이 두드러진다.
구글 연구 과학자인 오퍼 메시(Ofer Meshi)와 샐리 골드만(Sally Goldman)은 이 같은 문제를 해결하기 위해 ConvApparel이라는 새로운 데이터셋을 구축했다. 이 데이터셋은 의류 쇼핑 도메인에서 4000개 이상의 인간-AI 대화를 포함하며 총 1만 5000턴의 대화 기록을 담고 있다.

이중 에이전트 프로토콜로 다양한 상황 구현

연구팀은 혁신적인 이중 에이전트 프로토콜을 도입했다. 참가자들을 무작위로 도움이 되고 효율적인 '좋은' 에이전트와 도움이 되지 않고 혼란스러운 '나쁜' 에이전트 중 하나에 배정하여 통제된 환경에서 다양한 사용자 경험을 포착했다.
평가는 세 가지 기준으로 이뤄졌다. 인간과 시뮬레이션 대화 간의 전체적인 행동 분포를 비교하는 집단 수준 통계적 일치성, 훈련된 판별기를 통해 문체 차이를 감지하는 인간다움 점수, 그리고 '좋은' 에이전트 데이터로 훈련된 시뮬레이터가 보지 못한 '나쁜' 에이전트 행동에 현실적으로 적응할 수 있는지 테스트하는 반사실적 검증이다.

데이터 기반 접근법이 효과적

연구 결과 잘 훈련된 시뮬레이터라도 감지 가능한 인공적 특성을 보이는 것으로 나타났다. 그러나 맥락 내 학습과 지도 미세 조정 등 데이터 기반 접근법이 프롬프트 기반 기준선보다 현저히 우수한 성능을 보였다. 특히 고급 시뮬레이터들은 시스템 성능 저하에 대해 현실적인 좌절 반응을 보여줘 단순한 암기가 아닌 진정한 행동 적응 능력을 입증했다.
이번 연구는 현재의 사용자 시뮬레이터에 맹목적으로 의존하는 것이 실제 대화형 AI 배포에 위험을 초래할 수 있음을 보여준다. 연구팀은 가상 사용자를 에이전트 훈련에 사용하기 전 엄격한 검증이 필요하다고 강조했다. 이는 AI 시스템의 안전성과 신뢰성 확보에 중요한 의미를 갖는다.
한국정보기술신문 인공지능분과 김성현 기자 news@kitpa.org

함께 읽으면 좋은 기사

미 정부, 앤트로픽 '미토스 5' 재배포 일부 허용...핵심 인프라 100여 곳에만 다시 연다...수출통제 2주 만에 부분 완화, 페이블 5는 결정문서 빠져 일반 공개 복귀 협의 중

미 정부, 앤트로픽 '미토스 5' 재배포 일부 허용...핵심 인프라 100여 곳에만 다시 연다...수출통제 2주 만에 부분 완화, 페이블 5는 결정문서 빠져 일반 공개 복귀 협의 중

인공지능 4
오픈AI, 차세대 모델 'GPT-5.6 솔' 프리뷰 공개...코딩·과학·보안 끌어올렸다...플래그십 솔·균형형 테라·경량 루나 3종 선보이며 역대 최강 안전장치 적용, 미국 정부와 조율해 신뢰 파트너에 우선 제공

오픈AI, 차세대 모델 'GPT-5.6 솔' 프리뷰 공개...코딩·과학·보안 끌어올렸다...플래그십 솔·균형형 테라·경량 루나 3종 선보이며 역대 최강 안전장치 적용, 미국 정부와 조율해 신뢰 파트너에 우선 제공

인공지능 4
구글 "AI로 자연재해 미리 알린다"...홍수·산불·지진 예측 한자리에...현지시간 6월 23일 'AI for the Planet' 행사서 10년간 위기 대응 성과 공개, 150여 개국 20억 명에 홍수 예보

구글 "AI로 자연재해 미리 알린다"...홍수·산불·지진 예측 한자리에...현지시간 6월 23일 'AI for the Planet' 행사서 10년간 위기 대응 성과 공개, 150여 개국 20억 명에 홍수 예보

인공지능 · 정보기술 4
엔비디아, 특화 AI '에이전트 툴킷' 공개...모델·도구·런타임 한데 묶었다...기업이 직접 다듬어 쓰는 오픈·모듈형 기반으로 안전·저비용 'AI 동료' 구축 겨냥, 생명과학·의료·보안 등 산업별 적용 확산

엔비디아, 특화 AI '에이전트 툴킷' 공개...모델·도구·런타임 한데 묶었다...기업이 직접 다듬어 쓰는 오픈·모듈형 기반으로 안전·저비용 'AI 동료' 구축 겨냥, 생명과학·의료·보안 등 산업별 적용 확산

인공지능 4
한국산업인력공단, OECD서 'AI 기반 직무능력표준 혁신' 사례 공유...GPT 활용한 'NCS 체크메이트'로 표준 형식 자동 점검...23일 OECD 국제 웨비나 패널 참여, 직업교육훈련에 AI 활용한 10개국 사례로 소개

한국산업인력공단, OECD서 'AI 기반 직무능력표준 혁신' 사례 공유...GPT 활용한 'NCS 체크메이트'로 표준 형식 자동 점검...23일 OECD 국제 웨비나 패널 참여, 직업교육훈련에 AI 활용한 10개국 사례로 소개

인공지능 · 유관기관 2
보안 연구자 발소르다 "취약점 신고는 더 이상 특별하지 않다"...AI가 흔든 보안 제보의 위상...LLM이 누구나 비슷한 취약점을 찾아내며 '귀한 통찰·기밀 유지'라는 전제가 무너져, 분류·신속 패치·예방이 새 과제로

보안 연구자 발소르다 "취약점 신고는 더 이상 특별하지 않다"...AI가 흔든 보안 제보의 위상...LLM이 누구나 비슷한 취약점을 찾아내며 '귀한 통찰·기밀 유지'라는 전제가 무너져, 분류·신속 패치·예방이 새 과제로

정보보안 3
마이크로소프트, 타입스크립트 7.0 RC 공개...컴파일러 'Go'로 다시 짜 속도 10배 끌어올렸다

마이크로소프트, 타입스크립트 7.0 RC 공개...컴파일러 'Go'로 다시 짜 속도 10배 끌어올렸다

정보기술 4
구글, 제미나이 통합 인터페이스 '인터랙션 API' 정식 출시...모델·에이전트 한 창구로 다룬다...자율 작업 수행 '관리형 에이전트'·백그라운드 실행 추가, 지난해 12월 베타 거쳐 기본 개발 도구로

구글, 제미나이 통합 인터페이스 '인터랙션 API' 정식 출시...모델·에이전트 한 창구로 다룬다...자율 작업 수행 '관리형 에이전트'·백그라운드 실행 추가, 지난해 12월 베타 거쳐 기본 개발 도구로

인공지능 · 정보기술 4
교육부·평가원, 2025년 국가수준 학업성취도 평가 결과 6월 24일 발표...전반적 성취수준·학교생활은 지난해와 비슷, '중3 수학' 1수준 학생 비율은 전년보다 늘어

교육부·평가원, 2025년 국가수준 학업성취도 평가 결과 6월 24일 발표...전반적 성취수준·학교생활은 지난해와 비슷, '중3 수학' 1수준 학생 비율은 전년보다 늘어

교육 4
삼성전자, 업계 최고 성능 'UFS 5.0' 메모리 개발...온디바이스 AI 최적의 솔루션 제시...10.8GB/s 데이터 전송 대역폭으로 차세대 스마트폰 등 모바일 기기에 탑재 예정, AI 모델·데이터 빠르게 RAM에 전달

삼성전자, 업계 최고 성능 'UFS 5.0' 메모리 개발...온디바이스 AI 최적의 솔루션 제시...10.8GB/s 데이터 전송 대역폭으로 차세대 스마트폰 등 모바일 기기에 탑재 예정, AI 모델·데이터 빠르게 RAM에 전달

반도체 · 인공지능 4
문체부, '케이-게임' IP 키운다...1,200억 원 게임 펀드 결성...넥슨 588억 원 참여, 문화계정 역대 최대 규모로 초기 개발부터 국제 지식재산 성장까지 뒷받침

문체부, '케이-게임' IP 키운다...1,200억 원 게임 펀드 결성...넥슨 588억 원 참여, 문화계정 역대 최대 규모로 초기 개발부터 국제 지식재산 성장까지 뒷받침

유관기관 · 실감형콘텐츠 4
엔비디아, 과학 연구 가속 AI 소프트웨어 공개...우주 관측 데이터 처리 최대 1만4900배 빨라져...현지시간 6월 22일 ISC 콘퍼런스서 '쿠다-X' 신규 라이브러리·서비스 발표, 화학·신소재부터 암흑물질 탐색까지 적용

엔비디아, 과학 연구 가속 AI 소프트웨어 공개...우주 관측 데이터 처리 최대 1만4900배 빨라져...현지시간 6월 22일 ISC 콘퍼런스서 '쿠다-X' 신규 라이브러리·서비스 발표, 화학·신소재부터 암흑물질 탐색까지 적용

인공지능 4