인공지능 ·
AI, 이미 인간 수준 범용지능 달성했다...美 연구진 Nature 논문서 주장
UC샌디에이고 연구진, 현재 대형언어모델이 튜링 기준 충족하며 AGI 실현했다고 분석
[한국정보기술신문] 인공지능이 이미 인간 수준의 범용 지능을 달성했다는 주장이 세계 최고 권위의 학술지 Nature에 게재되면서 AI 업계에 논쟁이 일고 있다. UC샌디에이고 대학 연구진은 2월 2일 발표한 논평에서 현재의 대형언어모델이 앨런 튜링이 1950년에 제시한 기준을 충족하며 범용 인공지능(AGI)을 실현했다고 밝혔다.
UC샌디에이고의 철학과 에디 케밍 첸 부교수, AI 및 컴퓨터과학과 미하일 벨킨 교수, 언어학 및 컴퓨터과학과 레온 베르겐 부교수, 데이터과학 및 철학과 데이비드 댄크스 교수 등 4명의 연구진은 공동 집필한 논평에서 GPT-4.5가 2025년 3월 튜링 테스트에서 73%의 비율로 인간으로 판정받았으며, 이는 실제 인간보다 높은 수치라고 설명했다.
범용지능의 재정의와 현재 AI의 능력
연구진은 범용지능을 다양한 영역에서 충분한 폭과 깊이의 인지 능력을 갖춘 것으로 정의했다. 이들은 현재 대형언어모델이 국제수학올림피아드에서 금메달 수준의 성적을 거두고, 박사과정 시험 문제를 해결하며, 전문 프로그래머의 코딩을 지원하고, 수십 개 언어에 유창하며, 시 창작까지 수행한다고 강조했다.
첸 교수는 논평에서 완벽성, 보편성, 인간 유사성, 초지능 등이 범용지능의 필수 요건이 아니라고 주장했다. 어떤 개인도 모든 인지 과제를 완벽하게 수행할 수 없으며, 아인슈타인도 만다린어를 구사하지 못했지만 범용지능을 가진 것으로 인정받는다는 것이 그의 설명이다.
주요 반론에 대한 체계적 반박
연구진은 AI가 범용지능을 갖추지 못했다는 10가지 주요 반론을 체계적으로 반박했다. 앵무새에 불과하다는 주장에 대해서는 현재 대형언어모델이 새로운 미공개 수학 문제를 해결하고, 과학 데이터에 대한 최적의 추론을 수행하며, 코딩 훈련이 비코딩 영역의 일반 추론 능력을 향상시킨다는 연구 결과를 제시했다.
세계 모델이 부족하다는 반론에 대해서는 대형언어모델이 타일 바닥에 유리잔과 베개를 떨어뜨렸을 때의 결과를 정확히 예측할 수 있으며, 올림피아드 수학 및 물리 문제 해결과 공학 설계 지원이 기능적 물리 모델 보유를 입증한다고 설명했다.
연구진은 또한 신체가 없다는 반론에 대해 스티븐 호킹이 물리적 제약에도 불구하고 지능을 인정받았듯이, 라디오로 소통하는 외계 생명체나 통 속의 뇌에도 지능을 인정할 것이라며 신체성이 지능의 필수 요건이 아니라고 주장했다.
AI 업계의 엇갈린 평가
그러나 AI 업계 전문가들의 견해는 엇갈린다. 워싱턴DC의 미국인공지능진흥협회가 2025년 3월 실시한 설문조사에서는 주요 연구자의 76%가 현재의 AI 접근법을 확장해도 AGI 달성 가능성이 낮거나 매우 낮다고 답했다.
연구진은 이러한 견해 차이가 AGI 정의의 모호성과 불일치, AI가 가져올 변화와 혼란에 대한 감정적 두려움, 상업적 이익과 얽힌 실용적 문제 등에서 비롯된다고 분석했다. 벨킨 교수는 AGI를 사회적 격변이나 계약서의 마일스톤이 아닌 지능에 관한 순수한 질문으로 접근해야 한다고 강조했다.
튜링의 예언 실현과 미래 과제
연구진은 현재의 증거가 명확하며, 추론의 최선 설명으로 볼 때 우리는 높은 수준의 AGI를 관찰하고 있다고 결론지었다. 앨런 튜링이 1950년 구상한 기계가 도래했다는 것이다.
댄크스 교수는 AGI 실현 인정이 정책 수립, 위험 관리, 마음의 본질과 세계 자체를 이해하는 데 중요하다고 강조했다. 연구진은 공포나 과대광고에 흐려지지 않은 명확한 시선으로 다가올 미래를 준비해야 한다고 촉구했다.
한편 일각에서는 AGI를 넘어선 초지능의 등장 시점과 그것이 가져올 경제적 사회적 변화에 대한 논의가 본격화되어야 한다는 목소리도 나오고 있다. 업계에서는 이번 논평이 AI의 현재 능력과 한계에 대한 냉정한 평가와 함께 미래 발전 방향에 대한 심도 있는 논의의 계기가 될 것으로 전망하고 있다.
한국정보기술신문 인공지능분과 성연주 기자 news@kitpa.org