인공 지능(AI)은 많은 획기적인 발전을 열고 있지만, 여전히 시행 후 자율 학습이 불가능하다는 핵심적인 한계가 존재합니다.
인간, 특히 환경에 지속적으로 적응하는 어린 아이들과 달리 현재 AI 모델은 거의 "동결"되어 이전에 훈련받은 데이터에만 기반하여 작동합니다.
2026년 3월 17일에 발표된 AI 연구 분야의 최고 과학자인 에마뉘엘 뒤푸(인지 과학 분야 - 메타의 FAIR), 얀 르쿤(인공 지능, 심층 학습 분야 - 뉴욕 대학교 교수), 지텐드라 말리크(컴퓨터 시각 분야, 캘리포니아 대학교 버클리 대학교 교수)의 연구에 따르면, 원인은 AI가 구축되는 방식에 있습니다.
대부분의 현대 시스템은 인간이 데이터를 수집하고, 훈련하고, 단계별로 모델을 업데이트하는 MLOps 프로세스에 의존합니다. 환경이 변화함에 따라 AI는 스스로 조정할 수 없으며 처음부터 다시 교육해야 합니다.
이로 인해 AI는 훈련 데이터와 다른 실제 상황에서 실패하기 쉽습니다. 언어 또는 시각 모델은 패턴을 매우 잘 인식할 수 있지만 적응력이 부족하고 자신의 실수로부터 배우지 못합니다.
연구는 결합해야 할 두 가지 핵심 학습 메커니즘을 지적합니다. 첫 번째는 시스템 A(관찰로부터 배우기)입니다. 이것은 사람들이 보고, 듣고, 예측함으로써 세계에 대한 이해를 구축하는 방법입니다.
현재 AI 모델은 주로 이 그룹에 속하며, 장점은 빅데이터에서 패턴을 확장하고 감지하는 능력입니다. 그러나 단점은 실제 행동과 연결되지 않고 인과 관계를 구별하기 어렵다는 것입니다.
두 번째는 B 시스템(행동 학습)으로, 시도와 실수를 기반으로 합니다. 이것은 사람들이 걷기, 말하기 또는 문제 해결을 배우는 방법입니다. 이 시스템의 장점은 새로운 솔루션을 탐구할 수 있지만 많은 데이터와 시간을 소비한다는 것입니다.
자연에서 이 두 시스템은 항상 동시에 작동합니다. 인간은 관찰과 행동을 동시에 수행하고 행동을 최적화하기 위해 지속적으로 조정합니다. 반대로 현재 AI는 이 두 메커니즘을 분리하여 학습 능력을 제한합니다.
이를 극복하기 위해 연구자들은 "운영하는 뇌" 역할을 하는 M 시스템(초제어)을 추가할 것을 제안합니다.
이 시스템은 오류, 불확실성 수준 및 성능을 모니터링하여 언제 관찰에서 배워야 하고 언제 테스트해야 하는지 결정합니다. 다시 말해 AI는 무엇을 배워야 하고 어떻게 배워야 하는지 스스로에게 물어볼 것입니다.
이 접근 방식은 어린이가 확실하지 않을 때 탐험하고, 이해했을 때 연습하고, 심지어 잠자는 동안 지식을 강화하는 것과 같은 사람들에게서 영감을 받습니다.
성공적으로 적용하면 AI는 인간이 지속적으로 개입하지 않고 학습 전략을 스스로 조정할 수 있습니다.
연구팀은 또한 AI가 작동 과정에서 학습하는 "생명 주기"와 수백만 건의 시뮬레이션을 통해 최적으로 제어되는 "진화"의 두 가지 시간 척도에 따른 개발 모델을 제안했습니다. 이는 자율 학습 능력을 갖춘 AI에 대한 더 가까운 진전으로 간주됩니다.
그러나 시뮬레이션 환경을 충분히 빠르고 현실적으로 구축하려면 막대한 컴퓨팅 리소스가 필요하기 때문에 과제는 작지 않습니다. 동시에 자율 학습 AI는 예측 불가능하게 행동할 수 있다는 점에서 안전에 대한 우려를 제기합니다.
그럼에도 불구하고 과학자들은 이것이 필요한 방향이라고 생각합니다. 이 연구는 AI가 현실 세계에서 더 효율적으로 작동하도록 도울 뿐만 아니라 인간이 학습하고 적응하는 방식을 설명하는 데 기여하며, 이는 지능의 가장 큰 미스터리 중 하나입니다.