인간 데이터 없이 배우는 AI
Ineffable Intelligence의 도전이 드러내는 벤치마크 위기와 새 패러다임
왜 이 한 편인가
Ineffable Intelligence 투자 뉴스를 자금 조달 규모가 아니라 SWE-bench 포화 진단과 교차해 읽으면, 인간 데이터·인간 벤치마크가 동시에 한계에 닿았다는 구조적 전환점이 보인다. 국내 매체 대부분이 두 신호를 별개로 다루는 상황에서, 이 두 흐름을 측정 도구 포화 → 패러다임 전환이라는 단일 논리로 묶는 각도를 선택했다.
현상
AI 연구의 지형이 미묘하게 이동하고 있다. 바둑과 체스 등에서 강화학습으로 자율 성능을 입증한 데이비드 실버(David Silver)가 DeepMind를 나와 설립한 Ineffable Intelligence는 11억 달러(약 1조 5천억 원)를 유치하며 51억 달러 기업가치를 인정받았다(TechCrunch). 목표는 인간이 만든 데이터 없이 스스로 학습하는 AI다. 같은 시기, AI 코딩 능력의 대표 지표였던 SWE-bench Verified는 프런티어 모델 역량을 더 이상 변별하지 못한다는 진단이 나왔다(GeekNews). 측정 도구가 포화 상태에 이를 때, 패러다임은 방향을 튼다.
해석
이 두 신호는 하나의 패턴을 가리킨다. 인간 데이터와 인간이 설계한 벤치마크에 동시에 한계가 온 것이다. SWE-bench 최고 점수가 74.9%에서 80.9% 사이에 수렴하면서 남은 실패가 모델 한계인지 데이터셋 결함인지 구분이 어려워진 상황은, 현재의 지도학습 중심 패러다임이 측정 가능한 천장에 닿았음을 시사한다. 실버의 접근은 이 천장을 우회하는 시도다. 인간 데이터 없이 환경과의 상호작용만으로 학습한다면, 벤치마크 포화라는 문제 자체가 무의미해진다. 이면은 있다. 강화학습 자율 에이전트는 학습 안정성·목표 정의·안전성 확보가 지도학습보다 훨씬 어렵고, 그 비용을 11억 달러로 감당할 수 있는지는 열린 질문이다.