AI가 작성자를 식별한다
Claude Opus 4.7의 125단어 텍스트 지문 실험이 드러낸 LLM의 이면
왜 이 한 편인가
Claude Opus 4.7의 저자 식별 사례를 단순 성능 소식이 아니라 AI와의 상호작용에서 사용자가 의도치 않게 무엇을 노출하는가라는 각도로 잡았다. 모델의 능력이 커질수록 입력 텍스트에서 추출되는 정보의 범위가 사용자 인식을 넘어선다는 구조적 변화는, AI 리터러시 논의에서 아직 주류 매체가 정면으로 다루지 않은 지점이다.
현상
AI 모델의 능력 경쟁이 벤치마크 점수를 넘어 예상치 못한 방향으로 뻗고 있다. Anthropic의 Claude Opus 4.7이 공개되지 않은 125단어 초안만을 보고 작성자를 특정해낸 사례(GeekNews)는, 모델이 콘텐츠를 생성하는 것을 넘어 콘텐츠로부터 인간 정체성을 역추적하는 단계에 진입했음을 보여준다. 같은 텍스트를 받은 ChatGPT와 Gemini는 다른 인물을 지목했다. 같은 능력도, 모델마다 다르게 발현된다.
해석
이 신호가 흥미로운 이유는 단순한 성능 비교 때문이 아니다. 텍스트 지문(text fingerprinting) — 글쓰기 패턴·어휘 선택·문장 구조로 저자를 식별하는 기술 — 은 법언어학(forensic linguistics) 분야에서 수십 년간 연구돼 왔다. LLM이 이 능력을 우연히 내재화하고 있다는 것은, 훈련 과정에서 인터넷상의 방대한 저자 귀속 패턴을 학습했음을 시사한다. 즉, 모델은 누군가의 글을 요약하거나 번역하는 동안 동시에 그 글의 저자 프로파일을 구성하고 있을 수 있다.