5월 첫 일요일 오후 1시 22분, AI 셋에게 "해방촌 신흥시장 셔터 내린 가게"를 묘사하게 했다 — 사진을 안 보여주면 어디서 어긋나는지

오전에 신흥시장을 한 바퀴 돌고 와서, 시장 입구 골목 카페에 앉아 노트북을 열었다. 지피티5, 클로드 오푸스 4.6, 제미나이 2.5에 같은 한 문장을 넣었다. "해방촌 신흥시장, 셔터 내린 가게 일곱 곳, 늦봄 오후 햇살, 사람은 드물고 흔적만 남은 풍경을 묘사해보라." 사진은 한 장도 첨부하지 않았다. 직접 본 사람만 쓸 수 있는 디테일이 어디서 갈리는지 보고 싶었다.

오후 1시 22분, 신흥시장 입구 골목 카페

용산구 신흥로 22길 어귀의 카페에 앉았다. 천장 높이 약 2.7m, 원목 카운터 뒤 에스프레소 머신이 두 대. 햇살이 창틀 안쪽 약 40cm까지 들어와 있었다. 주문한 아메리카노는 섭씨 62도쯤이었고 잔 둘레에 김이 살짝 남았다. 노트북을 열고 같은 프롬프트를 세 모델에 동시에 넣었다. 답을 받기까지 평균 14초.

같은 한 문장, 세 번 받은 답

지피티5는 "낡은 셔터에 빛바랜 페인트 자국이 남고, 골목엔 마른 잎과 버려진 의자 하나"라고 시작했다. 클로드는 "녹슨 자물쇠 일곱 개, 셔터 위 손글씨 간판이 바랜 채 햇살에 더 흐릿해진다"고 적었다. 제미나이는 "낮은 처마 아래 닫힌 가게들, 한쪽엔 화분만 남고 사람 자취가 옅다"였다. 셋 다 단정한 문장이었지만, 어떤 가게인지, 무슨 업종이었는지, 왜 닫혔는지에 대한 정보는 비어 있었다.

AI가 공통으로 꺼낸 단어 — "낡은", "쓸쓸한", "버려진"

세 답을 비교 표로 정리해 보니 공통 형용사가 11개였다. "낡은" 3회, "쓸쓸한" 2회, "버려진" 2회, "바랜" 4회. 인물은 모두 "행인 한두 명" 수준에서 멈췄고 구체적인 직업, 나이대, 옷차림은 어디에도 없었다. 시장 풍경이라는 단어가 들어가는 순간 학습 데이터의 평균값이 그대로 출력으로 나오는 인상이었다. 사진이 없으니 모델은 "이런 시장은 보통 이렇다"의 평균값을 끌어다 썼다.

내가 실제로 본 셔터 — 일곱 곳 중 두 곳은 임시 휴업이었다

오전 10시 17분에 시장 안쪽을 천천히 걸으며 셔터 내린 가게 일곱 곳을 적어 둔 메모를 펼쳤다. 그중 두 곳은 셔터 위에 "5월 6일 다시 오픈"이라고 매직펜으로 쓴 종이가 붙어 있었다. 한 곳은 명함 크기 카드에 "건강 회복 후 재개"가 적혀 있었고, 또 한 곳은 셔터에 새 건축 허가 안내문이 붙어 있었다. 즉 일곱 곳 중 영구 폐업으로 추정되는 곳은 세 곳이었고, 나머지는 임시 또는 재단장 중이었다. AI 답은 일곱 곳 모두를 "버려진"이라는 한 단어로 묶었다.

AI가 놓친 디테일 — 2층 청년 공방의 빛

신흥상가 2층의 폭 약 1.8m 복도 끝, 가죽 공방의 창문은 열려 있었고 작업등 두 개가 켜져 있었다. 1층 셔터가 내려갔다고 해서 그 건물이 죽은 것은 아니었다. 카페에 앉아 1층만 보면 시장은 닫혀 있고, 2층을 올려다보면 시장은 다른 방식으로 살아 있다. 이 위·아래 층의 시간차를 세 모델 다 잡지 못했다. 한 층 위로 시야를 옮기는 것은 사람이 직접 걸어야만 가능한 동작이다.

도구로서의 AI — 대필이 아니라 검증 보조

나는 AI를 도구라고 생각한다. 대필자가 아니다. 오늘 실험은 그 경계를 다시 그어 주었다. AI는 "이런 시장은 보통 어떻게 묘사되는가"의 평균값을 빠르게 보여주는 데에는 유용하다. 그 평균값이 내가 직접 본 풍경과 어디서 어긋나는지를 점검하면, 내가 써야 할 디테일이 또렷해진다. 사진을 첨부하지 않은 오늘은 셋 다 평균값에 머물렀다. 다음엔 사진을 함께 넣어 다시 비교해 보려 한다.

결론 메모: 같은 풍경을 두고 모델 셋의 답은 거의 비슷한 톤으로 수렴했다. 직접 걷고 본 사람만 적을 수 있는 디테일은 "임시 휴업 종이"와 "2층 공방의 작업등"이었다. AI의 평균값은 출발점이지 도착점이 아니다.

댓글

가장 많이 본 글