● ISSUE 01 LAB 04 — 시리즈 닫음 · DATA PARTNER theXEO
AI 인용엔
천장이 보인다.
네 호에 걸쳐 용의자를 하나씩 심문했습니다 — 콘텐츠 형식·채널·블로그 권위·의미 적합성. 넷 다 검색순위 위에 안정적인 예측력을 더하지 못했습니다. 이번 표본에서 예측은 AUC 0.73 안팎에 머물렀고, 남은 잔차에는 아직 못 잰 신호와, 반복 측정 때마다 바뀌는 인용 불안정성이 함께 섞여 있는 것으로 보입니다.
넷을 심문했다.
넷 다 자백이 없다.
검색 1위 URL의 약 75%는 1위인데도 AI 브리핑에 인용되지 않았습니다(LAB 3호). 그럼 무엇이 가르나. 네 호에 걸쳐 후보를 하나씩 검색순위 통제하에 넣어봤습니다 — 각각이 순위 위에 예측력을 더하는지가 시험이었습니다.
| 용의자 | 어디서 | 순위 위 예측력 | 판정 |
|---|---|---|---|
| ① 콘텐츠 형식 (수치·목록·길이) | LAB 1·3호 | ≈0 (AUC 랜덤) | 미확인 |
| ② 채널 · 인기 (댓글·방문) | LAB 2·3호 | 역상관 힌트, 예측력 X | 미확인 |
| ③ 블로그 권위·활동 (이웃·방문·최신성) | LAB 3호 | 0.73 → 0.71 | 미확인 |
| ④ 의미 적합성 (질의↔본문 임베딩) | LAB 4호 | 소표본 +0.29 → 표본 5× 후 0.00 | 미확인 |
| 검색순위 | 전 호 | 주된 게이트 (AUC 0.73~0.74) | 유효(후보자격) |
④ 의미 적합성: 소표본(cited 32)에서 +0.29로 잠깐 "찾았다" 싶었지만, 무료 수집으로 표본을 5배(cited 156) 키우니 계수 +0.05로 무너지고 95% CI가 0을 포함했습니다 — 소표본 우연이었습니다(leakage 고백과 같은 결).
우리가 더한 네 신호로는
0.73을 못 넘었다.
검색순위는 "후보 자격"을 줍니다(이번 표본 AUC 0.73). 그 위에 형식·채널·권위·의미를 얹어도 예측력은 거의 그대로였습니다. 우리가 측정한 글의 속성으로는, 같은 후보군 안에서 누가 인용되는지를 이 표본에서 더 맞히지 못했습니다. (이게 인용을 가르는 게 더 없다는 뜻은 아닙니다 — 우리가 못 잰 신호가 남아 있습니다.)
일부는 측정 때마다
흔들린다.
LAB 2호에서 봤듯, 같은 질문을 다시 물으면 AI 브리핑은 인용하는 글을 일부 바꿉니다. 즉 인용 여부의 일부는 글의 고정된 속성이 아니라 측정 시점에 따라 흔들립니다. 이번에 그 방향을 한 번 더 봤습니다 — 다회차 측정 글에서 1회성 인용을 빼고 안정+중간 인용(3회 중 2회 이상)만 양성으로 보면 예측력이 약 +0.04 올랐습니다. 다만 다회차 cited가 26개뿐이고 "3회 다 인용"만 따로 본 결과는 재현에서 흔들렸기 때문에, 이건 비결정성의 증명이 아니라 방향 단서로만 읽어야 합니다.
"AI 인용 공식"을 못 찾았다기보다 — 남은 잔차엔 아직 못 잰 신호와 반복 측정마다 바뀌는 불안정성이 함께 섞여 있는 것으로 보입니다.
한 방으로는
못 산다.
인용 여부의 일부가 측정 때마다 흔들린다면, "이 글 하나 잘 쓰면 AI가 인용한다"는 한 방 최적화는 기대만큼 안정적이지 않습니다. 데이터가 직접 처방을 실험한 건 아니지만, 이 결과에서 합리적으로 따라오는 전략은 — 검색 후보군에 들 만큼의 기본기(순위)를 갖추고, 한 편에 베팅하기보다 여러 글·채널·꾸준한 갱신으로 두께를 쌓는 쪽입니다. 한 번의 인용은 흔들려도, 반복해서 인용되는 두께는 그만큼 덜 흔들립니다.
그리고 이게 우리가 "AI 인용 1위 보장"이 아니라 "측정"을 파는 이유입니다. 보장할 수 없는 걸 보장한다고 말하는 순간 신뢰가 깨지니까요. 우리가 약속하는 건 — 당신이 지금 어느 AI에 어떻게 잡히는지 정직하게 재고, 그 확률을 올릴 두께를 체계적으로 쌓는 것입니다.
보장을 파는 곳과,
두께를 쌓는 곳.
AI 인용엔 천장이 있고, 일부는 운입니다. 그래서 "1위 보장"이 아니라 — 현재 상태를 정직하게 측정하고, 당첨 확률을 올릴 두께를 쌓습니다. 당신 페이지가 지금 검색·AI에 어떻게 잡히는지부터.
AI Visibility Report 신청 ↗