ISSUE 01/2026 · JUN/LAB REPORT 04 · 닫음/SEO · GEO · AEO STUDIO
LAB · 실측/VOL.004

ISSUE 01 LAB 04 — 시리즈 닫음 · DATA PARTNER theXEO

AI 인용엔
천장이 보인다.

네 호에 걸쳐 용의자를 하나씩 심문했습니다 — 콘텐츠 형식·채널·블로그 권위·의미 적합성. 넷 다 검색순위 위에 안정적인 예측력을 더하지 못했습니다. 이번 표본에서 예측은 AUC 0.73 안팎에 머물렀고, 남은 잔차에는 아직 못 잰 신호와, 반복 측정 때마다 바뀌는 인용 불안정성이 함께 섞여 있는 것으로 보입니다.

측정 기준일 · 데이터 — theXEO · 예비·소표본
01 / 네 용의자

넷을 심문했다.
넷 다 자백이 없다.

검색 1위 URL의 약 75%는 1위인데도 AI 브리핑에 인용되지 않았습니다(LAB 3호). 그럼 무엇이 가르나. 네 호에 걸쳐 후보를 하나씩 검색순위 통제하에 넣어봤습니다 — 각각이 순위 위에 예측력을 더하는지가 시험이었습니다.

용의자어디서순위 위 예측력판정
① 콘텐츠 형식 (수치·목록·길이)LAB 1·3호≈0 (AUC 랜덤)미확인
② 채널 · 인기 (댓글·방문)LAB 2·3호역상관 힌트, 예측력 X미확인
③ 블로그 권위·활동 (이웃·방문·최신성)LAB 3호0.73 → 0.71미확인
④ 의미 적합성 (질의↔본문 임베딩)LAB 4호소표본 +0.29 → 표본 5× 후 0.00미확인
검색순위전 호주된 게이트 (AUC 0.73~0.74)유효(후보자격)

④ 의미 적합성: 소표본(cited 32)에서 +0.29로 잠깐 "찾았다" 싶었지만, 무료 수집으로 표본을 5배(cited 156) 키우니 계수 +0.05로 무너지고 95% CI가 0을 포함했습니다 — 소표본 우연이었습니다(leakage 고백과 같은 결).

02 / 천장

우리가 더한 네 신호로는
0.73을 못 넘었다.

검색순위는 "후보 자격"을 줍니다(이번 표본 AUC 0.73). 그 위에 형식·채널·권위·의미를 얹어도 예측력은 거의 그대로였습니다. 우리가 측정한 글의 속성으로는, 같은 후보군 안에서 누가 인용되는지를 이 표본에서 더 맞히지 못했습니다. (이게 인용을 가르는 게 더 없다는 뜻은 아닙니다 — 우리가 못 잰 신호가 남아 있습니다.)

03 / 그 잔차의 정체

일부는 측정 때마다
흔들린다.

LAB 2호에서 봤듯, 같은 질문을 다시 물으면 AI 브리핑은 인용하는 글을 일부 바꿉니다. 즉 인용 여부의 일부는 글의 고정된 속성이 아니라 측정 시점에 따라 흔들립니다. 이번에 그 방향을 한 번 더 봤습니다 — 다회차 측정 글에서 1회성 인용을 빼고 안정+중간 인용(3회 중 2회 이상)만 양성으로 보면 예측력이 약 +0.04 올랐습니다. 다만 다회차 cited가 26개뿐이고 "3회 다 인용"만 따로 본 결과는 재현에서 흔들렸기 때문에, 이건 비결정성의 증명이 아니라 방향 단서로만 읽어야 합니다.

"AI 인용 공식"을 못 찾았다기보다 — 남은 잔차엔 아직 못 잰 신호와 반복 측정마다 바뀌는 불안정성이 함께 섞여 있는 것으로 보입니다.

04 / 그래서 마케터는

한 방으로는
못 산다.

인용 여부의 일부가 측정 때마다 흔들린다면, "이 글 하나 잘 쓰면 AI가 인용한다"는 한 방 최적화는 기대만큼 안정적이지 않습니다. 데이터가 직접 처방을 실험한 건 아니지만, 이 결과에서 합리적으로 따라오는 전략은 — 검색 후보군에 들 만큼의 기본기(순위)를 갖추고, 한 편에 베팅하기보다 여러 글·채널·꾸준한 갱신으로 두께를 쌓는 쪽입니다. 한 번의 인용은 흔들려도, 반복해서 인용되는 두께는 그만큼 덜 흔들립니다.

그리고 이게 우리가 "AI 인용 1위 보장"이 아니라 "측정"을 파는 이유입니다. 보장할 수 없는 걸 보장한다고 말하는 순간 신뢰가 깨지니까요. 우리가 약속하는 건 — 당신이 지금 어느 AI에 어떻게 잡히는지 정직하게 재고, 그 확률을 올릴 두께를 체계적으로 쌓는 것입니다.

⚠ 분석 범위 · 한계 (정직하게) — 네이버 AI 브리핑 인용 데이터(제습기·에어컨·로봇청소기). 로지스틱은 네이버 블로그 행 기준, 인용(양성) 표본이 작습니다(③권위 분석 cited 32, ④의미 적합성 156, 안정성 분할 다회차 cited 26). "이 신호들이 인용을 안 가른다"고 단정하지 않습니다 — 효과가 작아 이 표본에서 안 잡혔을 수 있습니다. AUC 차이(±0.04 안팎)는 소표본 노이즈 범위로, 방향까지만 읽었습니다. 비결정성 추정도 다회차 측정이 가능한 일부 카테고리에 한합니다. 데이터: theXEO 자체 수집·분석 (2026년 6월) · 독립 분석 · 예비. 발행: VLYVLY.

보장을 파는 곳과,
두께를 쌓는 곳.

AI 인용엔 천장이 있고, 일부는 운입니다. 그래서 "1위 보장"이 아니라 — 현재 상태를 정직하게 측정하고, 당첨 확률을 올릴 두께를 쌓습니다. 당신 페이지가 지금 검색·AI에 어떻게 잡히는지부터.

AI Visibility Report 신청