● ISSUE 01 LAB 03 — DATA PARTNER · theXEO

검색 1위인데,
AI는 안 골랐다.

네이버 검색 1위 관측치의 약 75%(질의-URL 기준)에서 AI 브리핑 인용이 관측되지 않았습니다. 그럼 무엇이 가르나 — 콘텐츠 형식·채널·블로그 권위를 차례로 통제했지만, 이 소표본에선 잔차를 설명하는 추가 신호를 찾지 못했습니다. 이건 답을 찾은 기록이 아니라, 아직 용의자를 못 좁힌 수사 기록입니다.

측정 기준일 2026.06.15 · 데이터 — theXEO · 예비·소표본

01 / 사건

1위인데 왜
안 뽑혔나.

네이버 통합검색 순위와 AI 브리핑 인용을 질의-URL 관측치 단위로 맞붙였습니다. 검색순위가 1차 게이트인 건 맞습니다 — 인용된 쪽은 평균 4.2위, 비인용은 10.2위. 그런데 검색 1위 관측치 91개 중 인용된 건 23개(25%)뿐. 나머지 68개(약 75%)에서는 인용이 관측되지 않았습니다. 순위는 "후보 자격"일 뿐, 같은 1위들 사이에서 누가 인용되냐는 순위 밖에서 갈립니다. 이 잔차의 정체가 이번 호의 질문입니다.

검색 1위인데 비인용75%

인용 URL 평균 순위4.2위

비인용 평균 순위10.2위

02 / 용의자를 하나씩 지운다

셋을 심문했다.
아직 자백이 없다.

용의자 1 · 콘텐츠 형식

"수치·목록 많은 글이 인용된다"? — 이 표본에선 미확인

LAB 1호의 가설. 본문 형식(수치·목록·이미지·길이)만으로 인용 여부를 예측하니 적중률이 동전 던지기 수준(AUC 0.5 근처)이었습니다. 게다가 인용·비인용 글이 둘 다 네이버 블로그라, 같은 채널 안에서는 형식으로 가른다는 신호가 안 잡혔습니다. → LAB 1호

용의자 2 · 채널 / 인기

"힘 센 채널·인기 글이 인용된다"? — 이 표본에선 미확인

AI마다 인용하는 채널 풀은 달랐지만(LAB 2호), 그게 "어느 글이 인용되냐"를 가른다는 신호는 안 잡혔습니다. 오히려 raw로는 댓글 많은 인기글·메가 블로그가 덜 인용되는 역상관 힌트가 보였습니다(예측력으론 미검증). → LAB 2호

용의자 3 · 블로그 권위 / 활동

"권위 있는 블로그가 인용된다"? — 이 표본에선 미확인

이번 호의 본 분석. 블로그 누적방문·이웃수·공감·댓글·발행 최신성을 모아 검색순위를 통제한 로지스틱을 돌렸습니다. 결과 — 검색순위만으로 AUC 0.73, 권위·활동 지표를 더해도 0.71. cited 32개 소표본이라 이 0.02 차이는 노이즈 범위로, 권위 지표를 더해 안정적 개선은 관측되지 않았습니다(없다는 증거는 아님).

통제한 신호	예측력(순위 위에 더하는 분)	판정
콘텐츠 형식 (수치·목록·길이)	≈0 (AUC 랜덤)	미확인
채널 · 인기 (댓글·방문)	역상관 힌트, 예측력 미검출	미확인
블로그 권위·활동 (이웃·방문·최신성)	0.73 → 0.71 (노이즈 범위)	미확인
검색순위	주된 게이트 (AUC 0.73)	유효(후보자격)

정직한 고백 — 한 번은 0.98이 나왔다.
분석 도중 한 변수를 넣자 AUC가 0.98로 튀었습니다. "찾았다" 싶었죠. 그런데 그 변수는 author_cited_count — "인용된 글의 작성자가 몇 번 인용됐나"를 세고 있었습니다. 인용을 인용으로 예측하는 순환(leakage)이었습니다. 우리한테 제일 유리한 숫자였지만, 버렸습니다. 진짜 숫자는 0.71입니다. 우리가 파는 건 0.98짜리 환상이 아니라, 검증에서 살아남은 0.71입니다.

03 / 남은 용의자

아직 안 잰
한 곳.

콘텐츠 형식·채널/인기·블로그 권위 지표는 이번 소표본에서 검색순위 위의 추가 설명력으로 확인되지 않았습니다. 그래서 결론은 "답이 아니다"가 아니라, 아직 우리가 잰 변수만으로는 이 잔차를 설명하지 못했다는 쪽에 가깝습니다. 남은 유력 후보는 우리가 아직 측정하지 않은 한 가지 — 주제·질의 의미 적합성입니다. 같은 1위 글이라도 "이 질문에 정확히 답하는 글"이 인용될 가능성. 다음 호는 질의↔본문 의미 유사도(임베딩)를 붙이고 표본을 키워 이 후보를 심문합니다.

"AI 인용 공식"은 아직 아무도 못 찾았습니다. 우리는 측정 가능한 후보를 하나씩 좁혀가며, 어디가 답인지에 다가갑니다.

04 / 그래서 마케터는

"공식"을 파는 사람을
의심하라.

"이렇게 쓰면 AI가 인용한다"는 단정적 공식은, 우리가 이번에 실제로 측정한 범위에선 데이터로 잘 받쳐지지 않았습니다. 검색 상위(후보 자격)는 여전히 기본기이고 — 그 위에서 인용을 가르는 건 아직 열린 질문입니다. 그러니 "우리가 AI 인용을 보장한다"는 말보다, "당신 페이지가 지금 어느 AI에 어떻게 잡히는지부터 측정한다"가 정직합니다. 우리가 파는 건 추측이 아니라 측정입니다.

⚠ 분석 범위 · 한계 (정직하게) — 네이버 AI 브리핑 인용 데이터(제습기·에어컨·로봇청소기). 로지스틱은 네이버 블로그 authority행 292개(그중 인용 32개) 기준 — 소표본이라 "권위가 인용을 안 가른다"고 단정하지 않습니다. 효과가 작아 이 표본에선 안 잡혔을 수도 있습니다. raw 중앙값엔 방문 역상관·최신성 힌트가 있으나 순위 통제 다변량에선 예측력으로 살아남지 못했습니다. "검색 1위 75% 비인용"은 URL 단위 실측 카운트. 데이터: theXEO 자체 수집·분석 (2026년 6월 15일) · 독립 분석. 예비 분석입니다. 발행: VLYVLY.

추측을 파는 곳과,
측정을 파는 곳.

AI 인용의 공식은 아직 열린 질문입니다. 그래서 우리는 "보장"이 아니라 "측정"을 팝니다 — 당신 페이지가 지금 검색·AI에 어떻게 잡히는지, 무엇이 비어 있는지. AI Visibility Report로 현재 상태부터.

AI Visibility Report 신청 ↗

검색 1위인데,AI는 안 골랐다.

1위인데 왜안 뽑혔나.

셋을 심문했다.아직 자백이 없다.