SEO는 AI 검색을 위해 구조화된 데이터를 추천 이유

LinkedIn의 게시물에서는 스키마 구조 데이터를 AI 검색 순위에 사용할 수 있다는 생각에 의문을 제기했습니다.

SEO는 AI 검색을 위해 구조화된 데이터를 추천합니다…왜?

LinkedIn의 한 게시물은 Schema.org 구조화된 데이터가 대규모 언어 모델이 출력하는 것에 영향을 미친다는 생각에 의문을 제기했습니다. 일부 SEO는 AI 검색 엔진에서 더 나은 순위를 매기기 위해 구조화된 데이터를 추천하고 있는 것 같습니다.

사실과 의견의 구별

이 주제는 SEO에서 의견과 사실의 구분이 사라지는 이상한 일을 제안합니다. 사람이 “저는 생각합니다”라고 말할 때, 그것은 이어지는 것이 의견이라는 신호입니다. 의견은 중요하며, 발견이 태어나는 곳입니다. 의견과 사실의 구분이 사라지고 의견이 사실로 받아들여질 때 문제가 될 수 있습니다.

검색 전문가가 묻습니다: 제가 놓친 게 있나요?

Patrick Stox는 LinkedIn에 다음 게시물을 썼습니다.

“제가 뭔가 놓친 게 있나요? SEO는 왜 스키마 마크업이 LLM 출력에 영향을 미칠 것이라고 생각할까요?”

패트릭은 SEO 추천의 맥락에서 “LLM 출력”이라고 말했으므로 ChatGPT Search 및 기타 AI 검색 엔진을 참조한 것일 가능성이 높습니다 . 그렇다면 AI 검색 엔진은 구조화된 데이터에서 데이터를 가져오나요?

LLM은 웹 텍스트, 책, 정부 기록, 법률 문서 및 기타 텍스트 데이터(그리고 다른 형태의 미디어도)에 대해 교육을 받고, 이를 사용하여 요약과 답변을 생성하지만 교육 데이터를 표절하지 않습니다. 즉, 웹 콘텐츠를 최적화하면 LLM 자체가 해당 웹사이트로 추천을 보낼 것이라고 생각하는 것은 무의미하다는 것을 의미합니다.

AI 검색 엔진은 Retrieval Augmented Generation(RAG)을 통해 검색 인덱스(및 지식 그래프)에 기반을 둡니다. 검색 엔진 인덱스 자체는 스키마 구조 데이터 가 아닌 크롤링된 데이터에서 생성됩니다 .

예를 들어, Perplexity AI는 검색 인덱스에서 PageRank의 수정된 버전을 사용하여 웹 크롤링된 콘텐츠를 순위를 매깁니다. Google과 Bing은 텍스트 데이터를 크롤링하고 중복된 콘텐츠를 제거하고, 중지 단어를 제거하고, HTML에서 추출된 텍스트를 조작하는 등의 작업을 수행하며, 모든 페이지에 구조화된 데이터가 있는 것은 아닙니다.

실제로 Google은 특정 종류의 검색 환경과 풍부한 결과에 대해 사용 가능한 Schema.org 구조화된 데이터의 일부만을 사용하며, 이로 인해 게시자가 사용하는 구조화된 데이터의 종류가 제한됩니다.

그리고 Bing과 Google의 크롤러는 HTML을 렌더링하고 헤더, 푸터, 메인 콘텐츠(순위를 매기기 위해 텍스트를 추출하는 곳)를 식별한다는 사실이 있습니다 . 스키마 구조 데이터에 의존할 거라면 왜 그럴까요?

AI 검색 엔진에서 더 나은 순위를 차지하기 위해 Schema.org 구조화된 데이터를 사용하는 것이 좋다는 생각은 사실에 근거하지 않고, 그저 공상적인 추측일 뿐입니다. 아니면 한 사람이 무언가를 말한 다음 20명이 후에 완전히 다른 것으로 바뀌는 “전화 게임” 효과에서 비롯된 것일 수도 있습니다.

예를 들어, 조노 올더슨은 구조화된 데이터가 AI 검색 엔진이 웹을 더 잘 이해하는 데 사용할 수 있는 표준이 될 수 있다고 제안했습니다 . 그는 AI 검색 엔진이 현재 이를 사용한다고 말한 것이 아니라 AI 검색 엔진이 이를 채택하는 것을 고려해야 한다고 제안했을 뿐이며, 어쩌면 그 게시물이 20명의 SEO가 나중에 본격적인 이론으로 전화되었을 수도 있습니다.

안타깝게도 SEO 서클에는 근거 없는 아이디어가 많이 떠돌고 있습니다. 얼마 전 저는 소셜 미디어에서 SEO가 Google 로컬 검색이 “내 근처” 검색 쿼리에 대한 응답으로 IP 주소를 사용하지 않는다고 주장하는 것을 보았습니다. 그 아이디어를 테스트하기 위해 누구나 해야 할 일은 VPN에 로그인하고 IP 주소에 대한 지리적 위치를 선택하고 “내 근처” 검색 쿼리를 수행하는 것뿐이며, VPN에서 사용한 IP 주소가 “내 근처” 검색 결과에 영향을 미친다는 것을 알게 될 것입니다.

IP 주소에 영향을 받은 내 근처 쿼리의 스크린샷

Google은 검색 결과를 개인화하기 위해 IP 주소를 사용한다고 말하는 지원 페이지를 게시하기도 했지만 , 일부 SEO가 상관관계 연구를 했기 때문에 그렇지 않다고 믿는 사람들이 있습니다. 이에 대해 질문하면 Google이 거짓말을 한다고 소리치는 누군가의 답변으로 돌아옵니다.

매일 검색 통찰력을 구독하세요

AI, PPC, 그리고 디지털 마케팅 뉴스가 성공을 위해 정제되었습니다. 다른 75,000명의 마케터들과 함께하세요!

당신은 거짓말하는 눈을 믿을 것인가요?

Schema.Org 구조화된 데이터 및 AI 검색 결과

“SEO”가 LLM 학습 데이터에 Schema.org 구조화된 데이터를 사용할 것을 출판사에 권고하는 것도 말이 되지 않습니다. 학습 데이터는 LLM 출력에 인용되지 않고, 크롤러에서 가져온 검색 인덱스에서 가져온 웹에서 가져온 출력에만 인용되기 때문입니다. 앞서 언급했듯이, Google 자체에서 아주 작은 부분만 사용하기 때문에 출판사는 사용 가능한 Schema.org 구조화된 데이터의 일부만 사용합니다. 따라서 AI 검색 엔진이 출력에 구조화된 데이터에 의존하는 것은 말이 되지 않습니다.

검색 마케팅 전문가 Christopher Shin은 다음과 같이 말했습니다.

“패트릭, 당신의 글을 읽고 같은 생각을 하고 있습니다. 저는 현재 이렇게 해석합니다. 저는 LLM이 일반적으로 검색 엔진 검색 엔진에서 응답을 생성하지 않고 데이터 해석에서 응답을 생성한다고 생각했습니다. 맞나요? 하지만 스키마 데이터 마크업은 SER{에서 리치 스니펫 등을 표시하는 데 사용됩니다. 맞나요? 스키마와 LLM의 핵심적인 뉘앙스는 검색 엔진이 SERP에 스키마를 사용하는 반면 LLM은 스키마가 LLM에 미치는 영향에 관해서는 데이터 해석을 사용한다는 것입니다.”

크리스토퍼 신과 패트릭 스톡스 같은 사람들은 실용적이고 현명한 SEO가 여전히 소음을 헤쳐나가기 위해 노력하고 있다는 희망을 줍니다. 패트릭의 LinkedIn 게시물이 그 증거입니다.

실용적인 SEO

실용주의의 정의는 합리적이고 현실적인 이유로 일을 하는 것이며, 불완전한 정보와 추측에 근거한 의견에 따라 일하는 것이 아닙니다.

SEO가 사실상 탄생한 이래로 SEO에 관여해 온 사람으로서, SEO와 퍼블리셔가 모호하게 정의된 문제에 시간을 낭비하고, EEAT의 피상적인 신호 와 같은 쓸모없는 활동에 시간을 허비하는 이유는 사물을 깊이 생각하지 않았기 때문입니다. 문서와 공식 성명을 지적하고 “Google이 거짓말을 한다”는 진술을 듣는 것은 정말 낙담스럽습니다. 그런 태도는 사람을 “소리치고 싶게” 만듭니다.

Leave a Comment