공부

[ASAC] 웹 검색 엔진과 SEO 그리고 Core Web Vital

wjddnr0208 2024. 12. 18. 14:10

무언가 나 대신 세계 모든 웹 서버의 웹 페이지들을 미리 다 찾아놓고, 분류 및 정리한 뒤에 내 검색어에 따라 그에 적합한 웹 페이지들만 골라 전달해주면 어떨까?

  • 무언가 = 구글 , 네이버 , 다음과 같은 검색 서비스
  • 다 찾아놓고 = 웹 크롤링 : 세계 모든 웹 서버의 웹 페이지 정보 수집 (봇)
  • 분류 및 정리한 뒤 = 인덱싱 : 앞서 수집한 전체 웹 페이지들을 상관관계별로 분류

웹 페이지를 찾아 수집 및 분류하는 웹 크롤링

검색 엔진은 웹 크롤러라는 봇을 이용해 전 세계 웹 서버에 존재하는 웹 페이지를 찾아다니며 정보를 수집 및 분류한다.
이 과정에서 특정 페이지를 수집에서 제외하거나, 사이트의 구조를 안내해야 할 필요가 생기는데, 그때 사용되는 것이 robots.txtsitemap.xml이다

  • robots.txt
    • 웹 페이지 중에서 수집되면 안 되는 민감한 정보나 페이지를 설정한다
      예) 관리자 페이지, 로그 파일 등
  • sitemap.xml
    • 홈페이지의 구조를 안내하는 지도 역할을 한다. 검색 엔진에게 어떤 페이지들이 존재하며, 어떻게 연결되어 있는지를 알려준다.
      예) 블로그, 게시판, 제품 페이지 등 주요 링크들을 포함

수집한 데이터를 정리하는 인덱싱

검색 엔진이 크롤링을 통해 수집한 모든 웹 페이지를 하나씩 정리하고 분류하는 작업을 인덱싱이라고 한다.
구글 검색 엔진 알고리즘의 시초인 PageRank가 바로 인덱싱의 핵심이었다.

페이지의 연관성과 중요도를 평가해 검색 결과의 순위를 매긴다.


사용자의 검색어에 맞는 결과 제공

검색 엔진이 정리한 인덱스를 기반으로 사용자가 입력한 검색어에 맞는 웹 페이지를 찾아준다. 이 과정이 빠르고 정확하게 이루어져야 고객들이 검색 엔진에 만족감을 느낀다.

하지만 중요한 점이 하나 있다.
수많은 웹 페이지 속에서 내 웹 페이지가 어떻게 하면 상위에 노출될 수 있을까?

이것을 해결하기 위한 방법이 바로 SEO (Search Engine Optimization), 즉 검색 시 상위 노출 전략이다.


SEO (Search Engine Optimization) : 검색 시 상위 노출

웹 페이지가 검색 시 상위에 노출되려면 고객의 입장에서 생각해야 한다.
좋은 콘텐츠뿐만 아니라 웹 페이지의 성능과 접근성도 좋아야 한다.

SEO 핵심 요소

  • 좋은 내용
    • 사용자에게 유용하고 질 좋은 콘텐츠를 제공.
  • Semantic HTML
    • 검색 엔진이 웹 페이지의 내용을 정확히 이해하도록 HTML 구조를 명확하게 작성.
  • 키워드 및 메타 태그
    • 주요 키워드와 적절한 메타 태그를 사용해 검색 엔진이 페이지의 내용을 잘 파악하게 작성
  • 웹 페이지 성능 (Performance Metrics)
    • 웹 페이지의 로딩 시간과 반응 속도는 사용자 만족도에 큰 영향을 미친다.
  • 웹 접근성
    • 다양한 사용자들이 불편함 없이 페이지를 이용할 수 있도록 웹 접근성을 높인다.

웹 페이지의 성능 평가 : Core Web Vitals

검색 엔진은 페이지의 성능을 평가할 때 Core Web Vitals를 기준으로 삼는다.

Core Web Vitals 핵심 요소

  • Load Time
    • 웹 페이지가 로딩되는 전체 시간
  • FCP (First Contentful Paint)
    • 웹 페이지에서 가장 첫 의미 있는 정보가 화면에 표시되는 시간
  • LCP (Largest Contentful Paint)
    • 웹 페이지에서 가장 큰 의미 있는 정보가 화면에 표시되는 시간
  • TBT (Total Blocking Time)
    • 동기 실행 시 멈춘 시간들
  • TTI (Time to Interactive)
    • JS 자바스크립트가 모두 동작가능한 상태로 준비 완료되기까지의 시간
  • FID (First Input Delay)
    • 사용자가 버튼이나 링크를 클릭했을 때 그 이벤트가 반응을 시작하는 시간