사이트맵(site)을 만드는법을 알아보자.
먼저 사이트맵이란 해당사이트(블로그등)에 있는 페이지, 동영상, 파일 등의 각각의 관계에 관한 정보를 표현하는 파일.
검색엔진(구글,네이버)등은 이 사이트맵 파일을 읽고 사이트를 지능적으로 수집하게 된다(크롤링)
사이트맵은 해당 글의 마지막 수정시간, 글 수정빈도등 아래와 같이 구성되어있다.
먼저 사이트맵이 필요한 이유는 다음 과 같다.
1. 매우 큰 사이트 ( 검색엔진이 크기로 인해 최근에 업데이트된 페이지를 지나칠 수 있음 )
2. 자연스럽지 못한 페이지 참조 ( 페이지가 서로 자연스럽게 참조하지 않는 경우 지나칠 수 있음 )
3. 연결되는 외부링크가 많지 않은 새로운 사이트 ( 사이트 수집 시 한 페이지에서 다른 페이지로 연결되는 링크를 따라 이동하며 수집 )
구글은 크롤링 일정이 복잡한 알고리즘을 사용하기 때문에, 사이트맵을 사용하더라도 사이트맵의 모든 항목이
크롤링되고 색인 생성된다고 보장하지는 않는다.
하지만 사이트맵을 제출하여야만 내 사이트 검색에 유리하며 어떤 경우에도 이로 인한 불이익은 없다.
구글의 사이트맵 가이드라인
1. 일관성 있는 정규화된 URL을 사용
https://www.example.com/에 있는 경우
(www없음) https://example.com/ (X)
(상대 URL) /mypage.html (X)
2. 사이트맵 파일은 UTF-8로 인코딩 되어야하며 적절하게 URL을 이스케이프 처리 해야함
3. 대형 사이트맵을 분할하여 여러 개의 소형 사이트맵을 만들면 구글에서 사이트맵을 자주 요청할 때에도
서버에 과부하가 걸리지 않게 할 수 있음
조건은, 하나의 사이트맵 파일은 최대 5만개의 URL을 포함할 수 있으며 압축하지 않은 파일의 크기가 50MB 이하여야함
( https://support.google.com/webmasters/answer/75712?visit_id=636875545990721694-162051442&rd=1 )
4. 다른 언어 또는 지역의 대체 페이지가 있다면 사이트맵을 사용하여 대체 URL을 표시( 대체로 hreflang태그 사용가능 )
사이트맵 만들기
이는 간단하다.
구글에 검색하면 사이트맵을 만들어주는 사이트가 많다.
대표적으로
http://www.web-site-map.com/ 등이 있다.
사이트맵을 구글에서 사용할 수 있도록 하기( 구글에 내 블로그의 사이트맵 제출)
1. 구글의 search console 에서 사이트맵 도구를 사용하여 구글에 사이트맵 제출
2. robots.txt 파일 내 아무 위치에 다음 행을 삽입하여 사이트맵으로 연결되는 경로 지정
( Sitemap: http://example.com/sitemap_location.xml )
3. ping기능 사용하여 구글에 사이트맵 크롤링을 요청
( http://www.google.com/ping?sitemap=<사이트맵_전체_url> )
( http://www.google.com/ping?sitemap=https://example.com/sitemap.xml )
( https://www.google.com/ping?sitemap=http://gojoo.tistory.com/attachment/cfile29.uf@9921FC435C81114F3391E3.xml )
출처 : 구글 콘솔 고객센터(https://support.google.com/webmasters/answer/156184?hl=ko&ref_topic=4581190)