구글 웹마스터 도구들(Webmaser Tools)- 구글을 통한 내 사이트 분석
검색엔진 등록 방법론
using sitemap generator for google
그리고 오늘 sitemap에 의한 적용된 색인결과와 에러를 확인할 수 있었다.
에러를 확인하면서 중요한 점을 발견할 수 있었는데 다음과 같다.

Sitemap 생성시 웹 서버의 access log를 기반으로 생성하였는데, 별 주의 없이 생성해서인지 위처럼 PHP에 의해 생성된 SESSION 값까지 달려 있는 것을 확인할 수있었다.
추측컨데, 이것은 자칫 로그인 했을경우의 세션도 Sitemap에 등록될 수 있으며, 최악의 경우 서버에서 Session을 계속 유지하도록 설정되어 있다면, 혹은 해당 세션으로 사용자가 계속 사용중에 구글링이 이루어 진다면, 개인정인 정보를 로봇이 긁어갈 수 있는 위험에 노출되어 있는 것이다.
Sitemap이 구글 검색엔진이 자신의 사이트를 색인하는데 도움을 주지만 생성시 access log를 이용할때는 이점을 주의해야 할 것으로 보인다.
access log를 활용한 Sitemap 생성은 그리 추천할 만한 방법이 아닌것 같다.
리눅스 시스템의 경우 정규식을 이용 필터링된 access log를 만들어 그 결과를 가지고 Sitemap을 생성하는 것도 다른 한 방법일지도 모르겠다.
기본적으로 다른 Sitemap 생성 방법들도 있으므로 다른 방법을 사용하길 추천한다.
또한 위 그림의 노란색이 원인이 되어 색인을 연기했다는데 ^^; 무슨 말이지 잘 이해가 되지 않았다.
일단 기존 Sitemap 파일 등록을 삭제하고 다시 사이트 맵을 생성해야 할 것 같다.
제출된 약 600여개의 Sitemap URL중 40여개만이 색인된것으로 보아 무언가 문제가 있는 것으로 보인다.
robots.txt 문제도 해결해야할 문제로 보인다.
일단은 단순 구글 검색엔진 사이트 등록 페이지에서 URL을 등록해 두었다. 그것이라도 잘 동작하길 기대해 본다.






