강의 컨설팅 트레이닝 무료진단 무료책자 마케팅편지 마케팅정보공유 다이어리 서비스제휴 고객센터

웹페이지내에 로봇배제방법
작성자 : 99 단국강토
등록날짜 : 2009.01.08 10:04
2,216

로봇이라는 프로그램이 네트워크를 돌아다니게 되면, 자칫 네트워크에 엄청난 트래픽(Traffic)이 발생할 수 있다.

즉, 네트워크에 과부하가 걸려 특정 사이트에 접속이 잘 되지 않거나

속도가 느려지는 문제가 생길 수 있다. 또한 동호회 명단, 직장 전화번호등 원치 않은 정보가 검색엔진에 노출되는 결과가 생길 수도 있다.


두 번째로 로봇 배제(Robot exclusion) 표준을 따르는 방법이 있습니다.

로봇 배제 표준이란 말 그대로 웹문서를 수집해 가는 로봇을 배제한다는 뜻입니다.

로봇의 배제와 관련된 내용을 적어 놓은 robots.txt 파일을

사이트의 최상위 주소(서버 루트 디렉토리 예:www.gaseo.com/robots.txt)에 저장하면 됩니다.

robots.txt를 서브디렉토리에 놓는 경우 효력이 없다는 사실에 주의하세요.

예를 들어, www.yourhost/~mypage 밑에 robots.txt가 있어도 이는 아무런 효력을 갖지 못합니다.

로봇은 오직 루트 디렉토리의 robots.txt만을 참조할 뿐입니다.

로봇의 접근을 어디까지 허용할 것이냐에 따라 robots.txt에 들어가는 내용은 달라집니다.

로봇 배제에 대한 보다 자세한 내용은 http://www.robotstxt.org에서 확인할 수 있습니다.


(1) 모든 로봇을 배제하고 싶을 때


User-agent: *

Disallow: / 


(2) 모든 로봇을 허용하고 싶을 때

이 경우에는 “robots.txt”를 작성할 필요가 없으나, 굳이 작성을 하자면 다음과 같습니다.

( (1)과 비교했을 때 “/”가 빠져 있습니다.)


User-agent: *

Disallow: 


(3) 모든 로봇에게 서버의 일부분만을 제한하고 싶을 때


User-agent: *

Disallow: /my_photo/

Disallow: /my_diary/ 


이렇게 작성하면 로봇은 my_photo, my_diary라는 폴더에 속한 웹문서에 접근할 수 없습니다. 


(4) 특정 로봇만을 배제하고 싶을 때

아래의 예에서는 “EvilRobot”이라는 이름을 가진 로봇만을 배제하게 됩니다.


User-agent: EvilRobot

Disallow: /   


(5) 특정 로봇에게만 접근을 허용하고 싶을 때

아래의 경우 Cowbot만이 웹문서를 수집해갈 수 있습니다.


User-agent: Cowbot

Disallow:

User-agent: *

Disallow: / 


3)세 번째로 메타태그를 이용하는 방법


“robots.txt”를 작성하는 것과 유사한 방법으로

HTML문서의 <HEAD>와 </HEAD> 태그 사이에

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">라는 메타태그를 추가하면

로봇은 웹문서를 가져갈 수 없습니다.

이 방법은 다소 번거롭기는 하지만 문서 하나하나에 대해 정확하게 명시를 해주기 때문에

가장 확실하게 로봇의 접근을 막을 수 있는 방법입니다.

"쇼핑몰·홈페이지·오픈마켓
블로그·페이스북·이메일 등의 각종 마케팅 글쓰기,
각종 광고, 영업, 판매, 제안서, 전단지
반응율 3배×10배 이상 높이는 마법의 8단계 공식"
자세히보기

Comments

번호 제목 글쓴이 날짜 조회
2835 고스트에서 USB외장하드 USB2.0으로 사용하기 13 김영철 01.29 3220
2834 고스트 원본 이미지 파일 분할 13 김영철 01.29 2803
2833 도스에서 고스트 백업파일 분할 13 김영철 01.29 2905
2832 윈도우XP에서 오라클 8.1.X 설치 13 김영철 01.29 2561
2831 윈도우에서 오라클 백업 13 김영철 01.29 3011
2830 윈도우에 설치된 오라클9i 삭제하기 13 김영철 01.29 4621
2829 [매뉴얼 정리] 오라클 백업 M 최고의하루 01.12 3279
2828 표준 보안 퍼미션 설정 M 최고의하루 01.12 2504
2827 검색로봇의 서버 검색 피하기 99 단국강토 01.08 2747
열람중 웹페이지내에 로봇배제방법 99 단국강토 01.08 2217
2825 텔넷으로의 압축 해제 디비복구 99 단국강토 01.07 2743
2824 페도라 한글언어 설정 99 단국강토 01.07 2803
2823 [Apache] 페도라4 아파치 - 한글, PHP 설정 99 단국강토 01.06 2383
2822 VMware 5.5 설치 및 기본설정 99 단국강토 01.06 3079
2821 vmware에 설치한 페도라코어5에 vmware tool 설치하기 99 단국강토 01.05 3043
2820 Fedora Core5 설치~ 99 단국강토 01.05 2154
2819 윈도우와 리눅스 멀티부팅 M 최고의하루 01.03 3455
2818 x window로 바로 부팅하기 M 최고의하루 01.03 2371
2817 리눅스의 부팅 디스켓을 어떻게 만드나요? 99 단국강토 01.02 3224
2816 리눅스를 제거하고 싶은데 가능한가요? 99 단국강토 01.02 2563
2815 리눅스의 기본 명령어 99 단국강토 12.30 3035
2814 제로보드를 utf-8 인코딩으로 바꾸기 99 단국강토 12.30 2366
2813 네트웍 서브넷과 IP 컨버팅등을 쉽게 알아볼수 있는 사이트 소개합니다. 17 vane 12.27 2325
2812 제로보드 4.1 pl7 UTF-8 패치 (MySQL은 포함되지 않음) M 최고의하루 12.26 2803
2811 삼바와 리눅스 인터넷 설정..^^ M 최고의하루 12.26 2882
2810 리눅스 명령어 디비복구 제로보드 복구 M 최고의하루 12.24 3282
2809 텔넷을 통한 DB 백업 방법 M 최고의하루 12.24 2366
2808 Window 2003 Server에서 IIS6.0 설치 M 최고의하루 12.23 3241
2807 [윈도우 2003] Windows 2003을 XP처럼 쓴다? M 최고의하루 12.23 2369
2806 Window 2003 SP1 설치후 COM+ 분산트랜잭션 문제 M 최고의하루 12.20 2672
마케팅
특별 마케팅자료
다운로드 마케팅자료
창업,경영
기획,카피,상품전략
동기부여,성취