robots.txt 에 대한 이해

작성자 관리자 작성일17-03-15 18:08 조회13,398회 댓글0건

본문

robots.txt 에 대한 이해

검색싸이트 (Google, Naver, Daum 등) 등록을 위한 검색엔진최적화 작업은 어떻게하면 검색엔진에 잘 보일수 있을까 하는 것이 관건일 것이다.

검색로봇은 링크를 타고 다니면서 정보를 수집, 정리하여 검색결과를 보여주므로 링크에 대해 상당히 민감합니다.

따라서 웹사이트 내부 링크 중 깨진 링크는 없는지 잘 살펴보고 깨진 링크를 제거 하는 것이 검색엔진최적화 중 한 부분이다.

어떤경우는 노출을 하면 안되는 폴더나, 파일이 있을 수 있습니다.

아래 robots.txt 예제를 보면서 설명을 추가해 봅니다.

User-Agent: * (모든 종류의 로봇의 접근을 허락함)

Allow: / (전체 웹사이트의 크롤링를 허락함)

Disallow: /lab/ (lab 폴더만 접근을 차단함)

Disallow: /*.asp$ (url의 마지막부분이 asp로 된 파일의 접근 차단)

Disallow: /*?(물음표 ?가 포함된 웹사이트 주소의 접근을 차단함)

가장 간단한 형식의 robots.txt 파일은 다음 두 가지 규칙을 사용합니다.

User-agent: 아래에 나오는 규칙이 적용되는 로봇

Disallow: 차단할 URL

이 두 행은 파일 내에서 단일 항목으로 간주됩니다. 원하는 만큼 항목을 추가할 수 있으며 하나의 항목에 여러 Disallow 행 및

여러 User-agent를 포함할 수도 있습니다.

User-agent 행에는 무엇을 포함해야 하나요?

User-agent는 특정 검색 엔진 로봇입니다.

웹 로봇 데이터베이스에는 다양한 일반적인 봇이 나와 있습니다. 이름을 표시하여 특정 검색 로봇에 대한 항목을 설정할 수도 있고,

별표(*)를 사용하여 모든 검색 로봇에 대한 항목을 설정할 수도 있습니다. 모든 검색 로봇이 해당되는 항목의 경우 다음과 같이 지정합니다.

User-agent: *

Google은 다양한 검색 로봇(user-agent)을 사용합니다.

Google 웹 검색에 사용하는 로봇은 Googlebot입니다. Googlebot-Mobile 및 Googlebot-Image 같은 봇은 Googlebot 설정된 규칙을 따르지만

해당 봇에만 적용되는 특정 규칙을 설정할 수도 있습니다.

Disallow 행에는 무엇을 포함해야 하나요?

Disallow 행에는 차단할 페이지를 표시합니다. 특정 URL이나 패턴을 포함할 수 있으며, 각 항목은 슬래시(/)로 시작해야 합니다.

사이트 전체를 차단하려면 슬래시를 사용합니다.

Disallow: /

디렉토리 및 디렉토리에 포함된 모든 항목을 차단하려면 디렉토리 이름 다음에 슬래시를 사용합니다.

Disallow: /junk-directory/

특정 페이지를 차단하려면 해당 페이지를 표시합니다.

Disallow: /private_file.html

Google 이미지 검색에서 특정 이미지를 삭제하려면 다음과 같이 설정합니다.

User-agent: Googlebot-Image

Disallow: /images/dogs.jpg

Google 이미지 검색에서 사이트 내 모든 이미지를 삭제하려면 다음과 같이 설정합니다.

User-agent: Googlebot-Image

Disallow: /

특정 파일 형식(예: .gif)을 차단하려면 다음과 같이 설정합니다.

User-agent: Googlebot

Disallow: /*.gif$

패턴 일치를 인식하지 못하는 검색 엔진도 있지만, Googlebot 일부 패턴 일치를 인식합니다.

별표(*)를 사용하여 일치하는 문자열을 찾을 수 있습니다. 예를 들어 private으로 시작하는 모든 하위 디렉토리에 대한 액세스를

차단하려면 다음과 같이 설정합니다.

User-agent: Googlebot

Disallow: /private*/

물음표(?)를 포함하는 모든 URL에 대한 액세스를 차단할 수 있습니다.

즉, 도메인 이름으로 시작되는 임의의 문자열 다음에 물음표가 있는 모든 URL을 크롤링하지 않도록 차단하려면 다음과 같이 설정합니다.

User-agent: Googlebot

Disallow: /*?

URL의 마지막 부분이 일치하도록 지정하려면 $ 문자를 사용합니다. 예를 들어 .xls로 끝나는 모든 URL를 차단하려면 다음과 같이 설정합니다.

User-agent: Googlebot

Disallow: /*.xls$

이 패턴 일치를 Allow 명령어와 함께 사용할 수 있습니다.

예를 들어 ?가 세션 ID를 나타내는 경우, 이를 포함하는 모든 URL을 제외시켜 Googlebot 중복된 페이지를 크롤링하지 않도록 해야 합니다.

그러나 ?로 끝나는 URL은 크롤링하려는 페이지의 버전이 될 수 있습니다. 이런 경우 robots.txt 파일을 다음과 같이 설정합니다.

User-agent: *

Allow: /*?$

Disallow: /*?

Disallow: / *?

명령어는 ?가 포함된 모든 URL을 차단합니다. 즉, 도메인 이름으로 시작되고 임의의 문자열, 물음표, 임의의 문자열로 구성된 모든 URL을 차단합니다.

Allow: /*?$ 명령어는 ?로 끝나는 모든 URL을 허용합니다. 즉, 도메인 이름으로 시작되고 임의의 문자열과 ?로 구성되며 ? 뒤에

문자가 없는 모든 URL을 허용합니다.

댓글목록

등록된 댓글이 없습니다.

번호	제목	글쓴이	날짜	조회
57	나눔글꼴 css	관리자	12-10	7350
56	css 소스	관리자	12-03	6252
55	무료 템플릿 사이트	관리자	11-21	7176
54	이미지 사이트	관리자	08-06	7146
53	유튜브에서 MP3 변환	관리자	03-27	20142
52	YouTube에서 비디오 및 오디오 다운로드	관리자	03-27	8922
51	Owl Carousel 2	관리자	02-18	7932
50	frame 프레임셋 만들기 (PC / 모바일)	관리자	09-20	17101
49	그누보드 게시판에 부트스트랩 페이징 적용하기	관리자	08-01	128292
48	부트스트랩 한국어 번역	관리자	07-27	10656
47	해상도에따라 어떻게 나오는지 확인할수있는 사이트	관리자	07-06	8088
46	에디터 플러스, 파일질라 목록 백업하는 방법	관리자	07-06	16122
45	iso 만들어주는 사이트	관리자	06-27	9882
44	폴더 암호걸기 Wise Folder Hider 간단해결	관리자	06-25	16656
43	게시판 1개로 스킨 여러개 사용하기	관리자	05-14	13524
42	시작페이지 및 즐겨찾기 추가하는 스크립트	관리자	05-14	13152
41	무료 템플릿 사이트	관리자	04-16	12750
40	모바일 확대 하기	관리자	03-22	13296
39	한글 맞춤법 검사기	관리자	02-21	12534
38	저작권 걱정 끝! 기업 및 공공기관 무료 글꼴 모아봤숑~	관리자	01-23	19398
37	유튜브 동영상 반응형으로 넣기	관리자	01-09	13056
36	디자이너를 위한 오픈소스 프로젝트 6선	관리자	10-26	13614
35	폰트 아이콘 주소	관리자	10-19	13134
34	유튜브 음악 다운 받는 프로그램	관리자	09-13	18138
33	무료 아이콘 사이트	관리자	09-12	19788
32	다음지도 올리는 소스 수정	관리자	07-26	13254
31	아이콘 무료	관리자	07-22	11634
30	사이트 링크 슬라이드	관리자	07-04	13374
29	사용	관리자	06-28	14142
28	반응형 유튜브 동영상 넣기	관리자	06-06	16056
27	유튜브 영상파일 mp3로 다운 받기	관리자	05-04	16284
26	로고 반응형 마다 다르게 보이고 싶을때	관리자	04-10	12414
25	검색엔진 최적회 메타태그	관리자	04-08	13290
24	android 바탕 화면 아이콘 자동 추가	관리자	03-21	12960
23	Re: android 바탕 화면 아이콘 자동 추가	관리자	03-21	19680
22	모바일 웹 사이트에서 바로가기 아이콘 만들기	관리자	03-21	19920
열람중	robots.txt 에 대한 이해	관리자	03-15	13404
20	모바일기기 접속시 자동 페이지 이동	관리자	03-15	13386
19	제이쿼리 슬라이드 갤러리 모음	관리자	02-23	28728
18	iframe 반응형 YouTube, Vimeo, 다음팟 플레이어 넣기	관리자	01-20	19830
17	온라인으로 MP3 볼륨을 높이세요	관리자	01-17	13656
16	revolution slider example download	관리자	01-10	12108
15	반응형 메뉴 스크롤 넣기	관리자	01-05	12732
14	전화 연결되는 소스	관리자	12-31	12966
13	반응형 PC와 모바일에서만 보이게 설정	관리자	12-08	26892
12	모바일상에서의 폰트사이즈를 PC와 동일하게 보여주고 싶다면	관리자	09-03	43050
11	특정 내용 모바일에서 안 보이게 할려면!!	관리자	08-26	35202
10	무료 이미지 디자인 소스 관련 사이트 모음	관리자	04-01	28206
9	부트스트랩 Bootstrap	관리자	04-01	12100
8	제이쿼리 슬라이드 갤러리 모음	관리자	04-01	21838

We Are Dataroom

고객의 성공적인 E-business를 다조아해가 함께 합니다.

디자인 TIP

robots.txt 에 대한 이해

본문

댓글목록

디자인 자료실

OPEN EVENT

Our Services

제작안내 및 가격

바로 신청하세요