현재 위치 - 중국오락넷 - 청소년 오락 포럼 - 바람정보수집시스템 이용방법

바람정보수집시스템 이용방법

튜토리얼:/entertainment.shtml

1. 사이트 설정:

1. 사이트 만들기:

사이트 설정을 선택하여 컬렉션 사이트 설정으로 들어갑니다.

먼저 "새 사이트"를 선택하세요.

사이트 이름을 "연예뉴스"로 지정했고 필요에 따라 저장 대상 열을 선택할 수 있도록 수집 대상인 Test_1로 설정했습니다. 페이지 수집 사이트 주소를 입력하세요: /entertainment.shtml 물론, 수집된 개체 페이지에 사진이 있을 수 있으므로 원격에서 사진을 수집할 필요가 없도록 설정했습니다. 개체 페이지에서는 선택할 필요가 없습니다. 그런 다음 저장하면 백그라운드의 사이트 설정에서 방금 만든 사이트를 볼 수 있습니다.

다음으로 마법사를 수정해야 합니다.

2. 수정 마법사:

수정 마법사를 클릭하면 다음 인터페이스가 나타납니다.

방금 만든 사이트에 대한 매개변수는 다음과 같습니다. 조건을 설정하려면 "다음"을 직접 클릭하세요. 뉴스 목록 가져오기 :

이번에는 사이트를 열어서 컬렉션 개체 페이지의 소스 파일을 보는 것이 좋습니다. 적합한 조건을 찾기가 더 쉽습니다.

DW에서 뉴스 목록의 소스 코드 보기:

아래 그림에서 음영 처리된 영역은 목록 코드입니다.

그림에서 볼 수 있는 내용은 다음과 같습니다. 목록 시작 부분의 코드는

입니다. 이 코드가 소스 파일에서 고유한지 확인하는 것이 가장 좋습니다. 고유한 경우 조건 설정 상자를 채울 수 있습니다. 고유하지 않은 경우 코드의 범위를 확장하여 코드의 고유성을 확인할 수 있습니다.

그런 다음 목록 코드가 끝나는 위치를 살펴봅니다.

이 페이지의 목록 코드 끝은 다음과 같습니다.

이런 방식으로 우리는 다음을 찾습니다. 목록 코드의 시작 부분과 끝 코드, 이 두 줄의 코드는 우리가 얻어야 하는 뉴스 목록을 직접 나타내므로 우리가 설정한 조건은 다음과 같습니다.

여기에는 페이지 매김이 없으므로 다음을 클릭하세요. 조건 설정:

이때 페이지가 목록 URL 조건 설정 부분, 코드 부분, 이전의 경우 결과 부분으로 나누어져 있는 것을 볼 수 있습니다. 단계가 올바르게 설정되면 여기에 있는 코드 부분과 결과 부분이 표시됩니다. 가져온 뉴스 목록의 코드와 뉴스 목록이 표시됩니다.

여기서 링크를 얻기 위한 코드 설정을 시작합니다.

어두운 부분은 뉴스의 코드이며, 뉴스의 링크 경로 코드는 다음과 같습니다.

, 그러면 경로를 "/news/2005/2005-11-"로 직접 변경할 수 있습니다. 01/8/645660.shtml" 이를 매개변수 [목록 URL]로 대체하고 설정된 수집 조건은 다음과 같습니다.

이 단계를 설정한 후 다음을 클릭하면 뉴스 페이지를 읽기 위한 조건을 설정해야 합니다. .

이 단계에서는 미리보기 결과 항목을 볼 수 있습니다. 설정 조건이 맞다면 링크를 클릭하면 목록의 첫 번째 뉴스 페이지가 열립니다.

주로 뉴스 제목과 뉴스 내용을 설정하는 곳입니다. 다른 작성자 설정의 실제 원칙은 동일합니다.

먼저 뉴스 페이지를 열고 소스 파일을 보고 DW에서 해당 코드를 찾으세요.

『제목 설정』 이 사이트의 페이지 제목은 그림과 같이 뉴스 제목입니다:

, 그러면 조건을 다음과 같이 설정할 수 있습니다: <제목>[ title], 페이지 제목이 뉴스 제목이 아닌 경우 페이지 내에서 확인해야 합니다. 예를 들어 이 페이지의 제목 코드는 다음과 같을 수도 있습니다:

그런 다음 조건은 다음과 같습니다. 또한 다음과 같이 설정됩니다:

[ Title]
은 물론 이때의 조건에 주의를 기울여야 합니다.

'콘텐츠 설정'에서 해당 콘텐츠가 위치한 코드를 찾으세요. 이때 뉴스 콘텐츠 앞에 사진이 있으면 콘텐츠에 사진이 포함되어 있으니 주의하시기 바랍니다. 사진을 삭제하고, 필요하지 않은 경우 사진을 제거하지 마세요.

이전과 동일한 원리를 사용하여 콘텐츠의 시작 부분을 찾을 수 있습니다.

, 여기서 끝이 반드시
일 필요는 없다는 점에 유의하세요. 실제 상황에 따라 이 목록의 끝처럼 다른 테이블의 시작일 수도 있습니다. 여기서 최종 코드는 다음과 같습니다:

.

제목과 콘텐츠를 수집하기 위해 설정한 조건은 다음과 같습니다.

여기에서 뉴스의 출처를 직접 설정할 수 있습니다.

그런 다음 다음을 클릭하세요. 수집 효과를 볼 수 있습니다.

제목이나 내용이 나오지 않는다면 수집조건 설정에 문제가 있을 수 있으니, 자주 수집을 하시면 여러번의 디버깅이 필요할 수 있습니다.

2. 키워드 필터링:

설정의 마지막 단계에서 볼 수 있듯이 수집된 뉴스에는 광고가 포함되어 있으므로 광고를 필터링해야 합니다. 새 필터를 선택하고 필요한 조건을 설정하세요.

규칙 이름을 직접 선택하고 이를 적용할 올바른 사이트를 선택하세요. 중요한 것은 필터 문자열에 대한 조건을 설정하는 것입니다. 광고가 있는 코드를 찾으려면 여기에서 광고 필터링을 다음 코드에 따라 설정할 수 있습니다. string], 물론 필요한 경우 자신만의 광고를 추가하려면 여기의 "바꾸기"에서 바꿔야 할 코드를 설정하여 자신의 광고를 호출할 수 있습니다.

수집

사이트 설정에서 당사가 설정한 수집 사이트를 보고 조건이 설정된 경우 직접 수집할 수 있습니다.

수집 버튼을 클릭하세요. "연예뉴스"에 해당하는 대화상자가 나타납니다.

전체 페이지에서 뉴스를 수집하려면 수집 수량을 설정할 필요가 없습니다. 그렇지 않으면 항목 수를 설정하세요. 수집해야 하지만, 설정한 개수가 이 페이지의 뉴스 개수를 초과할 수 없으므로 주의하세요.

편의상 수집을 시작하면 5개 항목만 수집됩니다. 프롬프트를 볼 수 있습니다:

수집이 완료되면 다음을 볼 수 있습니다.

수집에 실패하면 제목인지 오류인지 묻는 메시지가 표시됩니다.

4. 데이터베이스에

수집한 후 방금 수집한 데이터를 볼 수 있습니다.

입력할 뉴스를 선택할 수도 있습니다. 모두 라이브러리에 저장됩니다. 검토 중에는 파일을 볼 수 없지만, 여기에서 수정을 클릭하여 광고가 여전히 필터링되었는지 확인할 수 있습니다.

5. 검토

수집 사이트 설정 시 '뉴스 검토 여부'를 선택하면 해당 내용이 없습니다. 그렇지 않으면 뉴스를 검토해야 합니다.

기사를 검토한 후 미리보기를 직접 생성할 수 있습니다. 방식으로 컬렉션이 완성되었으며 컬렉션 설정에는 주로 html이 필요합니다. 코드에 대해 어느 정도 이해하고 설정 시 조건의 고유성에 주의해야 합니다.

copyright 2024중국오락넷