2009-10-20 3 views
-1

내 hwk에 대한 몇 가지 문제가 더 있습니다. 내가 할 수 있었던 건 폼을 만드는 것 뿐이야. 우리는 웹 사이트의 정보를 가져와 특정 정보를 우리 양식의 텍스트 상자에 다시로드해야합니다. 누군가가 도울 수 있다면 올바른 방향으로 추진해야합니다.VB 2008 - 웹 사이트 질문에서 데이터 추출

할당 6 - 텍스트 구문 분석은

대부분의 응용 프로그램은 텍스트 블록에서 정보를 추출해야합니다. 우리는 이것을 프로젝트에서 많이 사용할 것입니다. 이 프로젝트는 텍스트 파일에서 정보를 추출하는 연습을 제공합니다. 파일을 열고 특정 내용을 찾기 위해 파일을 검색 한 다음 해당 내용을 복사하여 화면에 놓아야합니다.

Jobs.com으로 이동하여 성과 같은 문자로 시작하는 상태를 선택하십시오 (동일한 문자로 시작하는 상태가없는 경우 두 번째 문자, 세 번째 문자 등 사용). 예를 들어 내 이름이 'John Byway'인 경우 B 또는 Y가 없기 때문에 W, Washington, West Virginia, Wisconsin 또는 Wyoming으로 시작하는 주를 선택합니다.

아이디어는 페이지에서 모든 작업 정보를 추출하려는 것입니다. 우리는 작업 이름을 콤보 상자에 넣으므로 사용법에 따라 작업 중 하나를 선택할 수 있습니다. 이상적으로는 각 작업에 대한 정보도 표시됩니다. 당신은 그렇게 할 필요가 없습니다. 그러나 정보를 추출하여 화면에 표시해야합니다 (다음 작업을로드하면 이전 작업 정보가 손실되고 마지막으로로드 된 작업에 대한 정보가 남게됩니다)

작업 1. 위 주소로 이동하여 브라우저에서 소스를보고 복사하여 텍스트 파일에 붙여 넣으십시오. 응용 프로그램 내에서 웹 페이지의 소스에 액세스 할 필요가 없습니다 (Internet Explorer에서보기/소스로 이동, FireFox에서보기/페이지 소스로 이동). 3. 각 작업 제목을 추출하고 콤보 상자에 이름을 지정하십시오. 4. 다음 필드를 찾아 추출하십시오. 일부 작업은이 모든 것을 나열하지 않을 수 있습니다. 이 경우, 제시된만큼 많은 것을 얻으십시오.

a. 날짜 : b. 직업 명 c. 회사 d. 위치 e. 직업 설명 f. 각 설명의 "추가 정보"와 연결된 URL g. 경력 사례 h. 경력 수준 i. 교육 수준

  1. 발견 한 작업 수를 화면에 나타냅니다. 작업의 첫 번째 페이지 만 살펴 봐야합니다.
+2

다른 사람이 숙제를하기 쉽도록 과제를 게시하십시오 :) –

답변

0

RegEx는 필요한 텍스트 구문 분석을 수행하는 가장 좋은 방법입니다.

VB Dot Net Heaven Intro to RegEx

Discussion about parsing HTML with VB.Net

참고 : 잘 정의 된 정규식 패턴 코드의 12 라인이 할당에 당신을 위해 할 무거운 얻을 것이다 다음 링크의 몇 가지 있습니다.

P. 미래의 참고 및 아마도 지금은 ... 귀하의 질문에서 말도 안되는 부분을 잘라. 당신의 이름으로 편지를 가진 주를 선택하는 것에 관한 그 전체 작은 조각은 어리 석다. 꺼내주세요. 혼란 스러울뿐입니다.