2016-07-18 2 views
0

반복하는 경우 매우 유감입니다. 나는 그것에 무엇인가 봤다, 그리고 나는 그것을 다시 발견 할 수 없었다. Node.js 대 Python을 구문 분석 용 HTML

이 다른 항목보다 더 구체적으로, 내가 가진 말 :

<h1>Hey, there.</h1> 

h1 { 
    color: green 
} 

난에 "파란색"으로 변경하고 싶습니다. Python이나 Node.js를 사용하면 더 적은 코드로 /보다 정확하게/적은 시간으로 더 효율적으로 할 수 있습니까?

내가 가진 말 :

<h1>Hey, there1.</h1> 

가 변화하기 쉽다 "이봐, there1을." "헤이, 거기 .2". 파이썬 또는 Node.js와 함께?

또한, 내가 가진 말 :

<h1>Hey, there.</h1> and want to add <a> tags so that it is: 

<h1><a href="">Hey, there.</a></h1> 

사람들은 내가 생각할 수있는 삼가지 경우입니다. HTML 태그와 콘텐츠 블록을 다르게 구성/콘텐츠/CSS HTML로 변환하려고합니다.

저는 현재 Python이나 Javascript에 익숙하지 않으며 처음부터 잘못된 경로를 따라가는 것을 원하지 않습니다.

나는 또한 찾기/바꾸기 문을 엄청나게 할 생각이 있지만 매우 우아하지는 않습니다.

도움/의견을 보내 주셔서 감사합니다.

+1

나는 당신이 틀린 질문을하고 있다고 생각합니다. 태그의 내용을 변경하는 것에 대해서만 걱정한다면 Python이나 JavaScript 사이에서 중요한 선택이 될 것입니다. 당신을 더 행복하게 해주는 것을 선택하십시오. 데이터베이스와의 통합과 같은 추가 기능을 구현하기 시작할 때 더 중요한 언어 선택이 중요합니다. 귀하의 * 요구 사항 *이 귀하의 * 선택 사항을 안내하게하십시오 - 다른 방법은 아닙니다. –

+1

그들은 둘 다 잘못된 경로가 아니지만 결국 웹 끝에 자바 스크립트가 필요합니다 – YOU

+0

더 익숙한 언어를 선택하십시오. 더 많은 지원을받을 수있는 팀 (팀에서 일하는 경우). – player87

답변

0

운 좋게도 파이썬과 노드 모두 멋진 도구가 있습니다.

그러나 이제 막 시작한 이래서 내가 묻는 질문은 "이걸로 무엇을 배우고 싶니?"라고 동의합니다.

단지 목표가 스크레이퍼/파서를 만드는 것이라면 다른 것을 선택하는 것이 중요하지 않습니다. 장기 목표와 궁극적으로 스킬 셋을 형성하려는 방법에 대해 생각해보십시오.

저 강의는 제쳐두고 (저는 개인적으로) 훨씬 쉬운 경로라고 생각하고 있기 때문에 nodejs 방향을 가르키겠습니다. 다른 사람들은 자바 스크립트가 웹 언어이기 때문에 webdev/스크래핑/미래에 어떤 것이 든, 그것은 매우 도움이됩니다.

1 단계 : nodeJS 난 당신이 이미 (https://nodejs.org/en/)가 확신으로

하는 노드를 설치는, 폴더로,이 프로젝트에 CD를 좋은 작은 폴더를 만들고이 실행

npm init

노드가 작업 할 곳을 알리고 여기에 패키지를 설치합니다 (여기서 npm은이 디렉토리 안에 호출됩니다).

2 단계 : 당신은 몇 가지 좋은 기능을 가진 HTML 파서를 설치할 수 있습니다 패키지

, 난 당신이뿐만 아니라 JQuery와 약간의 학습의 최선을 얻을 것이기 때문에 안녕 (https://github.com/cheeriojs/cheerio)를 추천합니다

npm install --save cheerio

좋아요, 우리는 재미있는 프로젝트의 시작을!

세 번째 단계 : 당신이 원하는대로

이름을 main.js하지만은 .js 파일에는 정답이 없습니다

let http = require('http'), 
    cheerio = require('cheerio'); 

// 
// from cheerio docs 
// 
let $ = cheerio.load('<h2 class="title">Hello world</h2>') 

$('h2.title').text('Hello there!') 
$('h2').addClass('welcome') 

$.html() 
//=> <h2 class="title welcome">Hello there!</h2> 

//console log some changes and see the change from Hello world to Hello there! 
console.log($.html()); 

으로 가야 할 수 있도록 할 수 있습니다.

귀하의 목표에 맞는 것을 선택하십시오.