2009-06-29 5 views

답변

1

기계화 (또는 루비)에 대한 경험이 없지만 웹 크롤러처럼 보입니다.

현재 Facebook 홈 페이지에서 사용자 ID를 가져 오는 가장 쉬운 장소 인 프로필 링크.

양식은 http://www.facebook.com/profile.php?id=UID & ref = profile입니다. UID는 64 비트 정수입니다. Facebook은 많은 클라이언트 측 프로세싱을 선호하므로 "profile? id ="를 검색하는 것이 가장 좋습니다.

+0

그것을 반환 http://www.facebook.com/lennie.d.villiers를 ? ref = profile UID가 아닙니다. –

+0

Odd. 필자는 약 80 개의 서로 다른 계정에 배포 된 스크린 스크래퍼를 작성했습니다. –

+0

구문 분석을 위해 사용하는 코드는 무엇입니까? Lennie –

0

http://rfacebook.rubyforge.org/과 같은 것을 사용하고 실제 Facebook 응용 프로그램을 작성할 수 있습니다. 이렇게하면 화면 스크래핑에 대해 걱정할 필요없이 누군가의 UID와 같은 것을 가져 오기위한 잘 정의 된 API 호출이 제공됩니다.

저는 파이썬으로 페이스 북 앱을 작성하는 데 약간의 시간을 할애했으며 API는 사용하기가 비교적 쉽습니다.

즉, 화면 스크래핑을 설정하면 UID가 예를 들어 홈 페이지의 소스 전체에 여러 번 포함 된 것처럼 보입니다. "소스보기"를 시도 했습니까? 다음 형식은 대부분의 페이지에 포함 된 것으로 나타납니다, 그리고 명확하게 HTML 내부에 elemet로 표시된 UID가 포함되어 나를 위해

<div id="autoset_timezone" style="display: none"> 
<form method="get" action="/ajax/autoset_timezone_ajax.php" name="tz_autoset_form" id="tz_autoset_form"> 
<input type="hidden" id="post_form_id" name="post_form_id" value="9d6bfda325b20b769431ea6f023ac9ee" autocomplete="off" /> 
<input type="hidden" id="user" name="user" value="26992" autocomplete="off" /> 
<input type="hidden" id="tz_gmt_off" name="tz_gmt_off" value="-300" autocomplete="off" /> 
<input type="hidden" id="time" name="time" value="1264648516" autocomplete="off" /> 
</form>