HTML 웹 페이지에 일련의 키워드가 있습니다. 쉼표로 구분되어 있기 때문에 CSV 파일로 가져올 수 있으며 HTML 웹 페이지로 표시되는 다른 CSV 파일에는 어떤 파일인지 알기를 원합니다. 어떻게 비교 하시겠습니까? mysql과 테이블에 대한 아이디어가 있지만 이것은 CSV 또는 html 소스이다. 감사합니다.페이지 또는 CSV 파일의 키워드 비교 : PHP? 세게 때리다?
2
A
답변
1
이 스크립트는 a.csv 및 b.csv 파일 2 개를 제공하며 주어진 a.csv에 b가없는 모든 파일을 포함하는 새 파일 out.csv를 만듭니다 (또는 이미 존재하는 경우 편집). .csv.
import urllib
url = 'http://www.website.com/x.csv'
urllib.urlretrieve(url, 'b.csv')
file_a = open('a.csv', 'r')
file_b = open('b.csv', 'r')
file_out = open('out.csv', 'w')
list_a = [x.strip() for x in file_a.read().split(',')]
list_b = [x.strip() for x in file_b.read().split(',')]
list_out = list(set(list_a) - set(list_b)) # Reverse if necessary
file_out.write(','.join(list_out))
file_out.close()
1
키워드 목록 일 경우 검색을 수행하고 sed를 사용하여 모든 쉼표를 캐리지 리턴으로 바꿉니다. 따라서 각 행에 하나의 키워드가 들어있는 파일로 끝납니다. 두 버전의 목록 모두에 대해 그렇게하십시오. 그런 다음 "조인"명령을 사용하십시오.
join -v 1 leftfile rightfile
이렇게하면 rightfile에없는 모든 항목이 leftfile에보고됩니다. 먼저 파일을 정렬하는 것을 잊지 마십시오. 그렇지 않으면 조인이 작동하지 않습니다. 정렬을위한 bash 도구도 있습니다. (그것은 놀랍지 않게 "정렬"이라고 불립니다.)
1
PHP 솔루션 .. 문자열, 배열에 다음 변환 array_diff 기능을 사용할 때 키워드보기 :
<?php
$csv1 = 'a1, a2, a3, a4';
$csv2 = 'a1, a4';
$csv1_arr = explode(',', $csv1);
$csv2_arr = explode(',', $csv2);
$diff = array_diff($csv1_arr, $csv2_arr);
print_r($diff);
>
관련 문제
- 1. PHP 및/또는 키워드
- 2. CSV 또는 XLS 파일의 MACRO 란 무엇입니까?
- 3. PHP 비교 또는 mysql 데이터?
- 4. RTF 파일의 키워드 잘림
- 5. CSV 파일의 쉼표 바꾸기
- 6. CSV 파일의 행 바꾸기?
- 7. Powershell에서 두 CSV 개체 비교
- 8. SQL 비교 테이블 및 비트 배열 또는 CSV 반환
- 9. MySQL 표 1 및 표 2의 키워드 검색/비교 :
- 10. Doxygen을하고 가시 키워드 PHP
- 11. 클래식 ASP "또는"키워드
- 12. 키워드 검색 페이지 및 URL
- 13. ASP.NET에서 키워드 클라우드 추가하기 페이지
- 14. PHP에서 내보내기 CSV 파일의 문제
- 15. CSV 파일의 줄에 텍스트를 추가하십시오.
- 16. csv 파일의 열 ID 검색
- 17. .csv 파일의 필드 값 읽기?
- 18. CSV 파일의 코드로 어떻게이 페이지를 비밀번호로 보호합니까?
- 19. 파이썬으로 csv 파일에서 valuse 검색 및 비교
- 20. 탭으로 구분 된 csv 파일의 유효성 확인
- 21. MSBuild 또는 CCNet을 사용하여 이미지/파일의 이진 비교
- 22. Dreamweaver에서 두 파일의 내용 비교
- 23. PHP에서 텍스트 파일의 문자를 비교
- 24. PHP CSV 업로드 파일
- 25. PHP CSV 내보내기 기능
- 26. php csv 동적 열
- 27. PHP CSV 고부하 요청
- 28. h 파일의 정적 키워드 및 내부 연결
- 29. .ascx 디자이너 파일의 글로벌 키워드 의미는 무엇입니까
- 30. CSV 파일의 값으로 Oracle 테이블을 업데이트하십시오.
당신이 문제를 조금 명확히 할 수? csv와 csv 또는 html을 비교하려고하는지 혼란 스럽습니다. 언급 된 데이터의 몇 가지 예를 게시 할 수 있습니까? – Itako