기사 목록에 여러 다른 이름이 언급되는 빈도를 확인하는 데이터 세트를 설정하려고합니다. 그래서 각 기사마다 nameA, nameB 등의 언급 빈도를 알고 싶습니다. 그러나 목록을 반복하는 데 문제가 있습니다.파이썬에서 문자열 목록을 반복합니다.
내 코드는 다음과 같다 :
for element in list_of_names:
for i in list_of_articles:
list_of_namecounts = len(re.findall(element, i))
- LIST_OF_NAMES 여러 이름으로 문자열을 = [nameA nameB nameC]는
- list_of_articles 기사
있습니다 40.000 문자열 목록을 = list_of_articles에있는 기사의 예 :
- 인덱스 : 1
- 유형 : STR
- 크기 : 암스테르담 - 드 financiële ...
내가 오류는 다음 반복 때 예상 문자열 또는
내가 그 생각을 버퍼 re.findall 명령은 이와 같은 목록을 사용하여 작동해야하지만, Python에도 상당히 새로운 것입니다. 내 아이디어를 어떻게 해결할 수 있습니까?
감사합니다.
'. 정규식을 사용하고 있지 않습니다. 'filter'를 찾고 있습니다. – trincot
요소 유형은 무엇입니까? 나는 어떤 종류입니까? 어쨌든 인쇄를 사용하여 디버깅하십시오. – Moberg
'list_of_articles'의 일부분을 주시겠습니까 –