을 분석해 될 파일이 같은 구조 텍스트 파일의 이름입니다 :는 계수 해시 태그
Date|||Time|||Username|||Follower|||Text
기본적으로 입력은 위와 같이 구조화 된 여러 행이있는 짹짹 목록입니다. 목록 매개 변수는 해당 텍스트 파일에서 계산할 해시 태그 목록입니다. 주어진 목록의 각 단어가 짹짹 목록에서 몇 번이나 발생했는지 확인하고, 단어가없는 경우에도 각 단어 수가 포함 된 사전을 출력으로 제공하기를 원합니다. 예를 들어
, 지시 HASHcount와 (12월, [평화, 사랑]) 프로그램이 출력으로 얼마나 많은 시간을 단어 평화와 사랑 단어를 확인하여 만든 사전을 제공한다은 해시 태그로 사용되어왔다 12 월이라는 파일의 각 트윗의 텍스트 필드에
또한 사전에 해시 태그가없는 단어가 있어야합니다. 나는이 기능을 만들기에 붙어
, 나는이 점에있어하지만 사전에 관한 몇 가지 문제가 있어요 :
def HASHcount(name,list):
f = open(name,"r")
dic={}
l = f.readline()
for word in list:
dic[word]=0
for line in f:
li_lis=line.split("|||")
li_tuple=tuple(li_lis)
if word in li_tuple[4]:
dic[word]=dic[word]+1
return dic
나를 유치원이라 부르지 만, '분석 된'맞춤법 오류로 나를 웃게했습니다. – Gerrat
입력 파일의 예를 게시 할 수 있습니까? 죄송합니다 지금보십시오 –
이것은 정규식에 대한 좋은 직업입니다. 또한 예약어이기 때문에 "list"를 Python의 변수 이름으로 사용하지 마십시오. – dylrei