안녕하세요, 나는 성공적으로 파이썬에서 분할 기능을 사용하여 문제가 있습니다. 크롤러를 사용하여 일부 트윗을 수집했으며 각 트윗의 일부분을 다른 .json 파일 (특히 ID 및 # (해시 태그))로 분할해야합니다. 나는 성공하지 못한 split 함수를 사용하고있다. 나는 잘못하고있다? 나는 "ID"및 "텍스트"후 어떤 다른 .json 파일로 저장할
이 텍스트는 다음과 같습니다어떻게 파이썬에서 분할 기능을 사용하여 텍스트의 일부를 분할하고 다른 파일에 저장할 수 있습니까?
{ "created_at": "20 16시 35분 36초 0000 2017 금 시월" "ID"921414607302025216 "ID_STR": "921414607302025216", "텍스트": "@ IdrisAhmed16 loooooool 내가 indirecting 있다고 말했다 누가 당신은 내가 당신이 명령 줄에 파이썬을 실험한다고 생각
def on_data(self, data):
try:
#print data
with open('Bologna_streams.json', 'r') as f:
for line in f:
tweet = data.spit(',"text":"')[1].split('",""source"')[0]
print (tweet)
saveThis = str(time.time()) + '::' +tweet
saveFile = open('Bologna_text_preprocessing.json', 'w')
json.dump(data)
saveFile.write(saveThis)
saveFile.write(tweet)
saveFile.write('\n')
saveFile.close()
f.close()
return True
except BaseException as e:
print("Error on_data: %s" % str(e))
time.sleep(5)
def on_error(self, status):
print (status)
당신은 당신이 텍스트의 예를 줄 수있는 목적은 모든 해시 태그를 찾을 경우
그러나, 당신은 정규 표현식을 사용하는 것이 더 낫다 나눌려고. –
@NickChapman의 의미는 다음과 같습니다. ** 질문 **을 분할하려는 텍스트의 예와 함께 업데이트 할 수 있습니까? – quamrana
예. –