읽어 주셔서 감사합니다! 나는 이것에 아주 익숙하지만 어제 나는 웹 사이트에서 데이터 (항목의 이름과 해당 가격)를 추출하기 시작했으며 파이썬 2.7을 사용하여 주어진 웹 사이트의 price, item-name 형식으로 CSV 파일을 만드는 방법을 알아 냈다. 이제 데이터를 비교하고 주어진 아이템 이름에 대해 평균 가격을 얻으려고합니다. 내가 지금 직면하고있는 문제는 각 웹 사이트마다 항목 이름이 다를 수 있다는 것입니다. 예를 들어 첫 세트는CSV 텍스트를 정리하고 파이썬으로 비교하기
4.0, Jungle Book
5.0, "Peter Pan"
4.0, Lady and the Tramp
두 번째 CSV 파일 세 번째는 내가
같은 평균 출력 파일을하려는 결국5.0, Up (DVD)
4.0, Peter pan (DVD)
6.0, "Lady and the Tramp" (DVD)
을 제공
5.0, Disney's Jungle Book
6.0, Disney's Up
4.0, Disney's Peter Pan
제공을 제공합니다
4.5, Jungle Book
5.0, Lady and the Tramp
4.33, Peter Pan
5.5, Up
내 첫 번째 문제는 내 csv 파일에있는 "또는 특정 단어 (예 :"Disney 's ","(DVD) ")와 같은 특수 문자를 삭제하는 것입니다. CSV 파일에서 행과 열을 삭제하는 방법에 대한 정보는 찾았지만이 요소 내부에서 편집하는 데 어려움이 있습니다. 이런 식으로 뭔가 그 해결 것입니다 일단, 나는 평균 가격을 먹고 싶어 ..
import csv
import string
input_file = open('DesktopData.csv', 'r')
output_file = open('fixformat.csv', 'w')
data = csv.reader(input_file)
writer = csv.writer(output_file,quoting=csv.QUOTE_ALL)# dialect='excel')
specials = '(DVD)'
for line in data:
line = str(line)
new_line = str.replace(line,specials,'')
writer.writerow(new_line.split(','))
input_file.close()
output_file.close()
작품의 종류 '(DVD)를'제거하지만 내 CSV 더 "를 선택하고 [문자로 더 큰 혼란을 제기하게하는 주어진 제목. 나는 이것이 내가이 얻을 것이 일단
Jungle Book, 4.0, 5.0
Lady and the Tramp, 4.0, 6.0
Peter Pan, 5.0, 4.0, 4.0
Up, 6.0, 5.0
내가 확신 OUPUT하는 마음에 무언가를 가지고 있지만 정말 내 머리에
Read all titles and put in mainlist;
if title already exsists, ignore/dont make new row with title
Read all files and compare with mainlist;
if title is found, put corresponding price in new column behind title
그것을 알아 내기 위해 파이썬 구문 부족 나는 그것을 안으로 만들 수있다. 평균 CSV 파일로. 어떤 조언을 매우 높이 평가됩니다!
팬더를 가져 와서 놀고 싶을 것입니다. pd.read_csv() 메소드를 살펴 보자. – Aklys