'www'가있는 것과없는 많은 동등한 URL이 있습니다. 내 csv 파일은 다음과 같습니다파이썬 목록에 삽입하십시오. 항목이 아직 존재하는지 확인하십시오.
www.first.com
first.com
www.second.com
second.com
www.third.eu
third.eu
forth.tr
fifth.com
...`
나는 목록을 반복, IP 주소를 가져와 딕셔너리에 삽입. 중복 된 (www가 포함 된) 항목을 제거하거나 삽입하기 전에 어떻게 확인할 수 있습니까?
내 예상 결과는 다음과 같습니다
[{'entry': ['first.com', '192.168.31.101'},
{'entry': ['second.com', '192.168.31.102'},
{'entry': ['third.eu', '192.168.31.103'},
{'entry': ['forth.tr', '192.168.31.104'},
{'entry': ['fifth.com', '192.168.31.105'}]
with open('myfile.csv', 'rb') as csvfile:
reader = csv.reader(csvfile, delimiter=' ')
result = []
for row in reader:
addr = socket.gethostbyname(row[0])
result.append({'entry':[row[0], addr]})
그냥 뭔가 명심하십시오 - 일부 호스트는 두 가지 방법으로 요청에 응답하지 않을 수 있습니다. 일부 서버가'www.'없이 도메인에 대한 요청에 응답하지 않는이 문제에 부딪 혔습니다. – sytech