2011-04-10 7 views
1

파이썬을 사용하여 웹 사이트에서 날짜 문자열을 얻는 가장 좋은 방법은 무엇입니까?파이썬으로 날짜 문자열을 가져 오는 가장 좋은 방법

datestrings은의 형태로, 예를 들어, 일 수있다 : 2011

  • 4 월 2 일,

    • 4 월 1 일 2011
    • 4월 (23), 2011
    • 2011년 4월 2일
    • 2011년 4월 23일

    이 정규식의 톤되어야 할 것이다? 가장 우아한 솔루션은 무엇입니까?

  • +1

    예, 이것은 패턴 일치 문제입니다. – euphoria83

    +0

    [가능한 자연 언어에서 날짜와 시간을 파싱하기위한 파이썬 라이브러리가 있습니까?] (http://stackoverflow.com/questions/1495487/is-there-any-python-library-for-parsing-dates- 자연어에서의 시간) –

    +0

    영어 월 이름 만 찾고 계십니까? –

    답변

    2

    이 LIB 고려 :

    result = p.parseDateText("March 5th, 1980") 
    result = p.parseDate("4/4/80") 
    

    편집 : 그것은 사실입니다 지금은주의 사항의 예에서 http://code.google.com/p/parsedatetime/

    위키 페이지를, 여기가 그 질문에 관련보고 처리 할 수있는 형식의 몇가 같은 라이브러리가 추천 된 this SO question의 복제본!

    +0

    가장 일반적인 날짜 형식을 찾기 위해 여섯 개의 정규식 문자열을 사용하여 끝났지 만 답변을 드리겠습니다. – Lionel

    1
    month = '(jan|feb|mar|apr|may|jun|jul|aug|sep|nov|dec)[a-z]{0,6}' 
        regex_strings = ['%s(\.|)\d{1,2},? \d{2,4}' % month, # Month.Day, Year 
            '\d{1,2} %s,? \d{4}' % month, # Day Month Year(4) 
            '%s \d{1,2}\w{2},? \d{4}' % month, # Mon Day(th), Year 
            '\d{1,2} %s' % month, # Day Month 
            '\d{1,2}\.\d{1,2}\.\d{4}', # Month.Day.Year 
            '\d{1,2}/\d{1,2}/\d{2,4}', # Month/Day/Year{2,4} 
            ] 
    
    관련 문제