정규식을 통해 날짜가 일치합니다. 그것은 꽤 잘 작동하지만 다른 사람들은 단순히 작동하지 않지만 나는 왜 그런지 이해하지 못합니다. 일부 날짜에 Regex가 작동하지 않습니다.
나는 독일어 루비에서이 일을 해요 : 나는 무작위로 선택된 http://de.wikipedia.org/wiki/Inkunabel :def extract_dates
months = ["Januar", "Februar", "Maerz", "April", "Mai", "Juni", "Juli", "August", "September", "Oktober", "November", "Dezember"]
days = ["Montag", "Dienstag", "Mittwoch", "Donnerstag", "Freitag", "Samstag", "Sonntag"]
self.content.scan(/([0-9]{1,2}\.\s?[#{months.join("|")}]\s?[0-9]{4})/)
end
내가의 텍스트를 테스트했다.
=> ["18. Juli 1471", "11. Februar 1486", "14. August 1473", "1. Januar 1501", "8. Januar 2008", "23. Mai 2006"]
을 그리고 경기는 정확하지만 내 목적이 일치하는 것이 아니라해야 들면, "31. Dezember 1500"
을 잎 : 그것은 반환합니다. 일치하지 않는 이유는 무엇입니까 "31. Dezember 1500"
?
위키 피 디아를 긁어 모으려면 [API] (http://www.mediawiki.org/wiki/API)를 사용하거나 금지 될 위험이 있습니다. 구르는 친근한 방법입니다. –