현재 사용자로부터 일부 데이터를 가져 와서 서버에 업로드하는 iPhone 응용 프로그램을 작성 중입니다. 업로드 된 데이터는 동일한 프로그램의 다른 사용자에게 표시됩니다 (그 이상의 정보가 있지만 아이디어는 간단하게 유지됩니다 ...). 업로드되는 데이터는 기본적으로 이름 (최대 50 자), 제목 (최대 50 자) 및 일부 텍스트 (사실상 무제한 문자)의 세 줄입니다. 필요한 것은 기본적으로 데이터 입력의 유효성을 감지 할 수있는 함수, 서비스 또는 알고리즘입니다. 반복되는 일련의 문자, 특정 '불법'단어, 비정상적인 공백 등을 감지 할 수 있어야합니다. 따라서 제 질문은 있습니다. 이런 종류의 데이터 유효성 검사를위한 C 또는 Objective-C 라이브러리 (빌드 인 또는 오픈 소스)가 있습니까? 그렇지 않으면이 종류의 검사를 어떻게 수행할까요?스팸 감지 (목표 -) C
여기 좋고 나쁜 데이터의 두 가지 예 :
GOOD :
Name: "John Aaron Smith" Title: "Why am I still here?" Text: "Can anybody please help me? I'm feeling lonely!"
BAD : 나는 정도의주의 사항을 복용 알고
Name: "f**k you, kldsanfklds" Title: "Only $99. Buy Now. Only $99" Text: "ndsaklgnvds lakævndsaklæfhadsæhdsjka fhdskjafhdskj lafhsdkhf. €#&/ #&()(/&%& ># €%€#% €#& hidosæahviædshvidshfiodsa. adsifjDSILFJIDSH \n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n"
많은 경우 어렵 겠지만,이 알고리즘/라이브러리는 가장 나쁜 스팸을 필터링해야합니다. 또한 최종 데이터베이스 제출 전에 데이터를 조사 할 것이지만 물론 스팸이 적을수록 쉽게 얻을 수 있습니다.
너의 것, 벤.
EDIT : 가장 유창한 언어는 objective-C이지만 C로도 잘하고 있으며 PHP와 JAVA에 대한 지식이 있습니다. 다른 언어로 된 라이브러리/예제는 이해하기 어려울 수 있으며 유효한 iPhone 언어로 '번역'됩니다.
편집 편집 : 나는 지나치게 정교한 것을 찾고 있지 않습니다. 거친 상처를 내게 해주는 간단한 방법.
좋은 데이터가 스팸처럼 보인다고 생각하나요? –
글쎄, 내가 넣은 더미 데이터 일 뿐이야. 나쁜 점은 내가 정말로 탐지하려고 시도한 것이다. –
반복적 인 문자와 텍스트와 숫자의 이상한 혼합과 같은 가장 최악의 최악의 방법을 없애기위한 간단한 방법 만 알고있는 사람이 있습니까? –