2011-08-25 7 views
-1

요구 사항은 PDF 또는 Doc으로 작성된 텍스트가 영어 또는 영어가 아닌지 식별하고자하는 것입니다. 난의 한 단어를 가지고있는 경우 (turiskh, 프랑스어, 아랍어 등)는 LangId을 사용할 수있는 것 같아요이 기능텍스트 언어를 PDF 또는 DOC 파일로 확인하십시오.

+2

지금까지 도움이 된 답변이 없으면 틀린 이유는 무엇입니까? 또한 답을 묻는 질문을 표시하지 않았습니다. 당신이 극도로 까다 롭고 사람들이 붙여 넣기를 복사 할 수있는 완벽한 예제를 작성하길 원합니다. 아니면이 웹 사이트에 자신을 담그지 않고도이 웹 사이트를 사용하여 자신의 업무를 수행하는 것입니다. – Citroenfris

답변

1

나에게 샘플 코드를 제공 전체 documnet에게

의 긴급 PLZ를 방지해야합니다. 그러나 몇 가지 제한 사항이 있습니다.

라이브 웹 사이트 또는 서비스에서 API를 사용하려면 아래 양식을 사용하여 무료 API 키를 신청하십시오. API 키는 개발 가능성을 확대하여 시간당 1,000 건의 요청 (최대 72,000,000 건)까지 처리 할 수 ​​있도록합니다.

그러나 '단일 단어'문제는 해결되지 않을 것이라고 생각합니다. 나는 그 텍스트가 주로 파일에서 사용되기 때문에 텍스트가 6 단어의 영어와 다른 언어의 4 단어를 가지면 영어로 텍스트를 볼 것이라고 생각한다. 나는 API를 직접 보지 않았으므로이를위한 몇 가지 해결책이있을 수있다.

당신에게 유용 할 것입니다.

2

Google 번역 API에서 내가 아는 바로는 무료 서비스 만 이용할 수 있습니다. 그렇지 않으면 난 단지 등 자신 만의 사전을 가지고있는 솔루션을 볼 수 .. 그러나 다른 이야기 어쩌면

0

이 가능하지 않다에게 한 단어.

"the"는 영어 단어입니까? 네,하지만 덴마크의 단어 (차를 의미)이기도합니다. Schadenfreude라는 단어가 영어가 아닌 텍스트를 나타 냅니까? 반드시 그런 것은 아닙니다.

언어 결정을 지원하는 API 목록에 Bing API를 추가하면 문자열 배열의 언어가 결정됩니다. 이 다소 도움이

http://msdn.microsoft.com/en-us/library/ff512412.aspx

희망.

관련 문제