2014-05-14 1 views
1

Microsoft Outlook 2010받은 편지함을로드 할 때 RecordLoader를 사용하여 MarkLogic에 TSV를 내보낼 때 다음과 같은 메시지가 표시됩니다. 인코딩 문제입니까? 다른 메소드 (mlcp, Java, XQuery)를로드하려고했지만 인코딩 문제로 인해 모두 실패했습니다. Microsoft에서 생성 한 TSV 파일을 MarkLogic 호환 파일로 변환 할 수 있습니까? 나는 몇몇 온라인 변환기를 시도했다. 그러나 그들은 일하지 않았다. 또한 메모장을 사용하여 파일을 UTF-8로 변환하려고했지만 + "UTF-8로 변환"버튼을 클릭하면 모든 데이터가 사라집니다. 이것은 MarkLogic에서 마지막으로 시도한 것이며이 데이터를로드 할 방법을 찾지 못하면 다른 플랫폼으로 전환합니다. 도움!RecordLoader를 사용하여 MarkLogic에 Outlook 내보내기 TSV로드

SEVERE: java.nio.charset.MalformedInputException: Input length = 1 
java.nio.charset.MalformedInputException: Input length = 1 
    at java.nio.charset.CoderResult.throwException(CoderResult.java:277) 
    at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:338) 
    at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:177) 
    at java.io.InputStreamReader.read(InputStreamReader.java:184) 
    at java.io.BufferedReader.fill(BufferedReader.java:154) 
    at java.io.BufferedReader.readLine(BufferedReader.java:317) 
    at java.io.BufferedReader.readLine(BufferedReader.java:382) 
    at com.marklogic.recordloader.xcc.DelimitedDataLoader.process(DelimitedDataLoader.java:115) 
    at com.marklogic.recordloader.AbstractLoader.call(AbstractLoader.java:96) 
    at java.util.concurrent.FutureTask.run(FutureTask.java:262) 
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145) 
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615) 
    at java.lang.Thread.run(Thread.java:744) 
+1

나열된다. 파일이 어떻게 보이는지, MLCP를 어떻게 호출하는지 샘플을 제공 할 수 있습니까? 줄 끝은 OS의 줄 끝과 일치해야하며 첫 줄에는 공백없이 레이블이 들어 있습니다. 제대로 진행하려면 수동으로 수정해야 할 수도 있습니다. 명령 줄에 탭을 지정하는 것도 문제가 될 수 있지만 option_file을 사용하여 가능해야합니다. – grtjn

답변

1

기본적으로 RecordLoader는 Java 로케일 기본 인코딩을 사용합니다. 그러나 데이터와 일치하도록 인코딩을 설정할 수 있습니다. 예를 들어 윈도우 1252 인코딩 인 경우 INPUT_ENCODING=Cp1252으로 설정하십시오.

INPUT_ENCODING

http://marklogic.github.io/recordloader/에서 (가볍게) 문서화하고 Java 인코딩 이름이, 예를 들어 MLCP 가능해야 http://docs.oracle.com/javase/8/docs/technotes/guides/intl/encoding.doc.html

관련 문제