2012-09-20 2 views
1

정규화되지 않은 34 개 데이터 원본의 데이터를 하나의 정규화 된 SQL Server 2008 데이터베이스로 집계 한 프로젝트를 방금 완료했습니다.SQL Server 2008 유니 코드 문자 바꾸기

유일한 문제는 ... 해당 데이터 소스의 큰 텍스트 필드가 약간의 충실도를 잃었으며 이제는 많은 유니 코드 제어 문자가 표시된다는 것입니다.

BULK INSERT MyTabeNameHere 
     FROM 'C:\FILE\PATH\HERE\FileNameHere.txt'  
     WITH 
     (
      FIELDTERMINATOR = '\t', 
      ROWTERMINATOR = '\n', 
      FIRSTROW = 2 
     ) 

예 데이터가 될 수 있습니다 :

Lorem ipsum ò dolor sit amet 
ááá Lorem ipsum dolor sit amet 
Lorem ipsum dolor sit amet 
Lorem ipsumû dolor sit amet 
Lorem ipsum dolor sit aÆmet 

내가하고 싶은

이것은 내가 탭으로 구분 된 * .txt 인 파일 중 하나에서 데이터를 가져 오는 데 사용 코드는

가 원하는 출력이 될 것이다 ...는 SQL 기능과 출력이를 통해 데이터를 실행

Lorem ipsum dolor sit amet 
Lorem ipsum dolor sit amet 
Lorem ipsum dolor sit amet  
Lorem ipsum dolor sit amet 
Lorem ipsum dolor sit amet 

미리 감사드립니다.

+2

텍스트 파일에 '성실'이 있습니까? 당신이 당신 자신의 용어를 발명한다면, 당신이 의미하는 바를 어떻게 이해해야합니까? –

+0

Remus 'fidelity'의 동의어는 '정확도'입니다. http://tinyurl.com/bu5yxbb – s15199d

+0

입력 및 잘못된 출력의 예를 제시하는 것이 도움이 될 수 있습니다. –

답변

0

같은이 상황에서 도움이 될 다른 bulk insert 옵션이 있습니다 :

DATAFILETYPE = 'widechar' -- and others 

또는 moving my bulk operations from SQL 2000 to 2008, 나는 형식 파일의 내 사용을 드롭했다

CODEPAGE = 'ACP' -- and others 

및 WideChar가 포함이 적절한 출력을 얻는 옵션으로 나는 그것이 당신에게 도움이 될 것인지를 알기에 당신의 처지에 익숙하지 않습니다.

[...] 34 않은 정규화 된 데이터 소스 [...] 대부분의 문서가 언급

으로, 그것은 당신이 읽고있는 파일 형식 (ASCII를 아는 것이 중요합니다, ANSI , 등).

+0

데이터를 다시 가져올 시점이 훨씬 지나서 있습니다. 내가하고 싶은 일은 이미 데이터베이스에있는 데이터를 업데이트하는 것입니다. 그것이 유니 코드 제어 문자를 ''로 대체하더라도. 나는 그들을 의도 한 문자로 대체하는 것을 원하지만 ''로 대체하는 것은 옵션 B입니다. – s15199d

+0

올바른 인코딩을 사용하여 데이터를 다시 가져 오지 않는다면, 대체적으로 일부를 수동으로 눈으로 보아 대체 문자를 추측 할 수 있습니다 데이터를 소스와 비교하고, ['ascii'] (http://msdn.microsoft.com/en-us/library/ms177545.aspx), ['char' ] (http://msdn.microsoft.com/en-us/library/ms187323.aspx), ['nchar'] (http://msdn.microsoft.com/en-us/library/ms182673.aspx) 및 ['unicode'] (http://msdn.microsoft.com/ko-kr/library/ms180059.aspx)를 참조하십시오. @Blam은 개행 문자를 찾는 데 정확할 수 있습니다. –

+0

@TimLehner 일반적인 외국어 문자이므로 인코딩이 정확하다고 생각합니다. 나는 항상 그것을 처리하고 .NET에서 간단한 변환이 있지만 SQL 함수와 대량 가져 오기에서이 충실도의 손실을 일으킨다 고 주장합니다. – Paparazzi