2012-04-19 4 views
0

구문 분석 할 중국어 내용이있는 파일이 있습니다. 각 게시물에는 필드 사이에 이상한 구분 기호가 있지만 필드를 분리하려고하지만 구분 기호를 인식 할 수 없습니다.공백 구분 기호로 파일 구문 분석

Dim stringSplitter() as string = {" "} 
Try 
    sampleResults = entry.Split(stringSplitter,StringSplitOptions.RemoveEmptyEntries) 

..... 

게시물 내용의 샘플.

108087006686338t.qq.com/GAOCHUANG8899homeGAOCHUANG8899homehttp://t.qq.com/p/t/1080870066863382012-03-22 04:49:46 

세퍼레이터 자리 108,087,006,686,338 DELIMITTER t.qq.com/GAOCHUANG8899home의 제 1 세트 이후에 시작한다. 처음에는 json을 사용하여 분할 할 수 있다고 생각했지만 이것은 json 형식이 아닙니다.

죄송합니다. 원본을 게시 할 때이 게시물을 작성할 때 구분 기호가 사라집니다. delimitter 직사각형 블록과 같은

EDIT :

확인 I 01로 자리 16 진수 값을 식별 헥스 편집기를 사용하고 기간처럼 보이지만 기간 2E의 값을 갖는다. 이것은 누구에게도 의미가 있습니까?

편집 :

문제를 재현 : 수 I은 16 진수 값을 기준으로 문자열을 분할합니다. 값이 "01"이면 그 값을 기준으로 문자열을 분할하는 방법은 무엇입니까?

편집 :

최종 답변 :`

Dim hvalue as Char = Char(1) 
Dim stringSplitter() as string = {hvalue} 
+0

샘플 내용에서'6338'과't.qq.com '사이에 문자가 없습니다. 데이터가 구분되어 있는지 확인 하시겠습니까? 어쩌면 필드는 위치를 기반으로합니다. –

+0

죄송합니다. 붙여 넣기하지 않고 원본을 표시하려면 어쨌든 가야합니다. 내 코드에서 공백 문자를 사용하여 시도했지만 datetime에서 문자열을 나눕니다 – vbNewbie

+0

코드로 서식을 지정하십시오. 그것은 공간을 유지합니다. –

답변

1

이의 당신이 01의 아스키 코드를 입력 $input 및 delimitter 있다고 가정 해 봅시다.

펄 :

my $input = ... 
my @output = split(chr(01), $input); 
print "$_\t" for @output; # print all items 

위의 코드는 그럼 당신이

$output[0] # first item 
$output[1] # second item 
... 
$#output + 1 # number of items 

비주얼 스튜디오 2010를 통해 항목에 액세스 할 수 있습니다, 당신의 $input@output에 배열을 분할합니다 :

Dim hvalue as Char = Char(1) 
Dim stringSplitter() as string = {hvalue} 
+0

고맙습니다 ... 크게 감사하겠습니다. 일하게 됐어. – vbNewbie

관련 문제