2012-12-02 2 views
4

diff format은 텍스트 간의 차이를 나타내는 사실상의 표준이며 프로그래머가 소스 코드 변경을 배포하는 데 널리 사용됩니다. 대부분의 버전 제어 시스템에서는 차이점을 출력 할 수 있으며 변경 사항은 변경 사항을 설명 할 때 매우 강력하기 때문에 텍스트 (예 : 소스 코드)에 대한 제안 된 변경 사항을 논의하는 데 사용됩니다.텍스트 주석의 데이터 형식

그러나 텍스트를 변경하지 않고 단순히 텍스트에 주석을 달고 텍스트에 대한 주석을 표현할 수있는 데이터 형식이 변경 사항의 diff만큼 강력한 방식을 원합니다. 일반적인 사용 사례는 코드에 대해 의견을 말하지만 (아직) 변경 사항을 제안하지 않는 코드 검토입니다. 또 다른 사용 사례는 내 생각과 알림이있는 기사에 주석을 추가하는 것입니다. Word에서는 텍스트를 표시하고 텍스트 옆에 풍선 주석을 추가하여 주석을 달 수 있습니다. 그러나 Word는 다른 방식으로 성가시다. 나는 별도의 파일에 주석을 넣고 원본을 그대로 유지하고 싶다.

변경 사항과 정확히 동일한 방식으로 어노테이션을 텍스트로 나타낼 수있는 데이터 형식은 무엇이 있습니까?

"XML"과 같은 일반적인 대답을 찾고 있지 않습니다. 명시 적으로 텍스트에 대한 주석을 나타내는 형식을 찾고 있습니다. (아마도 Word와 같은 특정 프로그램의 응용 프로그램 별 형식을 제외하고 그러한 형식이 존재하지 않습니다.)

답변

2

우수 질문.

대부분의 사람들은 XML과 같은 하위 집합을 토론에 던집니다. 마크 업 언어는 원본 텍스트에 저장된 (데이터) 특성을 사용합니다. 그러나 그것은 당신이 찾고있는 것이 아닙니다. 저는 XML/HTML과 RDF & 마이크로 포맷을 제외합니다. 일반

에서

당신은, 원래 텍스트를 유지를 복제 한 다음 사용자 지정 마크 업 언어를 통해 주석을 추가해야합니다. 이렇게하면 원래 텍스트와 주석이 달린 텍스트의 텍스트 차이를 허용합니다. 텍스트에 대한 원본 텍스트와 주석 수정본을 별도로 저장하는 것이 중요합니다.

이 있도록 복수의 차이점 :

  • DIFF "원문"및 "주석 텍스트 수정 1..N"
  • "주석 텍스트 브 N"및 "주석 텍스트 REV N 사이
  • DIFF + 1 사이 ".

이것은 매우 강력합니다.

어떤 데이터 형식이 있습니까?

,536위한 textmining 형식이다

대치 표시에서 문서의 텍스트는 문자 간격을 통해 텍스트의 특정 범위에 연결된 주석과 별도로 으로 유지됩니다. 주석은 기본 이름 (접미사가없는 파일 의 이름)이 동일 함을 파일 이름 지정 규칙에 따라 텍스트와 연관시킵니다. 예를 들어 파일 PMID-1000.a1 은 파일 PMID-1000.txt에 대한 주석을 포함합니다.

"파일 이름 기반 주석 연결"입니다. 학술 연구 및 개선의 여지가 많음)

+0

우수 답변! 이러한 형식은 단지 일반화가 필요합니다. 흠 ... 유혹 ...;) –