2012-06-25 6 views
3

이 질문은 이미 몇 번 전에 물어 보았습니다 만, 저는 이것을 분명히하고 싶습니다. 나는 pdf 독자가 있고 그것에 강조 기능을 추가하고 싶다. TjTJ 연산자를 구문 분석하여 이미 텍스트를 추출 할 수 있습니다. 지금 나는 pdf에 텍스트의 위치를 ​​찾고 싶다.PDF에서 텍스트 찾기 : Tm 또는 Td/TD?

처음에는 Tm 값을 찾으려고했습니다. Tm의 (x, y)를 추출 할 수는 있었지만 올바르게 보이지 않습니다. 그래서 나는 TdTD로 가기로 결정했다. 문제는 연산자 콜백이 호출되지 않기 때문에 pdf에 Td 또는 TD 값이 포함되어 있지 않은 것으로 보입니다. (내가 전화를 걸고 있는지를 확인하기 위해 콜백에 로그를 넣었지만 결코 나타나지 않았다.)

그래서 내 질문은 pdf에서 텍스트의 위치를 ​​찾고 싶습니다. 으로? Tm 값 또는 Td/TD 값? 또는 둘 다입니까?

추가 질문 : a, b, c, d, ef :

(Tm)가 여섯 개 매개 변수가 있습니다. eftxty을 나타내지 만 다른 4 개의 매개 변수는 무엇을 나타 냅니까?

+0

@OmarAbdelhafith 지금 무엇을 – user1412469

+0

지금 유래 사용자가 더 많은 도움이 될 것입니다..?) –

+0

@OmarAbdelhafith 잘 당신이 내 질문을 도울 수 있습니까? – user1412469

답변

2

모두 텍스트 연산자를 처리해야하며 그 중 일부가 작동하는지 알아야합니다. 예를 들어 수직 쓰기 글꼴은 W2 항목을 적용하여 글리프 그리기 전에 가로 글리프 원점을 세로 글리프 원점으로 이동합니다.

Tm, TD 및 Td 외에도 TJ 및 Tj 외에도 T를 처리해야하며 '및'을 처리해야합니다. 단일 '표시'작업 내에서 텍스트가 어떻게 배치되는지 알고 싶다면 또한 TC, TW,의 Tz, TL 및 TS의 값을 고려할 필요가

또한 현재 변환 행렬을 처리해야 할 수도 있습니다

+0

저는 T *, ', ", Tc, Tw, TL, Ts를 다루는 메소드를 이미 가지고 있습니다. (Tz에 대해 연구해야 할 것입니다.) 그래서 모든 것을 사용해야한다는 뜻입니까? – user1412469

+0

정확히는 당신이하려고하는 것이지만 정확한 텍스트 배치, 그렇다면 모두, CTM, W2 글꼴 메트릭과 같은 더 이상한 것들을 원한다면, 글리프 배치. – KenS

+0

괜찮 았습니까? 더 궁금한 점이 있습니다. 텍스트 배치를 찾기 위해 수집 할 모든 정보를 어떻게 연관 지을 수 있습니까? Tm 값 또는 Td/TD 값을 다른 값과 어떻게 관련시킬 것입니까? 지금 당장 나를 괴롭히는 것 – user1412469

관련 문제