2010-07-02 3 views
3

전자 책 파일을 eReader에 최적화 된 pdf 파일로 변환합니다 (소니 ereader는 텍스트를 정당하게 정의 할 수 없습니다). 따라서 html을 latex로 변환 한 다음 pdflatex를 사용하여 latex 출력을 작성합니다.pdflatex가 단어 하나당 하나의 상자를 만듭니다.

소니 리더는 사전에서 단어를 검색하는 기능이 있습니다. 그러나 상자를 분석하여 단어를 찾습니다. pdflatex는 한 행에 하나의 상자를 생성합니다. 나는 사전 검색을 사용할 수있는 가능성을 상실했다.

각 단어를 별도의 상자에 넣으려면 pdflatex에게 어떻게 말합니까?

편집 :
나는 그것이 단어 당 하나의 상자를 생산하기 위해 pdflatex 명령의 출력을 조정할 것을 시도하고있다. 이 예제를 생각해 봅시다 : 컴파일 후 PDF 편집기에서 열었을 때

\documentclass{minimal} 

\begin{document} 
    This is an example sentence. 
\end{document} 

가,이 샘플 문장을 포함하는 하나 개의 텍스트 상자로 나타납니다 "이것은 예를 들어 문장이다.". 대부분의 모든 기능을 갖춘 PDF 리더는 괜찮습니다. 그러나 내 소니 e- 리더에서 단어를 선택하는 것은 상자를 기반으로합니다. 따라서 내 PDF 리더는 전체 문장을 선택하므로 클릭 한 단어의 정의를 찾지 못합니다.

나는 pdflatex가 구두점으로 멈추는 것을 알아 챘습니다. 단어 하나당 하나의 상자를 만들려면 어떻게해야합니까? 출력물에는 "This"에 하나, "is"에 하나, "an"에 하나, 등등의 상자가 있습니다.

+0

시도해 본 결과의 코드 예를 보지 않고도 질문에 답하기가 정말 어렵습니다. – Mica

+0

질문에 정보를 추가했습니다. –

답변

0

세트 만 (유효 무한대)에 하이픈 처벌

\hyphenpenalty=10000 

아마도 http://dcwww.camd.dtu.dk/~schiotz/comp/LatexTips/LatexTips.html#nohyphen를 참조 조판 허용

\tolerance=1000 

을 높일 수 있습니다. 당신이 모르는 경우


은, TeX은 (나쁜 물건을 너무 많이 또는 너무 작은 흰색 공간을 (수평 또는 수직), 과부 나 고아 라인, 과다 또는 과소을 처벌을 할당하여 레이아웃 결정을 내립니다 전체 상자, 각주를 페이지로 나누는 등 ad nauseam) 페이지 당 페널티를 최소화하려고합니다.

페널티 값을 조정하면 매우 다양한 선택을 할 수 있습니다. 10000 점을받은 모든 어레인지먼트는 절대적으로 금지되어 있으며, 점수가 적은 어레인지먼트가 없다면 경기가 중단됩니다.

+0

흠,하지만 하이픈은 문제가되지 않습니다. 문제는 같은 상자에 모여있는 단어입니다 ... –

1

귀하의 문제는 상자가 아닌, 귀하의 글꼴 인코딩으로 추측하고 있습니다. \documentclass{minimal}의 뒤를 다음과 같이 둡니다.

 
\usepackage{cmap} % Puts extra info in the PDF's font dictionary that helps searching 
\usepackage{lmodern} % cmr, the default Tex font, has a whacky font layout 
\usepackage[T1]{fontenc} % This and next line are recommended with lmodern 
\usepackage{textcomp} 
+0

음 ... 사실 나는 pdflatex 메일 링리스트에서이 점에 대해서도 논의했습니다. 실제로 필자가 필요로하는 것은 문서의 태그 일 것입니다. 글꼴 인코딩을 변경하면 아무런 효과가 없습니다. –

+0

@CFP : 토론에 연결할 수 있습니까? 정보 cmap의 목적은 그것을 그리핀 (glyphs)에서 유니 코드 (Unicode) 정보로 바꾸는 역방향지도로, 원하는 것을 수행하는 것입니다.독자가 그 정보를 무시하면 왜 상자에 붙이는 태그를 보게 될 것이라고 생각합니까? –

+0

여기를 참조하십시오 : http://tug.org/pipermail/pdftex/2010-July/008427.html :) 태그가 달린 pdf로 시도 할 때 독자는 =를 올바르게 선택할 수있었습니다. –

관련 문제