0
PDF 파일을 pdftotext를 사용하여 텍스트 파일로 변환 할 때 아라비아 문자가이 ع와 같이 편리하지 않은 방식으로 표시되면 어떻게 이러한 문자를 모두 일반 아랍어 문자로 변환 할 수 있습니까?아랍어 프레젠테이션 Forms-B를 bash로 일반 아랍어 문자로 변환하는 방법?
참고 :
PDF 파일을 pdftotext를 사용하여 텍스트 파일로 변환 할 때 아라비아 문자가이 ع와 같이 편리하지 않은 방식으로 표시되면 어떻게 이러한 문자를 모두 일반 아랍어 문자로 변환 할 수 있습니까?아랍어 프레젠테이션 Forms-B를 bash로 일반 아랍어 문자로 변환하는 방법?
참고 :
는이 코드를 사용할 수 있습니다 당신은 원본 텍스트를 원하는 경우 ا 같은 일부 라인, ه, ي 및 لا 변경해야 할 수도 있습니다. 이 글자와 관련된 사람들의 실수를 피하려면 이것을 사용할 수 있습니다.
cat file.txt | sed 's/[ﺀﺁﺂﺃﺄﺅﺆﺇﺈﺉﺊﺋﺌﺍﺎ]/ا/g;'\
's/[ﺏﺐﺑﺒ]/ب/g;'\
's/[ﺓﺔ]/ه/g;'\
's/[ﺕﺖﺗﺘ]/ت/g;'\
's/[ﺙﺚﺛﺜ]/ث/g;'\
's/[ﺝﺞﺟﺠ]/ج/g;'\
's/[ﺡﺢﺣﺤ]/ح/g;'\
's/[ﺥﺦﺧﺨ]/خ/g;'\
's/[ﺩﺪ]/د/g;'\
's/[ﺫﺬ]/ذ/g;'\
's/[ﺭﺮ]/ر/g;'\
's/[ﺯﺰ]/ز/g;'\
's/[ﺱﺲﺳﺴ]/س/g;'\
's/[ﺵﺶﺷﺸ]/ش/g;'\
's/[ﺹﺺﺻﺼ]/ص/g;'\
's/[ﺽﺾﺿﻀ]/ض/g;'\
's/[ﻁﻂﻃﻄ]/ط/g;'\
's/[ﻅﻆﻇﻈ]/ظ/g;'\
's/[ﻉﻊﻋﻌ]/ع/g;'\
's/[ﻍﻎﻏﻐ]/غ/g;'\
's/[ﻑﻒﻓﻔ]/ف/g;'\
's/[ﻕﻖﻗﻘ]/ق/g;'\
's/[ﻙﻚﻛﻜ]/ك/g;'\
's/[ﻝﻞﻟﻠ]/ل/g;'\
's/[ﻡﻢﻣﻤ]/م/g;'\
's/[ﻥﻦﻧﻨ]/ن/g;'\
's/[ﻩﻪﻫﻬ]/ه/g;'\
's/[ﻭﻮ]/و/g;'\
's/[ﻯﻰﻱﻲﻳﻴ]/ي/g;'\
's/[ﻵﻶﻷﻸﻹﻺﻻﻼ]/لا/g;'