PDFஐ கையாளுவதற்கான லினக்ஸில் கட்டளை வரிகளிலான தந்திரங்கள்

நம்முடையை தற்போதைய பல்வேறு பயன்பாடுகளில் PDFவடிவமைப்பிலான கோப்புகளையும் அவைகளை கையாளுவதற்கான எண்ணற்ற PDF பயன்பாடுகளையும் பயன்படுத்திவருகின்றோம், இவை ஒவ்வொன்றும் அதன் சொந்த தனித்தன்மைகளைக் கொண்டுள்ளன. இந்தக் கட்டுரை அவற்றில் பலவற்றை ஒருங்கிணைத்து, எந்தத் தாமதமும் இன்றி இவற்றை பெறுவதற்கு சரியான வழிகளுக்கான கட்டளை வரிகளிலான தந்திரங்களை வழங்குகிறது.
இதனை அடிக்கடி தேவைப்படுகின்ற நம்முடைய PDF-செயலாக்கப் பணிகளுக்கு ஒரு barebones எனும் தயார்நிலை-குறிப்பாகப் பயன்படுத்திகொள்ளலாம்.
இதோ சில PDFஇற்கான கட்டளை வரிகளிலான தந்திரங்கள்:
புதிதாக PDFகளை உருவாக்குதல்
தற்போது பழைய MarkDown கடந்துவிட்டது. CommonMark என்பது புதிய செந்தரநிலை, அல்லது அது செந்தரப்படுத்தப்பட்ட MarkDown ஆகும். MarkDown ஐ விரும்பினால், மெதுவாக செயல்படுகின்ற Perlஇன் உரைநிரலைப் பயன்படுத்த வேண்டும். CommonMark ஐப் பயன்படுத்தினால், சி மொழியின் மூலக் குறிமுறைவரிகளில் உருவாக்கப்பட்ட, பின்வருமாறானவை விரைவாக செயல்படுபவைகளாகும்.

Convert MarkDown to HTML

perl markdown.pl jokebook.md > content.htm

or

cmark –unsafe –validate-utf8 \
jokebook.md > content.htm

Place the converted HTML in a HTML template

echo ‘<!DOCTYPE html><html><title>2020 Jokebook</title></head><body>’ > jokebook.htm
cat content.htm >> jokebook.htm
echo ‘</body></html>’ >> jokebook.htm

Embed images in the HTML

libreoffice \
–convert-to “html:HTML:EmbedImages” \
jokebook.htm

creates jokebook.html with self-contained

(base64-encoded) images

Convert HTML to ODF

libreoffice –convert-to “odt” jokebook.html

creates jokebook.odt

Convert ODF to PDF

libreoffice –convert-to “pdf” jokebook.odt

creates jokebook.pdf

உருவப்படங்களை PDF ஆக மாற்றுதல்
சில நேரங்களில்,உருவப்படங்களிலிருந்து PDF பக்கங்களை உருவாக்க விரும்புவோம். அவ்வாறானவர்களுக்கு ImageMagick என்பது உருவப்படங்களை PDF ஆகமாற்ற விரும்பும் லினக்ஸ் பயன்பாடாகும்.

Convert images to PDFs

magick front-cover.png -resize 100% front.pdf
magick back-cover.png -resize 100% back.pdf
ஒன்றிற்கு மேற்பட்ட PDFகளை இணைத்தல்
PDFtk என்பது ஒரு சக்திவாய்ந்த PDF-செயலாக்க பயன்பாடாகும், இதன்வாயிலாக PDF வடிவமைப்பிலான கோப்புகளை ஒன்றிணைத்தல், பிரித்தல், குறியாக்கம் செய்தல், மறைகுறியாக்கம் செய்தல், முத்திரைஇடுதல் ,வாட்டர்மார்க்கிங் போன்ற பணிகளைச் செய்ய முடியும்.

Concatenate several PDFs

pdftk front.pdf inner-pages.pdf back.pdf \
output book.pdf
PDFகளை மறையாக்கம் செய்தல்
PDF ஆவணங்களை உரிமையாளர், பயனர் ஆகிய .இரண்டுநபர்களும் பயன்படுமாறான இரு வகை கடவுச்சொற்களைப் பயன்படுத்தி மறைகுறியாக்கம் செய்யலாம் –
pdftk book.pdf output book-encrypted.pdf \
encrypt_128bit \
owner_pw RcHrDsTlMn^012 \
user_pw FrSfTWrFnDtn^321
வெற்று பயனர் கடவுச்சொல்லை அமைத்தால், கடவுச்சொல் இல்லாமல் PDF ஐப் காண பயனர்களை அனுமதிக்கலாம். ‘allow’ எனும் வாய்ப்பினைப் பயன்படுத்தி கூடுதல் கட்டுப்பாடுகளை குறிப்பிடலாம். சாத்தியமான மதிப்புகள் அச்சிடுதல், சிதைந்த அச்சிடுதல், மாற்றியமைத்தல், ஒன்றுசேர்த்தல், நகல் உள்ளடக்கங்கள், திரைபடிப்பான்கள், மாற்றியமைத்தல் சிறுகுறிப்புகள், நிரப்புதல் (Printing, DegradedPrinting, ModifyContents, Assembly, CopyContents, ScreenReaders, ModifyAnnotations, FillIn) , போன்ற அனைத்து வசதிகளும் இதிலடங்கும். ‘allow’எனும் வாய்ப்பினை குறிப்பிடவில்லை என்றால், இந்த வசதிகள் எதுவும் கிடைக்காது. ஆயினும்இந்த வசதிகள் இருக்கக்கூடாது என்று PDF செந்தரநிலை குறிப்பிடுகிறது. உண்மையில், பல்வேறு PDF பார்வையாளர்களின் பயன்பாடுகளில் கட்டுப்பாடுகள் கண்டிப்பாக செயல்படுத்தப்படுவதில்லை.
PDF கடவுச்சொல்லை நீக்குதல்
கடவுச்சொல்லை குறிப்பிட input_pw எனும் வாய்ப்பினைப் பயன்படுத்திடுக.
pdftk book-encrypted.pdf \
input_pw RcHrDsTlMn^012 \
output book-decrypted.pdf
இந்த கட்டளைவரிகளை இடைவெளியுடன் தொடங்கினால், கடவுச்சொல் (RcHrDsTlMn^012) ‘bash’ shell இன் செயல்பாட்டின் வரலாற்றில் சேமிக்கப்படாது. ஊடாடும் உரையாடலைப் பயன்படுத்துவது மற்றொரு தந்திரமாகும்.
sPassword=$(zenity –password \
–title “Decrypt PDF” \
–text “Type the password”)
pdftk book-encrypted.pdf \
input_pw $sPassword \
output book-decrypted.pdf
console-only எனக்கோர விரும்பினால், input echoவை முடக்கிடுக.
stty -echo
read -p “Type the password: “ sPassword
stty echo
PDF வடிவமைப்பிலான பக்கங்களை உருவப்படங்களாக மாற்றுதல்
PDFவடிவமைப்பிலான பக்கங்களை JPEG , PNG வடிவமைப்பில் உருவப்படங்களாக மாற்ற pdftoppm எனும் பயன்பாட்டைப் பயன்படுத்தலாம். அதில்படத்தின்புள்ளியின் ( pixel ) அடர்த்தியையும் , பக்க வரம்பையும் குறிப்பிடலாம்.

Export pages 2 to 12 with 96 dpi

pdftoppm -png -r 96 -f 2 -l 12 book.pdf page

creates numbered images with prefix ‘page’

ஒரு PDF ஐ வகைப்படுத்துதல்
சில நேரங்களில், ஒரு PDF ஐ வேறொருவருக்கு கொடுக்கவோ அல்லது இணையத்தில் வைக்கவோ முடியாது. உள்ளடக்க துனுக்குகளை (scrapers)இல்லாமல் செய்ய ( ‘AI’ இப்போது ஒரு அநாகரிக உள்ளடக்க துனுக்காக இருப்பதால்), உரையை கூட JPEG படங்களாக மாற்றுவது சிறந்தது. ஏன் JPEG? ஏனென்றால் அது உரையை படமாக மாற்றிவீணாக்குகின்றது.
pdftoppm -jpeg -r 96 book.pdf page
magick page*.jpg book-rasterized.pdff
சில உள்ளடக்க துனுக்குகள் படங்களிலிருந்து உரையைப் படிக்கும் திறனைக் கொண்டுள்ளன, ஆனால் அதற்கு கூடுதல் ஆதாரங்கள் தேவை. DPI ஐ 72 ஆக அமைத்தால், அது அதிக தேவையை பெறுகிறது. மேலும் எரிச்சலூட்டுவதை தவிர்க்க, அதை முத்திரையிட்டிடுக அல்லது வாட்டர்மார்க் செய்திடுக.
magick watermark.png watermark.pdf
pdftk book-rasterized.pdf \
stamp watermark.pdf \
output pages-watermarked.pdf
PDF ஐ DjVu ஆக மாற்றுதல்
Archive.org இல் உள்ள பல்வேறு PDF புத்தகங்கள் தொட்டுணரக்கூடிய புத்தகங்களின் நூலக நகல்களில் இருந்து வருடுதல் செய்யப்படுகின்றன. வருடுதல்கள் பொதுவாக அடர்த்தியான அல்லது பெரிய படங்களாக இருப்பதால் இந்த PDFகள் மிகவும் கனமானவை. மடிக்கணினிகளில் உள்ள சாதாரண PDF வாசகர்கள் அத்தகைய PDFகளைப் படிக்க சிரமப்படுகிறார்கள். PDFகளை DjVu ஆக மாற்றுவதே அதற்கான தீர்வாகும். (DjVu இன் பார்வையாளர் பயன்பாடுகள் படங்களிலிருந்து படிப்பதற்கு உகந்ததாக இருக்கும். அவை DjVu பக்கங்களை ஒரு நொடியில் பதிவேற்றுகின்றது.)
pdf2djvu –dpi=220 \
–output=tablet.djvu \
library.pdf
PDF இல் உள்ள பக்க அளவைப் பொறுத்து, DPI ஐ —dpi வாய்ப்புடன் சரிசெய்திடுக.
PDFஐ முத்திரையிடுவதற்கு அல்லது வாட்டர்மார்க் செய்ய,முதலில் ஒரு ஒளிஊடுருவக்கூடிய படத்தை உருவாக்கிடுக, பின்னர்அதை PDF ஆக மாற்றிடுக, அதன்பின்னர் அதை pdftk உடன் பயன்படுத்திகொள்க.
PDFகளை பிரித்தல்
பக்கங்களை அகற்ற ‘pdftk’இல் வாய்ப்பு இல்லை. இருப்பினும், அதன் ‘ ‘cat’ எனும் வாய்ப்பினைப் பயன்படுத்தலாம் , வெளியீட்டு ஆவணத்தில் இருக்க வேண்டிய பக்கங்களைக் குறிப்பிடலாம்.
pdftk book.pdf cat 6-end \
output story.pdf

eliminates pages 1 to 5

ஒவ்வொரு பக்கத்தையும் தனித்தனி PDF ஆக மாற்ற pdftk க்கு burst எனும் வாய்ப்பு உள்ளது.
pdftk book.pdf burst \
output page%02d.pdf
Cஇன் செந்தர நூலகத்தின் printf செயல்பாட்டின் மூலம் எண்களை எப்படிக் காண்பிக்கின்றோமோ அதைப் போன்றே, வெளியீட்டு PDF பெயரில் பக்க எண்ணின் வடிவமைப்பு முகமூடியைக் குறிப்பிடுக.
மற்ற பணிகள்
pdftk இன்மூலம் பல்வேறு பணிகளைச் செய்ய முடியும். மேலும்விவரங்களுக்கு அதன் உதவிகுறிப்பினை பார்வையிடுக. இதன்மூலம் PDF இல் கோப்பு இணைப்புகளைச் சேர்க்கலாம் , பிரித்தெடுக்கலாம், ஆனால் மின்னஞ்சல் மூலம் கோப்பு இணைப்புடன் PDF ஐ அனுப்பினால், அஞ்சல் சேவையகங்கள் இந்த அஞ்சலை பெறுநரின் உள்வருகைபெட்டியிலிருந்து முன்கூட்டியே அகற்றிவிடும் என்பதை நினைவில் கொள்க.

%d bloggers like this: