நம்முடையை தற்போதைய பல்வேறு பயன்பாடுகளில் PDFவடிவமைப்பிலான கோப்புகளையும் அவைகளை கையாளுவதற்கான எண்ணற்ற PDF பயன்பாடுகளையும் பயன்படுத்திவருகின்றோம், இவை ஒவ்வொன்றும் அதன் சொந்த தனித்தன்மைகளைக் கொண்டுள்ளன. இந்தக் கட்டுரை அவற்றில் பலவற்றை ஒருங்கிணைத்து, எந்தத் தாமதமும் இன்றி இவற்றை பெறுவதற்கு சரியான வழிகளுக்கான கட்டளை வரிகளிலான தந்திரங்களை வழங்குகிறது.
இதனை அடிக்கடி தேவைப்படுகின்ற நம்முடைய PDF-செயலாக்கப் பணிகளுக்கு ஒரு barebones எனும் தயார்நிலை-குறிப்பாகப் பயன்படுத்திகொள்ளலாம்.
இதோ சில PDFஇற்கான கட்டளை வரிகளிலான தந்திரங்கள்:
புதிதாக PDFகளை உருவாக்குதல்
தற்போது பழைய MarkDown கடந்துவிட்டது. CommonMark என்பது புதிய செந்தரநிலை, அல்லது அது செந்தரப்படுத்தப்பட்ட MarkDown ஆகும். MarkDown ஐ விரும்பினால், மெதுவாக செயல்படுகின்ற Perlஇன் உரைநிரலைப் பயன்படுத்த வேண்டும். CommonMark ஐப் பயன்படுத்தினால், சி மொழியின் மூலக் குறிமுறைவரிகளில் உருவாக்கப்பட்ட, பின்வருமாறானவை விரைவாக செயல்படுபவைகளாகும்.
Convert MarkDown to HTML
perl markdown.pl jokebook.md > content.htm
or
cmark –unsafe –validate-utf8 \
jokebook.md > content.htm
Place the converted HTML in a HTML template
echo ‘<!DOCTYPE html><html><title>2020 Jokebook</title></head><body>’ > jokebook.htm
cat content.htm >> jokebook.htm
echo ‘</body></html>’ >> jokebook.htm
Embed images in the HTML
libreoffice \
–convert-to “html:HTML:EmbedImages” \
jokebook.htm
creates jokebook.html with self-contained
(base64-encoded) images
Convert HTML to ODF
libreoffice –convert-to “odt” jokebook.html
creates jokebook.odt
Convert ODF to PDF
libreoffice –convert-to “pdf” jokebook.odt
creates jokebook.pdf
உருவப்படங்களை PDF ஆக மாற்றுதல்
சில நேரங்களில்,உருவப்படங்களிலிருந்து PDF பக்கங்களை உருவாக்க விரும்புவோம். அவ்வாறானவர்களுக்கு ImageMagick என்பது உருவப்படங்களை PDF ஆகமாற்ற விரும்பும் லினக்ஸ் பயன்பாடாகும்.
Convert images to PDFs
magick front-cover.png -resize 100% front.pdf
magick back-cover.png -resize 100% back.pdf
ஒன்றிற்கு மேற்பட்ட PDFகளை இணைத்தல்
PDFtk என்பது ஒரு சக்திவாய்ந்த PDF-செயலாக்க பயன்பாடாகும், இதன்வாயிலாக PDF வடிவமைப்பிலான கோப்புகளை ஒன்றிணைத்தல், பிரித்தல், குறியாக்கம் செய்தல், மறைகுறியாக்கம் செய்தல், முத்திரைஇடுதல் ,வாட்டர்மார்க்கிங் போன்ற பணிகளைச் செய்ய முடியும்.
Concatenate several PDFs
pdftk front.pdf inner-pages.pdf back.pdf \
output book.pdf
PDFகளை மறையாக்கம் செய்தல்
PDF ஆவணங்களை உரிமையாளர், பயனர் ஆகிய .இரண்டுநபர்களும் பயன்படுமாறான இரு வகை கடவுச்சொற்களைப் பயன்படுத்தி மறைகுறியாக்கம் செய்யலாம் –
pdftk book.pdf output book-encrypted.pdf \
encrypt_128bit \
owner_pw RcHrDsTlMn^012 \
user_pw FrSfTWrFnDtn^321
வெற்று பயனர் கடவுச்சொல்லை அமைத்தால், கடவுச்சொல் இல்லாமல் PDF ஐப் காண பயனர்களை அனுமதிக்கலாம். ‘allow’ எனும் வாய்ப்பினைப் பயன்படுத்தி கூடுதல் கட்டுப்பாடுகளை குறிப்பிடலாம். சாத்தியமான மதிப்புகள் அச்சிடுதல், சிதைந்த அச்சிடுதல், மாற்றியமைத்தல், ஒன்றுசேர்த்தல், நகல் உள்ளடக்கங்கள், திரைபடிப்பான்கள், மாற்றியமைத்தல் சிறுகுறிப்புகள், நிரப்புதல் (Printing, DegradedPrinting, ModifyContents, Assembly, CopyContents, ScreenReaders, ModifyAnnotations, FillIn) , போன்ற அனைத்து வசதிகளும் இதிலடங்கும். ‘allow’எனும் வாய்ப்பினை குறிப்பிடவில்லை என்றால், இந்த வசதிகள் எதுவும் கிடைக்காது. ஆயினும்இந்த வசதிகள் இருக்கக்கூடாது என்று PDF செந்தரநிலை குறிப்பிடுகிறது. உண்மையில், பல்வேறு PDF பார்வையாளர்களின் பயன்பாடுகளில் கட்டுப்பாடுகள் கண்டிப்பாக செயல்படுத்தப்படுவதில்லை.
PDF கடவுச்சொல்லை நீக்குதல்
கடவுச்சொல்லை குறிப்பிட input_pw எனும் வாய்ப்பினைப் பயன்படுத்திடுக.
pdftk book-encrypted.pdf \
input_pw RcHrDsTlMn^012 \
output book-decrypted.pdf
இந்த கட்டளைவரிகளை இடைவெளியுடன் தொடங்கினால், கடவுச்சொல் (RcHrDsTlMn^012) ‘bash’ shell இன் செயல்பாட்டின் வரலாற்றில் சேமிக்கப்படாது. ஊடாடும் உரையாடலைப் பயன்படுத்துவது மற்றொரு தந்திரமாகும்.
sPassword=$(zenity –password \
–title “Decrypt PDF” \
–text “Type the password”)
pdftk book-encrypted.pdf \
input_pw $sPassword \
output book-decrypted.pdf
console-only எனக்கோர விரும்பினால், input echoவை முடக்கிடுக.
stty -echo
read -p “Type the password: “ sPassword
stty echo
PDF வடிவமைப்பிலான பக்கங்களை உருவப்படங்களாக மாற்றுதல்
PDFவடிவமைப்பிலான பக்கங்களை JPEG , PNG வடிவமைப்பில் உருவப்படங்களாக மாற்ற pdftoppm எனும் பயன்பாட்டைப் பயன்படுத்தலாம். அதில்படத்தின்புள்ளியின் ( pixel ) அடர்த்தியையும் , பக்க வரம்பையும் குறிப்பிடலாம்.
Export pages 2 to 12 with 96 dpi
pdftoppm -png -r 96 -f 2 -l 12 book.pdf page
creates numbered images with prefix ‘page’
ஒரு PDF ஐ வகைப்படுத்துதல்
சில நேரங்களில், ஒரு PDF ஐ வேறொருவருக்கு கொடுக்கவோ அல்லது இணையத்தில் வைக்கவோ முடியாது. உள்ளடக்க துனுக்குகளை (scrapers)இல்லாமல் செய்ய ( ‘AI’ இப்போது ஒரு அநாகரிக உள்ளடக்க துனுக்காக இருப்பதால்), உரையை கூட JPEG படங்களாக மாற்றுவது சிறந்தது. ஏன் JPEG? ஏனென்றால் அது உரையை படமாக மாற்றிவீணாக்குகின்றது.
pdftoppm -jpeg -r 96 book.pdf page
magick page*.jpg book-rasterized.pdff
சில உள்ளடக்க துனுக்குகள் படங்களிலிருந்து உரையைப் படிக்கும் திறனைக் கொண்டுள்ளன, ஆனால் அதற்கு கூடுதல் ஆதாரங்கள் தேவை. DPI ஐ 72 ஆக அமைத்தால், அது அதிக தேவையை பெறுகிறது. மேலும் எரிச்சலூட்டுவதை தவிர்க்க, அதை முத்திரையிட்டிடுக அல்லது வாட்டர்மார்க் செய்திடுக.
magick watermark.png watermark.pdf
pdftk book-rasterized.pdf \
stamp watermark.pdf \
output pages-watermarked.pdf
PDF ஐ DjVu ஆக மாற்றுதல்
Archive.org இல் உள்ள பல்வேறு PDF புத்தகங்கள் தொட்டுணரக்கூடிய புத்தகங்களின் நூலக நகல்களில் இருந்து வருடுதல் செய்யப்படுகின்றன. வருடுதல்கள் பொதுவாக அடர்த்தியான அல்லது பெரிய படங்களாக இருப்பதால் இந்த PDFகள் மிகவும் கனமானவை. மடிக்கணினிகளில் உள்ள சாதாரண PDF வாசகர்கள் அத்தகைய PDFகளைப் படிக்க சிரமப்படுகிறார்கள். PDFகளை DjVu ஆக மாற்றுவதே அதற்கான தீர்வாகும். (DjVu இன் பார்வையாளர் பயன்பாடுகள் படங்களிலிருந்து படிப்பதற்கு உகந்ததாக இருக்கும். அவை DjVu பக்கங்களை ஒரு நொடியில் பதிவேற்றுகின்றது.)
pdf2djvu –dpi=220 \
–output=tablet.djvu \
library.pdf
PDF இல் உள்ள பக்க அளவைப் பொறுத்து, DPI ஐ —dpi வாய்ப்புடன் சரிசெய்திடுக.
PDFஐ முத்திரையிடுவதற்கு அல்லது வாட்டர்மார்க் செய்ய,முதலில் ஒரு ஒளிஊடுருவக்கூடிய படத்தை உருவாக்கிடுக, பின்னர்அதை PDF ஆக மாற்றிடுக, அதன்பின்னர் அதை pdftk உடன் பயன்படுத்திகொள்க.
PDFகளை பிரித்தல்
பக்கங்களை அகற்ற ‘pdftk’இல் வாய்ப்பு இல்லை. இருப்பினும், அதன் ‘ ‘cat’ எனும் வாய்ப்பினைப் பயன்படுத்தலாம் , வெளியீட்டு ஆவணத்தில் இருக்க வேண்டிய பக்கங்களைக் குறிப்பிடலாம்.
pdftk book.pdf cat 6-end \
output story.pdf
eliminates pages 1 to 5
ஒவ்வொரு பக்கத்தையும் தனித்தனி PDF ஆக மாற்ற pdftk க்கு burst எனும் வாய்ப்பு உள்ளது.
pdftk book.pdf burst \
output page%02d.pdf
Cஇன் செந்தர நூலகத்தின் printf செயல்பாட்டின் மூலம் எண்களை எப்படிக் காண்பிக்கின்றோமோ அதைப் போன்றே, வெளியீட்டு PDF பெயரில் பக்க எண்ணின் வடிவமைப்பு முகமூடியைக் குறிப்பிடுக.
மற்ற பணிகள்
pdftk இன்மூலம் பல்வேறு பணிகளைச் செய்ய முடியும். மேலும்விவரங்களுக்கு அதன் உதவிகுறிப்பினை பார்வையிடுக. இதன்மூலம் PDF இல் கோப்பு இணைப்புகளைச் சேர்க்கலாம் , பிரித்தெடுக்கலாம், ஆனால் மின்னஞ்சல் மூலம் கோப்பு இணைப்புடன் PDF ஐ அனுப்பினால், அஞ்சல் சேவையகங்கள் இந்த அஞ்சலை பெறுநரின் உள்வருகைபெட்டியிலிருந்து முன்கூட்டியே அகற்றிவிடும் என்பதை நினைவில் கொள்க.