பிடிஃஎப் கோப்புகளிருந்து படங்களை பிரித்து எடுக்க

Linux இயக்குத்தளங்களில் இதை செயற்படுத்த, Ubuntu விற்கு

 

sudo apt-get isntall poppler-utils

 

Fedoraவிற்கு

 

sudo yum install poppler-utils

 

மற்ற இயங்குதளங்கள் பயன்படுத்துவோர் package manager மூலமாக தேடி நிறுவிக்கொள்ளலாம்.

 

pdfimages -j pdffile.pdf ~/pdfimages/

 

இக்கட்டளையைக் கொண்டு பிடிஃப் கோப்புகளிருந்து படங்களை மட்டும் எடுத்துக்கொள்ளலாம். இதில் pdffile.pdf என்பது பிடிஃப் கோப்பின் பெயர். பிரிக்கப்பட்ட படங்கள் /home/username/pdfimages என்னும் கோப்பகத்தில் சேமிக்கப்படும்.

JPEG வடிவ கோப்புகளுக்கு –j. அவசியம் இல்லாவிட்டால் PPM வடிவ கோப்பாக பிரிக்கப்படும். PDF images என்னும் கருவி மூலம் பிடிஃப் கோப்புகளிருந்து படங்களை சுலபமான வழியில் அழகாகவும் துல்லியமாகவும் பிரிக்கலாம்.

 

pdftotext pdffile.pdf

இக்கட்டளை மூலம் பிடிஃப் கோப்பில் இருக்கும் எழுத்து உள்ளடக்கத்தை தனியாக பிரித்து எழுத்து வடிவ கோப்பாக (.txt file) அதே பெயரில் சேமிக்கலாம். இக்கட்டளை மூலம் எழுத்துக்களை மட்டும் தான் பிரிக்க இயலும் படங்களில் உள்ள எழுத்துக்களை பிரிக்க இயலாது. அவ்வாறு பிரிக்க இந்த இணையத்தளத்தை பார்க்கவும்.

 

~அன்னபூரணி

%d bloggers like this: