எண்ணிம நூலகவியல் 5 – எண்ணிமப் பொருள் (Digital Object)

பெளதீக நூலகங்களிலும் ஆவணகங்களிலும் நாம் நூற்கள், இதழ்கள், ஆவணங்கள், இறுவட்டுக்கள் என்று பெளதீக பொருட்களையே முதன்மையாகப் பயன்படுத்துகிறோம். அருங்காட்சியங்களில் கலைப்பொருட்களை (artifacts) சென்று பார்க்க முடியும். எண்ணிம நூலகங்கள், ஆவணகங்கள், அருங்காட்சியகங்களில் நாம் எண்ணமப் பொருட்களை (digital objects) உருவாக்கி, பாதுகாத்து, பயன்படுத்துகிறோம்.  இங்கு எண்ணிமப் பொருள் என்பது ஒரு முக்கிய கருத்துருவாக எழுகிறது.

எண்ணிமப் பொருட்கள் இரு வகைகளில் உருவாக்கப்படுகின்றன.  ஒன்று, இயல்பாகவே எண்ணிம வடிவத்தில் உருவாக்கப்படும் ஆவணங்கள் மற்றும் மெய்நிகர் பொருட்கள் ஆகும். எடுத்துக்காட்டாக நுண்பேசியில் எடுக்கப்படும் படம், முகநூலில் இடப்படும் ஒரு பதிவு, மின்னஞ்சல், சொற்செயலி ஆவணம் (word document), மென்பொருள் ஆகியவவை.  இவை இயல்பு எண்ணிம (born digital)
வளங்கள் எனப்படுகின்றன.  பெளதீக வடிவில் இருக்கும் சுவடி, நூல், இறுவட்டு, கலைப்பொருள் ஆகியவற்றை எண்ணிமப்படுத்தி (digitize), அவற்றின் எண்ணிம வடிவங்களாகவும் எண்ணிமப் பொருட்கள் உருவாக்கப்படுகின்றன.

ஒர் எண்ணிமப் பொருளைப் பயன்படுத்த, அதற்குப் பொருத்தமான மென்பொருளும் தேவை.  எடுத்துக்காட்டாக ஒரு சொற்செயலி கோப்பை திறந்து படிக்க, சொற்செயலி (word application) தேவை.  அதே போன்று, ஒரு காணொளியைப் பார்க்க, ஒரு காணொளி இயக்கி (video player) தேவை. ஆகவே, எண்ணிமப் பொருள் என்னும் பொழுது அதைப் பயன்படுத்தக் கூடிய கணினிச் சூழலையும் (computing environment) இணைத்தே அணுக வேண்டும்.

பெளதீகப் பொருட்கள் போல் அல்லாமல், எண்ணிமப் பொருட்களை இலகுவாக அணுக்கப்படுத்த முடியும். யாரும் எங்கிருந்தும் இணையம் ஊடாக ஓர் எண்ணிமப் பொருளை பயன்படுத்து முடியும். உரலி ஊடாக அடையாளப்படுத்தி, மேற்கோள் காட்ட முடியும். இலகுவாக படி எடுக்க முடியும். அனுமதி கிடைக்குமாயின், உலகின் மிகப் பெரிய நூலகமான காங்கிரஸ் நூலகத்தில் உள்ள அனைத்து நூற்களையும் இரண்டு பெரும் வன்தட்டுக்களில் (~28 TB) சேமித்து ஒவ்வொருவரும் வைத்துக் கொள்ள முடியும்.

நாம் அன்றாடம் பயன்படுத்தும் எண்ணிமப் பொருட்களை துல்லியமாக வரையறை செய்வது, அவற்றை நீண்ட காலம் பாதுகாத்து பயன்படுத்த அவசியமாகிறது.  எளிமையாக, நூலகவியல் நோக்கில் எண்ணிமப் பொருள் என்பது ஒரு தகவல் உருபொருளின் (information entity) மீதரவினையும் (metadata), ஊடகங்களையும் (media resources) கொண்ட இருமத் தொடர் (bit sequence) ஆகும்.  பொதுவா, ஒரு அல்லது பல கணினிக் கோப்புக்களாக எண்ணிமப் பொருளைப் பார்க்கலாம். வெவ்வேறு எண்ணிமக் களஞ்சியங்கள் (digital repositories) அல்லது எண்ணிம களஞ்சிய சீர்தரங்கள் எண்ணிமப் பொருளை வெவ்வேறு வகைகளில் ஒழுங்கமைக்கின்றன.

எடுத்துக்காட்டாக Oxford Common File Layout என்னும் எண்ணிமப் பொருட்களை சேமிப்பதற்கான சீர்தரம் OCFL Object என்பதை பின்வருமாறு வரையறை செய்கிறது.  ஒரு OCFL Object ஆனது, ஒரு அல்லது ஒன்றுக்கு மேற்பட்ட கோப்புக்களையும், அவை தொடர்பான நிர்வாகத் தகவலையும், அவற்றை சுட்டும் அடையாளங்காட்டியையும் குறிக்கிறது.  இந்த எண்ணிமப் பொருள் அதன் பதிப்புக்கள் (version) தொடர்பான தகவலையும் கொண்டிருக்கலாம்.  ஒவ்வொரு OCFL Object ம் inventory.json என்ற கோப்பில் அந்த பொருள் கொண்டிருக்கும் கோப்புக்கள், அவற்றின் சரிகாண் தொகை (fixity), மற்றும் பதிப்புக்கள் தொடர்பான நிர்வாகத் தகவல்களைக் கொண்டிருக்கும்.

குறைந்தபட்ச OCFL பொருள்

ஒரு எண்ணிமப் பொருளின் அடிப்படைப் பண்புகளை வரையறை செய்வது தொடர்பாக பல்வேறு அணுகுமுறைகள் உண்டு.  எளிமையாக, ஒவ்வொரு எண்ணிமப் பொருளும் அதற்கான நிலைத்த அடையாளங்காட்டி (persistent identifier), அடிப்படை மீதரவுகள் (core metadata), அதன் உள்ளடக்க கோப்புக்கள் (content files), மற்றும் சரிகாண் தொகை (checksum) போன்று அதன் ஒருமைப்பாட்டை (integrity) உறுதிசெய்ய உதவும் தகவல்களை கொண்டிருக்க வேண்டும்.  மேலும், அதனைப் பயன்படுத்த தேவையான கணினிச் சூழலை (computing environment) பற்றிய தகவலையும் கொண்டிருத்தலும் பரிந்துரைக்கப்படுகிறது.

ஒரு எண்ணிமப் பொருளின் தரவு ஒருமைப்பாட்டை (data integrity), அந்தப் பொருளை மட்டும் வைத்து உறுதி செய்ய முடியாது.  அது உருவாக்கப்படும், பாதுகாக்கப்படும் எண்ணிமப் பாதுகாப்பு அமைப்பின் (digital preservation system) ஊடாகவே அதனை உறுதிசெய்ய முடியும். இவ்வாறான எண்ணிமப் பாதுகாபு அமைப்புக்களை திறந்த ஆவணக தகவல் முறைமை (Open Archival Information System) மற்றும் நம்பிக்கைக்குரிய எண்ணிமக் களஞ்சியங்கள் (Trustworthy Digital Repository (TDR)) சீர்தரங்கள் விபரிக்கின்றன.  எண்ணிமப் பாதுகாப்புத் தொடர்பாக இன்னுமொரு பதிவில் விரிவாகப் பார்ப்போம்.

பெளதீகச் சூழலில் ஒரு பொருளைப் பாதுகாப்பது என்பது அதன் அடிப்படைப் பண்புகள் மாறாத வண்ணம் போணுதல் ஆகும்.  மறுசீரமைப்பு (restoration) போன்ற செயற்பாடுகளில் ஈடுபட்டாலும், அதன் அடிப்படைப் பண்புகள் மாறக் கூடாது என்பது பொதுவான விதியாக அமைகிறது.  எண்ணிம சூழலில் இந்தக் கேள்வி மேலும் சிக்கலானது.  ஒரு நூலின் அடிப்படைப் பண்பு அதன் உள்ளடக்கமா, அல்லது அது குறிப்பான அச்சிடப்பட்ட வடிவமா என்ற கேள்வி எழுகிறது.  எண்ணிமப் பொருள் என்பதை மாறாத ஒன்றாக நாம் அணுக முடியாது.  பழைய வடிவங்களிலும் (format), மென்பொருட்களிலும் இருந்து புதிய வடிவங்களுக்கும் மென்பொருட்களுக்கும் மாற்றுவது அவற்றின் பாதுகாப்புக்கும் பயன்பாட்டுக்கும் அவசியமான செயற்பாடு ஆகும். எவ்வாறு ஒரு ஆக்கம் சுவடியில் இருந்து அச்சுக்கு வந்ததோ, அச்சில் இருந்து எண்ணிமப் பொருள் ஆனதோ, அதே போன்று, ஓர் எண்ணிமப் பொருள் வடிவத்தில் இருந்தும் இன்னுமொரு எண்ணிம வடிவத்துக்கு மாறுவது அவசியமாகிறது. ஓர் எண்ணிமப் பொருளின் அல்லது ஆக்கத்தின் அடிப்படைப் பண்புகள், தரவு ஒருமைப்பாடு பேணப்படுகிறதா என்பது இங்கு ஒரு முக்கிய கேள்வியாக அமைகிறது.

எண்ணிமப் பொருள் ஒரு தகவல் உரிபொருள் (intellectual entity) அல்லது தகவல் அலகினது மீதரவினையும் ஊடகங்களையும் கொண்டது என்றால், தகவல் உருபொருள் என்றால் என்ன என்ற கேள்வி எழுகிறது.  ஒரு தகவல் உரிபொருள் அல்லது அலகானது, அதனை தனித்து அணுகும் பொழுது பொருள் தரக் கூடிய ஒரு வளம் ஆகும்.  எடுத்துக்காட்டாக, ஒரு இதழினை ஒரு தகவல் உருபொருளாகவோ, அல்லது அந்த இதழில் உள்ள கட்டுரைகளை தனித் தனித் தகவல் உரிபொருளாகவோ அணுக முடியும்.  அதே போன்று, பல இதழ்களை தொகுத்து, அந்த தொகுப்பினை ஒரு தகவல் உருபொருளாகவும் அணுக முடியும்.  இவ்வாறு தகவல் உருபொருளின் வரையறை பயன்பாட்டுச் சூழலுக்கு ஏற்ப மாறுபடும்.

எண்ணிம நூலகங்கள், ஆவணகங்கள், அருங்காட்சியகங்கள் ஆகியவற்றுக்கு அவற்றின் தகவல் வளங்களே முதன்மையானவை.  அவற்றை பயன்படுத்த, தேட, காட்சிப்படுத்த பயன்படும் மென்பொருட்கள் காலத்துக்கு காலம் மாறும்.  எனவே தகவல் வளங்களை பொருத்தமான எண்ணிமப் பொருள் வரையறையை ஒன்றை தேர்வு செய்து அல்லது உருவாக்கி, அதற்கு ஏற்றவாறு தகவல்களை ஒழுங்கமைத்துக் கொள்தல் வேண்டும்.  அந்த தகவல் வளங்களை அடையாளப்படுத்த, கோப்புக்களை ஒழுங்குபடுத்த (file organization), நிர்வாகிக்க, நீண்ட காலம் பாதுகாக்க, பயன்படுத்த எண்ணிம பொருளின் வரையறை உதவி செய்யும்.

உசாத்துணைகள்

%d bloggers like this: