எண்ணிம நூலகவியல் 1 – நிலைத்த அடையாளங்காட்டி (Persistent Identifier)

ஆய்வுச் செயற்பாட்டின் அடிப்படை தாம் பயன்படுத்தும் உசாத்துணைகளை (references) மேற்கோள் (cite) காட்டுவது ஆகும்.  இன்று பெரும்பாலும் இணைய வளங்களைப் பயன்படுத்தியே ஆய்வுகள் மேற்கொள்ளப்படுகின்றன.  இணைய வளங்களின் அடையாளமாக அவற்றின் உரலிகள் (urls)  அல்லது அவற்றின் இணைய இணைப்புக்களே (links) பெரும்பாலும் அமைகின்றன.  ஆனால் பெரும்பாலான உரலிகள் நீண்ட காலம் பேணப்படும் வண்ணம் அமைக்கப்படுவதில்லை.  அதனால் ஒரு நூலிலோ அல்லது ஆய்வுக் கட்டுரையிலோ மேற்கோள் காட்டப்பட்ட பல உரலிகள் சில மாதங்கள் பின்பு இயங்காமல் போய்விடுகின்றன.

மேற்கோள்களை உறுதிப்படுத்த முடியாத நிலை, புலைமைச் செயற்பாடுகளை பாதிக்கின்றது.  இதனால், வளங்களுக்கான அடையாளம் காட்டிகளை நீண்ட காலம் பேணவேண்டியதற்கான தேவையை கல்வி நிறுவனங்களும் நினைவு நிறுவனங்களும் உணர்ந்தனர். அவ்வாறு பயன்பாட்டுக்கு வந்த தொழில்நுட்பமே persistent identifier ஆகும்.  இதனை தமிழில் நிலைத்த குறியீடு அல்லது நிலைத்த அடையாளம் காட்டி எனலாம்.

நூல், ஆய்வுக் கட்டுரை, மென்பொருள், தரவு என்று எந்தவொரு அறிவு வளத்தையும் தனித்துவமாக அடையாளம் காட்ட நிலைத்த அடையாளம் காட்டி பயன்படுகிறது.  எடுத்துக்காட்டாக உலெங்கும் வெளியிடப்படும் நூற்கள் ஒவ்வொன்றையும் தனித்துவமாக அடையாளம் காட்ட அனைத்துலக நூல் இலக்க சீர்தரம் (International Standard Book Number (ISBN)) பயன்படுகிறது.  அதே போன்று, ஒரு நபரின் பெயரையும், அமைப்பின் பெயரையும் தனித்துவமாக அடையாளம் காட்ட அனைத்துலக பெயர் அடையாளங்காட்டி சீர்தரம் (International Standard Name Identifier) பயன்படுகிறது.  இதே போன்று ஆய்வுக் கட்டுரை போன்ற எண்ணிம வளங்களை அடையாளம் காட்ட எண்ணிமப் பொருள் அடையாளங்காட்டி (Digital object identifier) பயன்படுகிறது.

பெரும்பாலான நிலைத்த அடையாங்காட்டி முறைமைகள் மேற்குநாட்டு நினைவு நிறுவனங்களால் உருவாக்கப்பட்டு பராமரிக்கப்பட்டு வருகின்றன.  இவற்றில் பங்கேற்க, அல்லது இவற்றை பயன்படுத்த கணிசமான நிதி தேவைப்படுகிறது.  இதற்கு மாற்றான சில நிலைத்த அடையாளங்காட்டி முறைமைகளும் உள்ளன.

விக்கித்தரவு (wikidata) தன்னார்வலர்களால் கூட்டாக உருவாக்கப்படும் ஓர் அறிவு வரைபடம் (knowledge graph) ஆகும்.  இங்கு ஒவ்வொரு தரவுக்கும், ஒவ்வொரு படைப்புக்கும், ஒவ்வொரு விடயத்துக்கும் ஒரு கியூ ஐடி (Q identifier) என்ற அடையாங்காட்டி வளங்கப்படுகிறது.  எ.கா சுவாமி விபுலானந்தருக்கான அடையாளங்காட்டி Q7653259 ஆகும்.  அவர் எழுதிய யாழ் நூலுக்கான அடையாளங்காட்டி Q16310463 ஆகும்.  தமிழ் மொழிக்கான அடையாளங்காட்டி Q5885.  தமிழ் மொழி தொடர்பாக விக்கித்தரவு கொண்டுள்ளத தகவல்களை www.wikidata.org/wiki/Q5885 என்ற உரலியின் ஊடாக சென்று நாம் பெற முடியும்.  நிலைத்த அடையாளங்காட்டி இணைய உரலியாக அமைந்து, அவை Resolvable ஆக, அதாவது இணையம் ஊடாக அந்த வளங்களைப் பற்றிய தகவல்களைப் பெறக் கூடியதாக இருத்தல் விரும்பத்தக்கது. இது போன்று உலகின் அனைத்து விடயங்களை அடையாளப்படுத்தி விபரிக்க விக்கித்தரவு முனைகிறது.

சிறிய நினைவு நிறுவனங்களும் பயன்படுத்தக்கூடிய வண்ணம் கட்டமைக்கப்படக்கூடிய ஒரு நிலைத்த அடையாளங்காட்டி முறைமை ஆவணக வளத் திறவுகோல் (Archival Resource Key) ஆகும்.  பொதுவாக அடையாளங்காட்டிகள் ஒரு மைய நிறுவனத்தினால் உருவாக்கப்பட்டு நிர்வாகிக்கப்படும்.  ஆனால் Archival Resource Key அல்லது ஆர்க் (Ark) அடையாளங்காட்டிகளை சிறு நிறுவனங்களே, கட்டணம் எதுவும் செலுத்தாமல் உருவாக்கி பயன்படுத்த முடியும்.  எடுத்துக்காட்டாக ரொறன்ரோ பல்கலைக்கழக ஸ்காபரோ வளாக நூலகத்தின் சா. ஜே. வே. செல்வநாயகம் சேகரத்தில் உள்ள “கயிலாசன் பத்மநாதன் – சா. ஜே. வே. செல்வநாயகம் கடிதம்” என்ற ஆவணத்தின் ஆர்க் குறியீடு ark:/61220/utsc6459 ஆகும்.  இதன் முழு வடிவம் ark.digital.utsc.utoronto.ca/ark:/61220/utsc6459 ஆகும்.  இந்த அடையாளங்காட்டி தற்போது tamil.digital.utsc.utoronto.ca/61220/utsc6459 என்ற இணைய முகவரிக்கு போகிறது.  பின்னர் அந்த இணைய முகவரி மாறினாலும், அதன் நிலைத்த அடையாளங்காட்டி மாறாது.  இணைய உரலி செயலிழந்து போனாலும், ark:/61220/utsc6459 என்ற குறியீடு தொடர்ந்து அந்த வளத்தை தனித்துவமாக அடையாளங்காட்ட பயன்படும்.

ஒரு படைப்பை மட்டும் இல்லாமல், ஒரு படைப்பின் பகுதிகளையும் கூட நிலைத்த அடையாளங்காட்டி நெறிமுறைகள் கொண்டு அடையாளம் காட்ட முடியும்.  எடுத்துக்காட்டாக ஆர்க் ஐடி (Ark ID) இன் அமைப்பு பின்வருமாறு: NMA/ark:/NAAN/Name%5BQualifier%5D.  இதில் NMA பகுதி கட்டாயமில்லாத பகுதி ஆகும். NMA இற்கு தற்போதைய hostname வழங்கப்படலாம். ஆர்க் ஐடியின் NAAN பகுதி, நிறுவனத்தின் பெயரையும்,  Name பகுதி வளம் அல்லது தரவின் பெயர் அல்லது குறியீட்டையும், Qualifier வளத்தின் உட்கூறு ஒன்றையும் குறிக்கின்றன.  எ.கா Qualifier கொண்டு ஒரு நூலின் பக்கம்.  அல்லது ஒர் இதழில் இருக்கும் கட்டுரை ஒன்றை அடையாளப்படுத்தலாம்.

நினைவு நிறுவனங்கள் வெளியிடும் தரவுகள் மற்றும் வளங்களுக்கு நிலைத்த (Persistent), தனித்துவமான (Unique), இணையம் ஊடாக தீர்க்க அல்லது தகவல்களைக் பெறக் கூடிய (Resolvable) அடையாளங்காட்டிகளை வழங்குவது அவற்றின் நீடித்த பயன்பாட்டுக்கு உதவும்.  தமிழ்ச் சூழலில், தமிழிணையம் – மின்னூலகத்தின் அடையாளங்காட்டி (எ.கா TVA_BOK_0059246) மற்றும் நூலக நிறுவனத்தின் நூலக எண் (எ.கா 10000) ஆகியவற்றை குறிப்பிடலாம், எனினும் இவை இன்னும் resolvable ஆகக் கூடியவையாக இல்லை.

எந்தவொரு நினைவு நிறுவனமும் தாம் பயன்படுத்தும் அடையாளங்காட்டிகளை பற்றி திட்டமிட்டு செயற்படுவது, அவர்கள் உருவாக்கும் வளங்களை, தரவுகளை தனித்துவமாக அடையாளம்காட்ட உதவுவதுடன், அவர்களின் பணியோட்டங்களுக்கும் (workflows) உதவி செய்யும்.  பிற அனைத்துலக அடையாளங்காட்டிகளுடன் தொடர்புபடுத்தி, இணைப்புக்களை ஏற்படுத்தவும் உதவும்.  ஆய்வாளர்கள் வளங்களைக் தேடவும், மேற்கோள் காட்டவும் உதவும்.

நிலைத்த அடையாளங்காட்டிகளுடன் தொடர்புடைய இன்னுமொரு செயற்பாடே அதிகார வரையறை (Authority Control) என்பதாகும்.  இதைப் பற்றி இன்னுமொரு பதிவில் பார்ப்போம்.


உசாத்துணைகள்

Juty, N., Wimalaratne, S. M., Soiland-Reyes, S., Kunze, J., Goble, C. A., & Clark, T. (2020). Unique, persistent, resolvable: Identifiers as the foundation of FAIR. Data Intelligence, 2(1-2), 30-39. Retrieved from doi.org/10.1162/dint_a_00025

Hilse, Hans-Werner & Kothe, J. (2006). Implementing Persistent Identifiers​​. ​​London: ​Consortium of European Research Libraries. Retrieved from nbn-resolving.de/urn:nbn:de:gbv:7-isbn-90-6984-508-3-8

Huynh, K., Ledchumykanthan, N., Stapelfeldt, K., & Rahman, I. (2022). Simplifying ARK ID management for persistent access to digital objects. Code4Lib Journal, (54). Retrieved from journal.code4lib.org/articles/16774

%d bloggers like this: