நான் நான்காம் வகுப்பு படிக்கும்போது என் தாத்தா எங்கள் ஊர் அரசு நூலகத்தை அறிமுகப்படுத்தினார் (என் ஊர் ஆற்காடு, வேலூர் மாவட்டம்). மிகுந்த ஆர்வத்தோடு சிறார் நூல்களை படிக்கத் தொடங்கினேன். புத்தகங்கள் என்னை வெவ்வேறு உலகத்திற்குள் அழைத்து செல்வது எனக்கு வியப்பாகவும் மிக ஆர்வமாகவும் இருந்தது. தொடர்ந்து பல புத்தகங்களை வாசித்தேன். வயது வளர்ந்தது, புத்தக வாசிப்பும் வகைகளும் அடுத்தடுத்த தளங்களை நோக்கிச் சென்றன.
சரியாக நான் கல்லூரியில் மூன்றாம் ஆண்டு படித்துக் கொண்டிருக்கும்போது, இணையத்தில் இருந்து ஒரு ஒலிப் பதிவை தரவிறக்கம் செய்தேன். அது ஒரு ஒலி புத்தகம். பொறுமையாக கேட்டுப் பார்த்தேன். மிக சுவாரஸ்யமாக இருந்தது. அருமையான வேறு ஒரு உணர்வை உணர்ந்தேன். சிறு வயதில் ரேடியோவில் அய்யா தென்கச்சி கோ. சுவாமிநாதன் அவர்களின் இன்று ஒரு தகவல் கேட்கும் பொது ஏற்பட்ட உணர்வை போன்ற ஒரு அருமையான வித்தியாசமான உணர்வு. ஒருவேளை இதைத்தான் கேள்விச் சுவை என்று வள்ளுவர் குறிப்பிட்டிருப்பாரோ?
கேள்வி தாகம் தீரவில்லை. பொன்னியின் செல்வன், ஹாரி பாட்டர் போன்ற பல ஒலி புத்தகங்களை விரும்பிக் கேட்டேன். மேற்கொண்டு பல ஒலி புத்தகங்களை இணையத்தில் தேடினேன். மிகப் பெரிய ஏமாற்றம். ஆங்கிலத்தில் இருப்பது போன்று தமிழில் நிறைய ஒலி புத்தகங்கள் இல்லை. மிக சொற்பமான ஒலி புத்தகமே இருந்தது. இந்த வேளையில்தான் “எழுத்திலிருந்து ஒலி” (Text to Speech) என்ற முறையை பற்றி அறிந்தேன். மிகவும் சுவாரஸ்யமான முறை. கணினியே எழுத்துக்களை ஒலியாக மாற்றிக் கொடுக்கும். இது குறித்து தேடும்போது ஆங்கிலத்தில் நிறைய செயலிகள், நல்ல தரத்தில் இருந்தது. மறுபடியும் உற்சாகம் பிறந்தது காரணம் இதுபோன்று தமிழில் இருந்தால் அனைத்து புத்தகங்களையும் ஒலியாகவே கேட்கலாம் அல்லவா? மிகுந்த உற்சாகத்துடன் இணையத்தில் தேட ஆரம்பித்தேன். மறுபடி ஏமாற்றம், காரணம் ஒன்று கூட எனக்கு கிடைக்கவில்லை. பின்னர் சிலநாட்கள் கழித்தது இந்த சுட்டி mile.ee.iisc.ernet.in:8080/tts_demo/ கிடைத்தது. இதில் இருந்த ஒலி ஓரளவு நன்றாக இருந்தது. அனால் திருப்த்திகரமாக இல்லை.
மேலும் பல தேடல்களுக்கு பிறகு, நாமே ஒரு செயலியை செய்தால் என்ன? என்று தோன்றியது. இதற்காக நிறைய படிக்க ஆரம்பித்தேன் (நான் ஒரு மென்பொருள் பொறியாளன்). ஒரு கட்டத்தில் இது நம்மால் முடியாது என்று ஓரம்கட்டிவிட்டேன். நான் வாழை (www.vazhai.org/) என்ற அரசு சாரா அமைப்பில் ஆறு வருடம் பணியாற்றி இருந்தேன். மிகவும் அருமையான அமைப்பு. கிராமபுற மாணவர்களுக்கு அடிப்படை கல்வியை கொண்டு சேர்க்கும் பணியை செய்து வருகிறது. இந்த அமைப்பில் நான் சிறார்களுக்கு ஆங்கிலம் கற்றுக்கொடுத்தேன். காரணம், நான் தமிழ் வழி கல்வி கற்றவன். ஆங்கிலம் கற்பதில் உள்ள சிரமங்கள் நன்றாக தெரியும். அவ்வாறு கற்பிக்கும் போது, பல நாட்கள் எனக்கு தெரிந்த ஒரு விஷயத்தை அங்கு மனத்தால் உணர்ந்தேன்.
தமிழ், அற்புத மொழி. தமிழ் எழுத்துக்களின் ஒலி, ஆங்கிலத்தை போல வார்த்தைக்கு வார்த்தை மாறாது. ‘அ’ என்ற எழுத்தின் ஒலி, அனைத்து இடங்களிலும் ஒரே மாதிரிதான் ஒலிக்கும். இந்த அடிப்படை புரிதல் என்னை வேறு தளத்திற்கு எடுத்து சென்றது. உடனடியாக ஒரு சிறு பரிசோதனை செய்து பார்த்தேன். ‘அம்மா’ என்ற வார்த்தையை ‘அம்’ என்றும் ‘மா’ என்றும் ஒலிப்பதிவு செய்து, கணிணி மூலமாக ஒன்றாக இணைத்து கேட்டால் அது ‘அம்மா’ என்று முழுமையாக ஒலித்தது. முதல் வெற்றி..! பெரும் மகிழ்ச்சி.. மேலும் ஆர்வம்..
உடனே இதை முழுமையாக செயல்படுத்த எண்ணி தமிழ் எழுத்துக்களின் உச்சரிப்புகளை ஒலிப்பதிவு செய்தேன். அவற்றை கணிணியில் வார்த்தைக்கு ஏற்ப இணைத்து ஒலியை உருவாக்கினேன். மிகவும் நன்றாக வேலை செய்தது. அனால் ஒலி சிறப்பாக இல்லை.
drive.google.com/file/d/1cMIhalO4BjdqV9QN5espfOgm_iwq08mc/view?usp=sharing
மீண்டும் இது வேலைக்கு ஆகாது என்று ஓரம் கட்டிவிட்டேன். இருந்தாலும் ஆழ் மனதில் இதுகுறித்து அவ்வப்போது எண்ணங்கள் வந்துகொண்டே இருந்தன. ஒருமுறை ஒரு யோசனை உண்டாயிற்று. எழுத்துக்களாக உச்சரிப்புகளை ஒலிப்பதிவு செய்வதற்கு பதிலாக. வாக்கியங்களாக ஒலிப்பதிவு செய்து அதிலிருந்து தேவையான ஒலியை எடுத்து இணைத்தால் என்ன? என்று தோன்றியது. இந்த யோசனை அடுத்த தளத்திற்கு எடுத்து சென்றது.
இந்த யோசனையை எளிதாக செயல்படுத்த முடியாது காரணம், ஒவ்வொரு வார்த்தைக்கும் அதன் உச்சரிப்பு மற்றும் மணி நேரத்திற்கான ஒரு அட்டவணை இருக்கவேண்டும். அப்படி இருந்தால்தான் நாம் நமக்கு தேவையான ஒலியை பிரித்து எடுக்க முடியும். உதாரணத்திற்கு கீழே பாருங்கள்.
இது தவறு என நீங்கள் கருதினால் இங்கே தெரிவியுங்கள் அல்லது எனக்கு மின்னஞ்சல் செய்யுங்கள்
இ,425,550
து,550,650
த,650,815
வ,815,910
று,910,950
எ,950,1155
ன,1155,1290
நீ,1290,1470
ங்,1470,1560
க,1560,1680
ள்,1680,1705
க,1705,1880
ரு,1880,1955
தி,1955,2070
னா,2070,2250
ல்,2250,2360
இ,2690,2810
ங்,2810,2900
கே,2900,3055
தெ,3055,3225
ரி,3225,3320
வி,3320,3400
யு,3400,3515
ங்,3515,3600
க,3600,3755
ள்,3755,3815
அ,4160,4265
ல்,4265,4340
ல,4340,4415
து,4415,4735
எ,4990,5150
ன,5150,5240
க்,5240,5270
கு,5270,5425
மி,5425,5580
ன்,5580,5595
ன,5595,5725
ஞ்,5725,5800
ச,5800,5905
ல்,5905,5985
செ,5985,6140
ய்,6140,6210
யு,6210,6330
ங்,6330,6400
க,6400,6505
ள்,6505,6540
மேலே உள்ள அட்டவணையில் ஒவ்வொரு எழுத்துக்கும் அதன் உச்சரிப்பு வரும் மணி நேரம் தெளிவாக குறிப்பிடப்பட்டிருக்கும். இதனால் நமக்கு தேவையான ஒலியை கோர்வையாக பிரித்து எடுக்கலாம். இவ்வாறு செய்வதால் நமக்கு ஓரளவு இயற்கையான ஒலியை பெறலாம். கீழே உள்ள ஒலியை கேளுங்கள்.
drive.google.com/file/d/1vzudYKvgawPZhstOtZwT_zOYNYUMkLdl/view?usp=sharing
இதை செய்து முடிக்க எனக்கு ஒன்றரை வருடம் ஆனது. இது இதோடு நின்றுவிடக்கூடாது என்று Android செயலி ஒன்றை செய்து பதிவேற்றம் செய்து உள்ளேன். அதன் சுட்டியை கீழே கொடுத்துள்ளேன்.
play.google.com/store/apps/details?id=com.blogspot.vayalumvazhvum.thamizhpesi
சமீபத்தில் ஒரு சிறப்பான தமிழ் பேசும் செயலி ஒன்று அறிமுகமானது. அதை இந்த தளத்தில் காணலாம்.
github.com/mohan43u/tamil-tts-install
இதை எடுத்து எனது அனுபவத்தால் மேலும் மேம்படுத்தி தமிழ் ஒலி புத்தகம் உருவாக்கும் ஒரு ஒருங்கிணைந்த செயல்பாட்டை உருவாக்கினேன். இதை பயன்படுத்தி பல புத்தகங்களை ஒலி புத்தகங்களாக மாற்றி பதிவேற்றம் செய்து வருகிறேன். கீழே உள்ள சுட்டியில் அதை காணலாம்.
www.youtube.com/channel/UCPr6IvpBLzOUlbGJ2zJFKPQ?view_as=subscriber
முடிவில் எனது அனைத்து முயற்சிகளையும் கீழே உள்ள சுட்டியில் பதிவேற்றம் செய்துள்ளேன். யார் வேண்டுமானாலும் எடுத்து உபயோகிக்கலாம்.
இதை மேலும் பலர் மேம்படுத்தி இன்னும் சிறப்பாக தமிழ் ஒலி புத்தகங்கள் உருவாக்கப்பட்டால் நம் நோக்கம் நிறைவேறும்.
நன்றி..
சுரேஷ் குமார்
அமெரிக்கா