Category Archives: Tamil

இணைய வழி தமிழ் உரை ஒலி மாற்றி – வெளியீடு

  வணக்கம். இன்று tts.kaniyam.com என்ற இணைய வழி தமிழ் உரை ஒலி மாற்றியை வெளியிடுவதில் பெருமகிழ்ச்சி கொள்கிறோம். இது ஒரு கட்டற்ற மென்பொருள். மூலநிரல் – github.com/KaniyamFoundation/tts-web Ubuntu/Linux, Python, Django, Celery, MySQL, ஆகியவை கொண்டு உருவாக்கப்பட்டது. அறிமுகம் இந்த மென்பொருள் உங்கள் தமிழ் உரைக்கோப்புகளை (text file) ஒலிக்கோப்புகளாக (MP3) மாற்ற உதவுகிறது. (TTS Text-To-Speech) எப்படி மாற்றுவது? இதில், நீங்கள் ஒரு கணக்கு உருவாக்கவும். tts.kaniyam.com/signup/ உங்கள் மின்னஞ்சலுக்கு, புது கணக்கை… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 28. மொழித் தொழில்நுட்பத்தில் வளங்கள் மிகுந்த மொழியாகத் தமிழை உயர்த்துவோம்

இயல் மொழியியலில் அண்மைய தொழில்நுட்பக் கலை பற்றிய ஆய்வு, தொகுதி 13-14 இலிருந்து கீழ்க்கண்ட மேற்கோள் எடுக்கப்பட்டது. “மொழித் தொழில்நுட்பத்தை பயன்படுத்துவதன் மூலம் பெறக்கூடிய நன்மைகள் இவை. கணினிகளின் பயன்மை (usability) அதிகரிக்கிறது. மேலும் கணினி பயன்பாட்டில் பாமர மக்கள் தன்மேம்பாடு பெறவும் (empowering) வழிவகுக்கிறது.” தமிழின் கடந்த முதன்மைத்துவத்தை மீண்டும் பெற முயல்வோம் 1805 இல் ராஜெட் ஆங்கிலத்தில் முதல் தெஸாரஸ் (Roget’s Thesaurus) உருவாக்கினார். இதன் மூலப் பதிப்பில் 15,000 சொற்கள் இருந்தன. அச்சிடல்… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 27. உணர்வு பகுப்பாய்வும் சமூக ஊடகங்களும்

உணர்வு பகுப்பாய்வு (sentiment analysis) அல்லது கருத்து சுரங்க வேலை (opinion mining) என்பது ஒரு பேச்சாளரின் அல்லது எழுத்தாளரின் மனோபாவத்தைத் தீர்மானிப்பது. ஒரு தலைப்பைப் பற்றியோ அல்லது ஒரு ஆவணத்தை ஒட்டுமொத்தமாகவோ ‘நேர்மறை (positive)’ அல்லது ‘எதிர்மறை (negative)’ என்று கணிக்கிறோம். இம்மாதிரி நேரெதிரான இரண்டு தன்மைகள் இருந்தால் அவற்றை முனைவு (polarity) என்று சொல்கிறோம். சில வேலைகளுக்கு மூன்றாவதாக ‘நடுநிலை (neutral)’ என்றும் கணிக்க வேண்டியிருக்கலாம். இது தவிர உயர்நிலை உணர்வு பகுப்பாய்வில் “கோபம்”,… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 26. சொற்பிழைத் திருத்தி

தமிழுக்குச் சொல்திருத்தியே தேவையில்லை என்றொரு கருத்து ஆங்கிலத்தில் உச்சரிப்பை வைத்து எழுத்துக்கோர்வை சொல்ல முடியாது. ஆகவே எழுத்துப்பிழைகள் நிகழ்வதற்கான சாத்தியங்கள் உள்ளன. தமிழிலோ எப்படி உச்சரிப்போ அப்படியே எழுதுகிறோம் (Phonetic language). ஆகவே தமிழுக்குச் சொல்திருத்தியே தேவையில்லை என்றொரு கருத்து நிலவுகிறது.   ஆனால் மயங்கொலி என்று சொல்லப்படும் ல-ள-ழ, ண-ந-ன, ர-ற ஆகியவற்றில் எது சரி என்று தெரியாமல் நாம் தவறு செய்கிறோம். மேலும் ‘fat finger’ என்று ஆங்கிலத்தில் கூறப்படும் தவறான விசையை அழுத்துவதால்… Read More »

மென்பொருள் சுதந்திர தினம்- 2018 – விழுப்புரம் – அக்டோபர் 14 2018

மென்பொருள் சுதந்திர தினம்- 2018 விழுப்புரம் அனைவருக்கும் வணக்கம், விழுப்புரம் கட்டற்ற மென்பொருள் குழுமம், இந்த வருடம் அக்டோபர் மாதம் 14ஆம் தேதி மென்பொருள் சுதந்திர தினத்தை கொண்டாட உள்ளது. சுதந்திர மென்பொருள் தினமானது உலகெங்கிளும் உள்ள கட்டற்ற மென்பொருள் ஆர்வலர்கள், பள்ளி, கல்லூரி மாணவர்கள், ஆராய்ச்சியாளர்கள், பொதுமக்கள் ஒன்றாக கூடி, சுதந்திர மென்பொருள், சுதந்திர கலாச்சாரம், சுதந்திர வன்பொருள், கருவிகள் பற்றி விவாதித்து, உரையாடி, பயன்படுத்தி காட்டும் நாள். இங்கு 15-20 நிலையகங்கள் (Stalls) வைக்கப்படும்.… Read More »

பெண்கள் நலனுக்கான விக்கி மகளிர் 2018

மூலம் – ta.wikipedia.org/s/7dfq பெண்கள் நலனுக்கான விக்கி மகளிர் 2018 பெண்கள் நலனுக்கான விக்கி மகளிர் 2018, இந்திய விக்கி அறிவியல் மாதம் 2018ஐ முன்னிட்டு பெண்கள் உடல்நலம் சார்ந்த கட்டுரைகளை உருவாக்கவும் மேம்படுத்தவும் நடைபெறும் தொடர்தொகுப்பு (Edit-a-thon). இதன் நோக்கம் பெண் எழுத்தாளர்களை ஊக்குவிப்பதும், பெண்கள் நலன் சார்ந்த கட்டுரைகளைச் செம்மைப்படுத்துவதும் ஆகும். விதிகள் சுருக்கம்: கொடுக்கப்பட்டுள்ள தலைப்புகளில் இருந்து புதிய கட்டுரைகளை உருவாக்குங்கள். அல்லது, ஏற்கனவே உள்ள கட்டுரைகளை விரிவாக்குங்கள். இவை குறைந்தது 9000… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 25. தமிழ் – ஆங்கிலம் இயந்திர மொழிபெயர்ப்பு

இயந்திர மொழிபெயர்ப்புக்கு மூன்று வகையான அணுகல்கள் உள்ளன. இவை விதி சார்ந்த இயந்திர மொழிபெயர்ப்பு (Rule-Based Machine Translation – RBMT), புள்ளிவிவர இயந்திர மொழிபெயர்ப்பு (Statistical Machine Translation – SMT) மற்றும் கலப்பு (Hybrid) இயந்திர மொழிபெயர்ப்பு. விதி சார்ந்த இயந்திர மொழிபெயர்ப்பு விதி சார்ந்த இயந்திர மொழிபெயர்ப்பில் இந்த இரண்டு வகைகள் உண்டு. மேலோட்டமான மொழிமாற்றம் (Shallow transfer) மற்றும் ஆழ்ந்த மொழிமாற்றம் (Deep transfer). அபெர்டியம் (Apertium) ஒரு கட்டற்ற திறந்த… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 24. இயல்மொழி ஆய்வு கருவித் தொடரி

இயல்மொழி ஆய்வில் எந்தவொரு வேலையை நிறைவேற்றவும் பல பணிகளை ஒன்றன்பின் ஒன்றாகச் செயல்படுத்த வேண்டும். எந்தவொரு சிறிய வேலைக்குக் கூட பெரும்பாலும் கீழ்க்கண்ட பணிகள் இன்றியமையாதவை: வாக்கியங்களைப் பிரித்தல் சொற்களைப் (நிறுத்தற் குறிகளையும் சேர்த்து) பிரித்தல் சொல்வகைக் குறியீடு செய்தல் அடிச்சொல்லையோ, தண்டுச்சொல்லையோ பிரித்தெடுத்தல் இதன் பின்னர், தேவையைப் பொருத்து, சார்புநிலைப் பிரிப்பியை வைத்து கிளைப்பட வங்கிகளாகவோ அல்லது சொற்பகுப்பியல் ஆய்வியை வைத்து உருபன்களாகவோ பிரிப்போம். ஆக, குறைந்த பட்சம் ஐந்தாறு பணிகளை ஒன்றன்பின் ஒன்றாகச் செயல்படுத்துவோம்.… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 23. சார்புநிலை பிரிப்பி, சுட்டுப்பெயர் தீர்வு, தலைப்பு பிரித்தெடுத்தல்

சார்புநிலை பிரிப்பி இயல்மொழியைப் புரிந்து கொள்வது கடினமானது!  “I saw a girl with a telescope” என்ற வாக்கியத்தைப் பாருங்கள். தொலைநோக்கி வைத்திருந்த பெண்ணை நீங்கள் பார்த்தீர்களா அல்லது நீங்கள் தொலைநோக்கி மூலம் பார்த்தீர்களா? இது ஆங்கில எடுத்துக்காட்டு. எனினும் தமிழிலும் இதே பிரச்சினை உள்ளது. “ஜெயலலிதாவைத் திருப்திப்படுத்தும் ஆர்வத்தில் சட்டசபையில் காங்கிரஸ் உறுப்பினர்கள் பேச ஆரம்பித்ததும் அ.தி.மு.கவினர் குறுக்கீடு செய்தனர்.” என்று செய்தித் தலைப்பு. ஜெயலலிதாவைத் திருப்திப்படுத்தும் ஆர்வம் காங்கிரஸுக்கா அல்லது அ.தி.மு.கவினருக்கா? இம்மாதிரி… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 22. அடிச்சொல், தண்டுச்சொல் மற்றும் சொற்பகுப்பாய்வு

பகுதி விகுதி இடைநிலை சாரியை சந்தி விகாரம் ஆறினும் ஏற்பவை முன்னிப் புணர்ப்ப முடியும் எப்பதங்களும் நன்னூல். பதவியல் – 133 (13 ஆம் நூற்றாண்டில் பவணந்தி முனிவரால் எழுதப்பட்ட தமிழ் இலக்கண நூல்) சொற்பகுப்பியல் (morphology) சொற்கள் எப்படி சிறிய அலகுகளால் உருவாக்கப்படுகின்றன என்ற சொல் கட்டமைப்பு ஆய்வை சொற்பகுப்பியல் அல்லது உருபனியல் என்று சொல்கிறோம். சொல் என்பது என்ன? மொழியை எழுதும்போது, சொல் என்பது இரு இடைவெளிகளுக்கு இடையே இருப்பது என்று நாம் சொல்லலாம். ஆனால்… Read More »