Category Archives: Python

பைதான் – ஜாவா: நடப்பு2020 ஆம் ஆண்டில் எது சிறந்தகணினி மொழி

தற்போதைய உலகின் நவீன சகாப்தத்தில் நம்மிடம் இருக்க வேண்டிய மிக முக்கியமான திறமைநிரலாக்கம் என்பதாகும். இந்த நிரலாக்க பயணத்தின் போது வெவ்வேறு நிரலாக்க மொழிகள் வெவ்வேறு பயன் பாடுகளைக் கொண்டுள்ளன என்பதை சிறிது முயன்றால் நம்மால் புரிந்துகொள்ளமுடியும், அதனால் ஒருவரின் தேவைகள் அவருடைய ஆர்வம்ஆகியவற்றின் அடிப்படையில் அவைகளுள் தனக்கு தேவையான மிகச்சரியான பொருத்தமான தொருநிரலாக்க மொழியைத் தேர்வு செய்ய முடியும். அதனால் ஒருவர் கணினிமொழியின் நிரலாக்கத்திற்குள் குதிப்பதற்கு முன், தன்னுடைய தேவைக்கு பொருத்தமான நிரலாக்க மொழியை புத்திசாலித்தனமாக… Read More »

இயற்கை மொழி செயலாக்கம் (NLP), காட்சிப்படுத்தல் ஆகியவற்றிற்கு spaCy யைப் பயன்படுத்துதல்

spaCy என்பது ஒரு திறமூல பைதான் நூலகமாகும், இது உரைகளிலான தரவை இயந்திர நட்பு வில்லைகளாக பிரித்திட உதவுகிறது. உரையை சுத்தம் செய்வதற்கும் செயலாக்குவதற்கும் காட்சிப்படுத்துவதற்கும் பயன்படுத்தக்கூடிய பலவிதமான கருவிகள் இதில் உள்ளன, மேலும்இது இயற்கையான மொழி செயலாக்கத்திற்கு உதவுகிறது. இயற்கையான மொழி செயலாக்கம் (Natural language processing (NLP)) என்பது உரைவடிவிலான தரவுகளை பயன்படுத்திகொள்ளும்போதான இயந்திர கற்றலுக்கு (machine learning (ML)) ஒரு முக்கியமான முன்னோடியாகும். உரைகளிலான தரவானது பெரும்பாலும் கட்டமைக்கப்படாதது மேலும் இயந்திர கற்றல்… Read More »

பைத்தான் – sys module – வினா 8 விடை 8

போன பதிவில் os நிரல்கூற்றைப் பற்றிப் பார்த்தோம் அல்லவா! இந்தப் பதிவு sys module பற்றியது. கணினியின் சில அடிப்படைத் தகவல்கள், பைத்தான் வரிபெயர்ப்பி பற்றிய தகவல்கள் ஆகியவற்றை sys நிரல்கூற்றில் இருந்து பெறலாம். முதலில் import sys கொடுத்துக் கொள்ளுங்கள். வினா 1: பைத்தான் காப்புரிமை பற்றிய தகவல்களை எங்கே பார்ப்பது? sys.copyright வினா 2: float தரவுவகை பற்றி என்று எப்படிப் பார்ப்பது? sys.float_info வினா 3: யூனிக்கோடு என்கோடிங் என்ன என்று எப்படிப்… Read More »

பைத்தான் – os module – வினா 8 விடை 8

பைத்தானின் முதன்மையான நிரல்கூறு(module)களுள் ஒன்று os என்பது உங்களுக்குத் தெரிந்திருக்கும். இந்தப் பதிவில், அதில் அடிப்படையாகத் தெரிந்து கொள்ள வேண்டிய சில செயல்கூறுகளை(functions)ப் பார்க்கலாமா! os நிரல்கூற்றை முதலில் உங்கள் கணினியில் இறக்கிக் கொள்ளுங்கள். அதாவது, import os அவ்வளவு தான்! வினா 1: நான் இருக்கும் அடைவைப் பைத்தானில் பார்ப்பது எப்படி? os.getcwd() cwd என்பது Current Working Directory என்பதன் சுருக்கம். அதாவது இப்போது நீங்கள் எந்த அடைவில்(directory) இருக்கிறீர்கள் என்பதைக் காட்டும். வினா… Read More »

லினக்ஸ் மின்டில் செலினியம் வெப் டிரைவர்,பயர்பாக்ஸ் டிரைவர் – பைத்தானுக்கு நிறுவுவது எப்படி?

செலினியம் திட்டப்பணி செய்வதில் தொடக்க நிலையில் இருப்பவர்கள், செலினியம் வெப் டிரைவர், பயர்பாக்ஸ் டிரைவர் ஆகியவற்றை லினக்ஸ் மின்டில் நிறுவுவது எப்படி என்று இந்தப் பதிவில் பார்க்கப் போகிறோம். லினக்சில் மென்பொருள் நிறுவல் என்பது மிக மிக எளிமையான ஒன்று. டெர்மினலைத் திறந்து கொள்ளுங்கள். 1. நீங்கள் ஏற்கெனவே pip3 நிறுவியிருந்தால் நேரடியாக இரண்டாம் படிக்குப் போய் விடுங்கள். இல்லாவிட்டால் sudo apt-get install pip3 என்று கொடுங்கள். pip3 நிறுவப்பட்டு விடும். 2. இப்போது செலினியம்… Read More »

பைத்தான் ரிஜெக்ஸ் – 7 – ஒரு கோப்பில், மின்னஞ்சலில் உள்ள மின்னஞ்சல் முகவரியைக் கண்டுபிடிப்பது எப்படி?

நம்மிடம் ஒரு கோப்பு(File) இருக்கிறது என்று வைத்துக் கொள்ளுங்கள். அந்தக் கோப்பில் நிறைய தகவல்கள் இருக்கின்றன. அந்தத் தகவல்களில் ஒரு சில மின்னஞ்சல் முகவரிகளும் இருக்கின்றன. அந்த மின்னஞ்சல் முகவரிகள் மட்டும் நமக்கு வேண்டும். இதைப் பைத்தான் ரிஜெக்ஸ் பயன்படுத்திச் செய்யப் போகிறோம். இந்த வேலையில் இரண்டு படிகள் இருக்கின்றன. 1. கோப்பைத் திறந்து பைத்தான் கையில் கொடுப்பது. இது மிக எளிது. file_content = open(‘test.txt’) மேல் உள்ள வரியில் test.txt என்னும் கோப்பைத் திறந்து… Read More »

பைத்தான் ரிஜெக்ஸ் – 6 – வார்த்தை, வாக்கிய எண்ணிக்கை

இந்தப் பதிவில் நாம் பார்க்கப் போவது, ஒரு வரியில் எத்தனை வார்த்தைகள் இருக்கின்றன என்பதை எப்படிக் கண்டுபிடிப்பது, ஒரு பத்தியில் எத்தனை வாக்கியங்கள் இருக்கின்றன ஆகியனவற்றைத் தான்! ரிஜெக்சுக்குப் போவதற்கு முன்பு, சில அடிப்படை கருத்துகளை நாம் புரிந்து கொள்ள வேண்டும். “அன்பும் சிவமும் இரண்டென்பர் அறிவிலார்” – இந்த வாக்கியத்தை எடுத்துக் கொள்ளுங்கள். இதில் எத்தனை வார்த்தைகள் இருக்கின்றன? நான்கு! எப்படிச் சொன்னோம்? ஒரு வார்த்தையையும் இன்னொரு வார்த்தையையும் எப்படிப் பிரித்தோம்? இடைவெளி இருப்பதைப் பார்த்தோம்!… Read More »

பைத்தான் ரிஜெக்ஸ் 5 – கடவுச்சொல்லைக் கண்டுபிடிப்பது எப்படி?

கடவுச்சொல் எழுதுவதில் பல்வேறு கட்டுப்பாடுகளைத் தளங்களில் கொடுத்திருப்பார்கள். சிலர் எட்டெழுத்துகளாவது குறைந்தது இருக்க வேண்டும் என்பார்கள். சிலர், கட்டாயம் எண்கள் கலந்திருக்க வேண்டும் என்று சொல்வார்கள். சிலர், பெரிய எழுத்தும் சின்ன எழுத்தும் கலந்திருக்க வேண்டும் என்பார்கள். சிலர் மேலே சொன்ன எல்லாமே இருக்க வேண்டும் என்று வற்புறுத்துவார்கள். இவற்றிற்குரிய பைத்தான் நிரல் எழுதுவது எப்படி? ரிஜெக்சில் அதை எப்படிச் செய்வது? பார்ப்போமா! முதலில், கடவுச்சொல்லுக்குரிய கட்டுப்பாடுகளை வகைப்படுத்தி விடுவோம். 1. குறைந்தது எட்டு எழுத்துகள். if… Read More »

பைத்தான் ரிஜெக்ஸ் – 4 – தேதியை உறுதிப்படுத்துவது எப்படி?

இதற்கு முன்பு, தொலைபேசி எண்கள், அலைபேசி எண்கள் ஆகியவற்றை எப்படிச் சோதிப்பது என்று பார்த்துவிட்டோம். இப்போது நம் முன்னால் உள்ள கேள்வி – ஒரு தேதி – சரியான தேதி என்று தான் பைத்தான் ரிஜெக்ஸ் மூலம் எப்படி உறுதிப்படுத்துவது என்பதைத் தான்!  தேதியை எப்படி எழுதுவோம் – பொதுவாக நாள்/மாதம்/ஆண்டு என்பதை, dd/mm/yyyy எனும் பொது வடிவத்தில் எழுதுவோம் அல்லவா! அதாவது முதலில் இரண்டு எண்கள்(தேதிக்கு), பிறகு இரண்டு எண்கள்(மாதத்திற்கு), பிறகு நான்கு எண்கள்(ஆண்டுக்கு) என்பது… Read More »

பைத்தான் ரிஜெக்ஸ் 3 – ஒன்றுக்கு மேற்பட்ட அலைபேசி எண்களை எப்படிச் சோதிப்பது?

முந்தைய பதிவில் தொலைபேசி எண் இருக்கிறதா என்பதைப் பார்த்தோம். அதைப் பார்க்கும் போது நண்பர் ஒருவர், 91 என்று நாட்டுக் குறியீட்டுக்குப் பதிலாகச் சில நேரங்களில் நாம் சுழி(0) கொடுப்போமே! அதை உங்கள் நிரல் கையாளுமா? என்று கேட்டிருந்தார். சிலர் 91 என நாட்டுக்குறியீடு கொடுப்பார்கள். சிலர், சுழி(0) கொடுப்பார்கள். ரிஜெக்சில் இதை எப்படிக் கையாள்வது? 91 அல்லது 0 என்பதை ரிஜெக்ஸ் முறையில் எழுத வேண்டும். (91|0) அவ்வளவு தான்! இங்கே நடுவில் இருக்கும் |… Read More »