Machine Learning – 13 – Univariate (Explanatory Data Analysis)

நமது தரவுகள் எவ்வாறு அமைந்துள்ளன என விரிவாக ஆராய்ந்து பார்ப்பதே Explanatory Data Analysis ஆகும். ஒரே ஒரு column-ல் உள்ள தரவுகளை மட்டும் எடுத்து ஆராய்வது univariate எனவும், இரண்டு column-ல் உள்ளவை எவ்விதத்தில் ஒன்றோடொன்று தொடர்பினை ஏற்படுத்துகின்றன என ஆராய்வது bivariate எனவும், பல்வேறு columns இணைந்து எவ்வாறு ஒரு target column-ன் மீது தாக்கத்தை ஏற்படுத்துகிறது எனப் பார்ப்பது multi-variate analysis எனவும் அழைக்கப்படும். histogram, Density plot மற்றும் box plot ஆகியவை univariate analysis-க்கு… Read More »

Machine Learning – 12 – Outliers, Removal ஐக் கண்டறிதல்

Outlier என்பது மற்ற தரவுகளிலிருந்து வேறுபட்டு சற்று தள்ளி இருக்கும் தரவு ஆகும். 5,10,15,20…75 எனும் மதிப்பினைக் கொண்டிருக்கும் தரவு வரிசைகளில் ஒன்றே ஒன்று மட்டும் 15676 எனும் எண்ணைக் கொண்டிருப்பின், அதுவே outlier ஆகும். இதைத் தான் நாம் கண்டறிந்து களைய வேண்டும். கீழ்க்கண்ட உதாரணத்தில், உள்ளீடாக உள்ள கோப்பிற்குள் இருக்கும் outliers ஒவ்வொரு column-லும் கண்டறியப்பட்டு  அவை ஒரு வரைபபடமாக வெளிப்படுத்தப்படுகின்றன. boxplot அல்லது violinplot இதற்குப் பயன்படுகின்றன. This file contains hidden or bidirectional… Read More »

SRM வள்ளியம்மை பொறியியல் கல்லூரியுடன் இணைந்து செயல்படும் கணியம் அறக்கட்டளை

டிசம்பர் 22 2018 அன்று, கணியம் அறக்கட்டளையும் SRM வள்ளியம்மை பொறியியற் கல்லூரியும் இணைந்து பல செயல்பாடுகள் செய்யும் வகையில் ஒரு புரிந்துணர்வு ஒப்பந்தம் உருவாக்கப்பட்டது. இதன் மூலம் கல்லூரி மாணவர்களுக்கு தமிழ்க்கணிமை சார்ந்த மென்பொருட்கள் உருவாக்கவும், ஆய்வுகளுக்கும் கணியம் அறக்கட்டளை உதவி புரியும். மாணவர்களுக்கும் ஆசிரியர்களுக்கும் பல்வேறு தொடர் பயிற்சிகள் மூலம் அவர்கள் கட்டற்ற மென்பொருட்கள், கட்டற்ற அறிவு மூலங்கள் உருவாக்க உதவி செய்யப்படும். கணியம் மின்னிதழில் இருந்து தேர்ந்தெடுத்த கட்டுரைகள் அச்சு இதழாக கல்லூரி… Read More »

MySQLஇற்கும் TiDB எனும் கட்டற்ற புதிய SQL தரவுதளத்ததிற்குமிடையேயான வேறுபாடுகள் யாவை

தற்போது வியாபார நிறுவனங்களனைத்தும் மேககணினியின் அடிப்படைகட்டமைவில் தரவுதளங்களை கையாள உதவவருவதுதான் TiDB எனும் கட்டற்ற புதிய SQL தரவுதளமாகும் இது MySQLஇன் ஒழுங்குமுறையை பின்பற்றுவதுமட்டுமல்லாமல் மிகுதி செயல்கள் அனைத்தும் ஏறத்தாழ SQLஎன்பதை ஒத்திருக்கின்றன ஆயினும் இந்த TiDB ஆனது MySQLஇற்கு சிறிது வித்தியாசமானது அவை பின்வருமாறு 1.பொதுவாக MySQL ஆனது பிரதிபலிப்பு மூலம் அளவிடப்படுகின்றது . பொதுவாக நம்மிடம் ஒரு MySQL மாஸ்டர் ஒன்றும் தரவு ஒவ்வொன்றிற்கும் ஒரு முழுமையான நகலான பல அடிமைகளும் இருக்க வேண்டும்,.… Read More »

கயெக நிரலாக்கம் (CNC Programming)

கணினி எண்ணிம கட்டுப்பாட்டு (Computer Numerically Controlled) எந்திரங்களைத் தமிழில் அஃகுப்பெயராக கயெக எந்திரங்கள் என்று கூறலாம். கணினி கட்டுப்பாட்டில் மரவேலை வழிச்செயலி (Woodworking Router), மின்ம வெட்டல் (Plasma Cutting), சீரொளி வெட்டல் (Laser Cutting), செதுக்கல் (Engraving), பற்றவைத்தல் (Welding) போன்ற பல எந்திரங்களை இயக்கலாம். இக்கட்டுரையில் கயெக கடைசல் இயந்திரம் (CNC Lathe) மற்றும் கயெக துருவல் இயந்திரம் (CNC Milling machine) ஆகியவற்றில் முக்கியமாகக் கவனம் செலுத்துகிறோம். கயெக (CNC) எந்திர… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் – மின்னூல் – இரா. அசோகன்

  நூல் : தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் ஆசிரியர் : இரா. அசோகன் மின்னஞ்சல் : ashokramach@gmail.com அட்டைப்படம் : லெனின் குருசாமி guruleninn@gmail.com மின்னூலாக்கம் : சீ.ராஜேஸ்வரி மின்னஞ்சல் : sraji.me@gmail.com வெளியிடு : FreeTamilEbooks.com உரிமை : Creative Commons Attribution-ShareAlike உரிமை – கிரியேட்டிவ் காமன்ஸ். எல்லாரும் படிக்கலாம், பகிரலாம்.   உரிமை இந்த நூல் கிரியேடிவ் காமன்ஸ் என்ற உரிமையில் வெளியிடப்படுகிறது . இதன் மூலம், நீங்கள் • யாருடனும் பகிர்ந்து… Read More »

முடிவடையும் 2018 ஆம் ஆண்டின் அதிகம் பயன்படுத்தப்பட்ட கட்டற்ற பயன்பாடுகள்

1. Cdrtfeஎனும் கட்டற்ற பயன்பாடானது வெளிப்புற நினைவகமான குறுவட்டு(CDs), நெகிழ்வட்டு ( DVDs) ஆகியவற்றில் நாம் பாதுகாப்பாக பிற்காப்பாக வைத்து கொள்ள விரும்பும் .wav, .mp3, .flac and .oggபோன்ற எந்தவகை கோப்பகளையும் கொண்டுசென்று எழுதிட உதவுகின்றது இதனை பதிவிறக்கம் செய்து பயன்படுத்தி கொள்ள cdrtfe.sourceforge.io/ எனும் இணையமுகவரிக்கு செல்க 2.Shotcut என்பது கானொளிபடகாட்சி கோப்புகளை கையாளுவதற்கு உதவிடும்மிகச்சிறந்த கட்டற்ற பயன்பாடாகும்சமீபத்திய கானொளி காட்சி படகோப்பு வடிவமைப்புமட்டுமல்லாது .bmp , .gif, .png and .svg. ஆகிய… Read More »

எலாஸ்டிக் பீன்ஸ்ட்டாக் – அறிமுகம்

ஒரு நிரலரின் கணினியில் உருவாகிற மென்பொருளைப் பயனருக்குக் கொண்டுபோய் சேர்ப்பதற்கிடையே பல்வேறு படிநிலைகள் உள்ளன. பின்வரும் படங்களின் உதவியுடன் அவற்றைப் புரிந்துகொள்ள முயல்வோம். ஒவ்வொரு மென்பொருளுக்கும் ஒரு பதிப்புக் கட்டுப்பாட்டு அமைப்பு  (Version control system) இருக்கவேண்டும். நிரலர்கள், ஒவ்வொரு நாளூம், பலமுறை தமது நிரலை பதிப்புக் கட்டுபாட்டுக்கு அனுப்பியவண்ணம் இருப்பர். நிரலர்கள் அனுப்புகிற, இந்த ஒவ்வொரு பதிப்பும், தரமானதாக இருக்கிறதா என்பதை சோதிக்கவேண்டும். இதற்கு இடையறாத ஒருங்கிணைப்பு (Continuous Integration) என்று பெயர். இதற்கென ஜென்கின்ஸ்,… Read More »

கணியம் அறக்கட்டளை நவம்பர் 2018 மாத அறிக்கை

கணியம் அறக்கட்டளை நவம்பர் 2018 மாத அறிக்கை தொலை நோக்கு – Vision தமிழ் மொழி மற்றும் இனக்குழுக்கள் சார்ந்த மெய்நிகர்வளங்கள், கருவிகள் மற்றும் அறிவுத்தொகுதிகள், அனைவருக்கும் கட்டற்ற அணுக்கத்தில் கிடைக்கும் சூழல் பணி இலக்கு – Mission அறிவியல் மற்றும் சமூகப் பொருளாதார வளர்ச்சிக்கு ஒப்ப, தமிழ் மொழியின் பயன்பாடு வளர்வதை உறுதிப்படுத்துவதும், அனைத்து அறிவுத் தொகுதிகளும், வளங்களும் கட்டற்ற அணுக்கத்தில் அனைவருக்கும் கிடைக்கச்செய்தலும். நிகழ்ச்சிகள் Tamil NLP using open-tamil python library –… Read More »

விக்கி மூலம் – மெய்ப்பு பார்த்தல் – காணொளிகள்

தமிழ் விக்கி மூலம் – ta.wikisource.org இது ஒரு பதிப்புரிமையில்லா விக்கிநூலகத் திட்டமாகும். இது கட்டற்ற உள்ளடக்கம் கொண்ட மூல நூல்களின் இணையத் தொகுப்பு. இதில் சுமார் 2000 மின்னூல்கள் PDF வடிவில் பதிவேற்றம் செய்யப்பட்டு, Google OCR மூலம் எழுத்துகளாக மாற்றப்பட்டுள்ளன. அவற்றில் உள்ள பிழைகளை நீக்கி, மெய்ப்பு பார்க்கும் (Proof Read) பெரும் பணி நம்முன்னே காத்துள்ளது. சுமார் 5 லட்சம் பக்கங்களை திருத்தி அவற்றை மின்னூலாக வெளியிட வேண்டும். இப்பெரும் பணியில் பங்கேற்க… Read More »