Machine Learning – 7 – Prediction

நமது கோப்பில் உள்ள முதல் தரவினை மட்டும் கொடுத்து அதற்கான விலையை கணிக்கச் சொல்லுவோம். இது input.json எனும் கோப்பின் வழியே கொடுக்கப்படுகிறது. predict() செய்வதற்கான நிரல் பின்வருமாறு.


import os
import json
import pandas as pd
import numpy
from sklearn.externals import joblib
s = pd.read_json('./input.json')
p = joblib.load("./salepricemodel.pkl")
r = p.predict(s)
print (str(r))

view raw

predict.py

hosted with ❤ by GitHub

[code language=”bash”]
cat input.json

{
"OverallQual":[7],
"TotalBsmtSF":[856],
"1stFlrSF":[856],
"GrLivArea":[1710],
"FullBath":[2],
"TotRmsAbvGrd":[8],
"Fireplaces":[0],
"GarageCars":[2],
"GarageArea":[548],
"Years Before Sale":[5],
"Years Since Remod":[5]
}

[/code]

நிரலுக்கான வெளியீடு:

[code language=”bash”]
[213357.65598157]
[/code]

உண்மையான SalePrice மதிப்பு 208500 எனில் நமது நிரல் 213357 எனும் மதிப்பினை வெளிப்படுத்தும். இது கிட்டத்தட்ட பரவாயில்லை. ஏனெனில் நமது algorithm-ன் score, 81% ஆகும். எனவே இந்த அளவு வித்தியாசம் இருக்கத்தான் செய்யும்.

நிரலுக்கான விளக்கம்:

  1. joblib.load() என்பது binary வடிவில் உள்ள கோப்பினை de-serialize செய்து algorithm-ஆக மாற்றி சேமிக்கும்.
  2. பின்னர் இதன் மீது செயல்படும் predict() ஆனது json வடிவில் உள்ள தரவுகளை உள்ளீடாகக் கொடுத்து அதற்கான வெளியீட்டினைக் கணிக்கிறது.

அடுத்த இந்த prediction-க்கான உள்ளீடு மற்றும் வெளியீட்டு மதிப்பினை எவ்வாறு ஒரு Rest API-ஆக expose செய்வது என்று பார்க்கலாம்.

%d bloggers like this: