Imporve least squares

6 years ago · 19d7a9c100
--- a/0_numpy_matplotlib_scipy_sympy/example.png
+++ b/0_numpy_matplotlib_scipy_sympy/example.png
--- a/0_numpy_matplotlib_scipy_sympy/matplotlib_ani1.ipynb
+++ b/0_numpy_matplotlib_scipy_sympy/matplotlib_ani1.ipynb
--- a/0_numpy_matplotlib_scipy_sympy/matplotlib_ani1.py
+++ b/0_numpy_matplotlib_scipy_sympy/matplotlib_ani1.py
--- a/0_numpy_matplotlib_scipy_sympy/matplotlib_ani2.ipynb
+++ b/0_numpy_matplotlib_scipy_sympy/matplotlib_ani2.ipynb
--- a/0_numpy_matplotlib_scipy_sympy/matplotlib_ani2.py
+++ b/0_numpy_matplotlib_scipy_sympy/matplotlib_ani2.py
--- a/0_numpy_matplotlib_scipy_sympy/matplotlib_full.ipynb
+++ b/0_numpy_matplotlib_scipy_sympy/matplotlib_full.ipynb
--- a/0_numpy_matplotlib_scipy_sympy/matplotlib_simple_tutorial.ipynb
+++ b/0_numpy_matplotlib_scipy_sympy/matplotlib_simple_tutorial.ipynb
--- a/0_numpy_matplotlib_scipy_sympy/numpy.ipynb
+++ b/0_numpy_matplotlib_scipy_sympy/numpy.ipynb
--- a/0_numpy_matplotlib_scipy_sympy/scipy.ipynb
+++ b/0_numpy_matplotlib_scipy_sympy/scipy.ipynb
--- a/0_numpy_matplotlib_scipy_sympy/stockholm_td_adj.dat
+++ b/0_numpy_matplotlib_scipy_sympy/stockholm_td_adj.dat
--- a/0_numpy_matplotlib_scipy_sympy/sympy.ipynb
+++ b/0_numpy_matplotlib_scipy_sympy/sympy.ipynb
--- a/Introduction.ipynb
+++ b/Introduction.ipynb
--- a/Basics.ipynb
+++ b/Basics.ipynb
--- a/Statement.ipynb
+++ b/Statement.ipynb
--- a/Structure.ipynb
+++ b/Structure.ipynb
--- a/0_python/04
+++ b/0_python/04
--- a/0_python/05
+++ b/0_python/05
--- a/Function.ipynb
+++ b/Function.ipynb
--- a/Class.ipynb
+++ b/Class.ipynb
--- a/0_python/Python.pdf
+++ b/0_python/Python.pdf
--- a/0_python/README.md
+++ b/0_python/README.md
--- a/0_python/tips/README.md
+++ b/0_python/tips/README.md
--- a/0_python/tips/pip.md
+++ b/0_python/tips/pip.md
--- a/0_python/tips/virtualenv.md
+++ b/0_python/tips/virtualenv.md
--- a/0_python/tips/virtualenv_wrapper.md
+++ b/0_python/tips/virtualenv_wrapper.md
--- a/1_kmeans/README.md
+++ b/1_kmeans/README.md
--- a/1_kmeans/download_iris.py
+++ b/1_kmeans/download_iris.py
--- a/1_kmeans/iris.csv
+++ b/1_kmeans/iris.csv
--- a/1_kmeans/k-means.ipynb
+++ b/1_kmeans/k-means.ipynb
--- a/1_kmeans/k-means.py
+++ b/1_kmeans/k-means.py
--- a/1_kmeans/kmeans-color-vq.ipynb
+++ b/1_kmeans/kmeans-color-vq.ipynb
--- a/1_kmeans/pic/01.jpeg
+++ b/1_kmeans/pic/01.jpeg
--- a/1_kmeans/pic/02.jpeg
+++ b/1_kmeans/pic/02.jpeg
--- a/1_kmeans/pic/03.jpeg
+++ b/1_kmeans/pic/03.jpeg
--- a/1_kmeans/pic/04.jpeg
+++ b/1_kmeans/pic/04.jpeg
--- a/1_kmeans/pic/05.jpeg
+++ b/1_kmeans/pic/05.jpeg
--- a/1_kmeans/pic/06.jpeg
+++ b/1_kmeans/pic/06.jpeg
--- a/1_kmeans/pic/07.jpeg
+++ b/1_kmeans/pic/07.jpeg
--- a/1_kmeans/pic/08.jpeg
+++ b/1_kmeans/pic/08.jpeg
--- a/1_kmeans/pic/09.jpeg
+++ b/1_kmeans/pic/09.jpeg
--- a/1_kmeans/pic/10.jpeg
+++ b/1_kmeans/pic/10.jpeg
--- a/1_kmeans/pic/11.jpeg
+++ b/1_kmeans/pic/11.jpeg
--- a/1_kmeans/pic/12.jpeg
+++ b/1_kmeans/pic/12.jpeg
--- a/1_kmeans/pic/13.jpeg
+++ b/1_kmeans/pic/13.jpeg
--- a/1_kmeans/pic/14.jpeg
+++ b/1_kmeans/pic/14.jpeg
--- a/1_kmeans/pic/15.jpeg
+++ b/1_kmeans/pic/15.jpeg
--- a/1_kmeans/pic/16.jpeg
+++ b/1_kmeans/pic/16.jpeg
--- a/1_kmeans/pic/17.png
+++ b/1_kmeans/pic/17.png
--- a/1_kmeans/pic/18.png
+++ b/1_kmeans/pic/18.png
--- a/1_kmeans/pic/19.png
+++ b/1_kmeans/pic/19.png
--- a/1_kmeans/pic/20.png
+++ b/1_kmeans/pic/20.png
--- a/1_kmeans/pic/21.png
+++ b/1_kmeans/pic/21.png
--- a/1_kmeans/pic/22.png
+++ b/1_kmeans/pic/22.png
--- a/1_kmeans/pic/23.png
+++ b/1_kmeans/pic/23.png
--- a/1_kmeans/pic/24.png
+++ b/1_kmeans/pic/24.png
--- a/1_kmeans/pic/25.png
+++ b/1_kmeans/pic/25.png
--- a/1_kmeans/pic/26.png
+++ b/1_kmeans/pic/26.png
--- a/1_kmeans/pic/27.jpg
+++ b/1_kmeans/pic/27.jpg
--- a/1_kmeans/pic/28.png
+++ b/1_kmeans/pic/28.png
--- a/1_kmeans/pic/29.gif
+++ b/1_kmeans/pic/29.gif
--- a/1_kmeans/pic/30.gif
+++ b/1_kmeans/pic/30.gif
--- a/1_knn/knn_classification.ipynb
+++ b/1_knn/knn_classification.ipynb
--- a/1_knn/knn_classification.py
+++ b/1_knn/knn_classification.py
--- a/1_logistic_regression/Least_squares.ipynb
+++ b/1_logistic_regression/Least_squares.ipynb
--- a/1_logistic_regression/Least_squares.py
+++ b/1_logistic_regression/Least_squares.py
@@ -17,11 +17,7 @@
 #     version: 3.5.2
 # ---

 # # Linear regression
 #
 #

 # ## Least squares
 # # Least squares
 #
 # A mathematical procedure for finding the best-fitting curve to a given set of points by minimizing the sum of the squares of the offsets ("the residuals") of the points from the curve. The sum of the squares of the offsets is used instead of the offset absolute values because this allows the residuals to be treated as a continuous differentiable quantity. However, because squares of the offsets are used, outlying points can have a disproportionate effect on the fit, a property which may or may not be desirable depending on the problem at hand. 
 #
@@ -45,7 +41,10 @@ Y = d.target

 # draw original data
 plt.scatter(X, Y)
 plt.xlabel("X")
 plt.ylabel("Y")
 plt.show()

 # -

 # ### Theory
@@ -108,6 +107,135 @@ x_max = np.max(X)
 y_min = coeff[0] * x_min + coeff[1]
 y_max = coeff[0] * x_max + coeff[1]

 plt.scatter(X, Y, label='original data')
 plt.plot([x_min, x_max], [y_min, y_max], 'r', label='model')
 plt.legend()
 plt.show()
 # -

 # ## How to fit polynomial function?
 #
 # If we observe a missle at some time, then how to estimate the trajectory? Acoording the physical theory, the trajectory can be formulated as:
 # $$
 # y = at^2 + bt + c
 # $$
 # The we need at least three data to compute the parameters $a, b, c$.
 #
 #

 # +
 t = np.array([2, 4, 6, 8])
 #t = np.linspace(0, 10)

 pa = -20
 pb = 90
 pc = 800

 y = pa*t**2 + pb*t + pc


 plt.scatter(t, y)
 plt.show()
 # -

 # ## How to use sklearn to solve linear problem?
 #
 #

 # +
 from sklearn import linear_model

 # load data
 d = datasets.load_diabetes()

 X = d.data[:, np.newaxis, 2]
 Y = d.target

 # create regression model
 regr = linear_model.LinearRegression()
 regr.fit(X, Y)

 a, b = regr.coef_, regr.intercept_
 print("a = %f, b = %f" % (a, b))

 x_min = np.min(X)
 x_max = np.max(X)
 y_min = a * x_min + b
 y_max = a * x_max + b

 plt.scatter(X, Y)
 plt.plot([x_min, x_max], [y_min, y_max], 'r')
 plt.show()
 # -

 # ## How to use sklearn to fit polynomial function?

 # +
 # Fitting polynomial functions

 from sklearn.preprocessing import PolynomialFeatures
 from sklearn.linear_model import LinearRegression
 from sklearn.pipeline import Pipeline

 t = np.array([2, 4, 6, 8])

 pa = -20
 pb = 90
 pc = 800

 y = pa*t**2 + pb*t + pc

 model = Pipeline([('poly', PolynomialFeatures(degree=2)),
                  ('linear', LinearRegression(fit_intercept=False))])
 model = model.fit(t[:, np.newaxis], y)
 model.named_steps['linear'].coef_

 # -

 # ## How to estimate some missing value by the model?
 #

 # +
 # load data
 d = datasets.load_diabetes()

 N = d.target.shape[0]
 N_train = int(N*0.9)
 N_test = N - N_train

 X = d.data[:N_train, np.newaxis, 2]
 Y = d.target[:N_train]

 X_test = d.data[N_train:, np.newaxis, 2]
 Y_test = d.target[N_train:]

 # create regression model
 regr = linear_model.LinearRegression()
 regr.fit(X, Y)

 Y_est = regr.predict(X_test)
 print("Y_est  = ", Y_est)
 print("Y_test = ", Y_test)
 err = (Y_est - Y_test)**2
 score = regr.score(X_test, Y_test)
 print("err = %f, score = %f" % (np.sqrt(np.sum(err))/N_test, score))


 # plot data
 a, b = regr.coef_, regr.intercept_
 print("a = %f, b = %f" % (a, b))

 x_min = np.min(X)
 x_max = np.max(X)
 y_min = a * x_min + b
 y_max = a * x_max + b


 plt.scatter(X, Y, label='train data')
 plt.scatter(X_test, Y_test, label='test data')
 plt.plot([x_min, x_max], [y_min, y_max], 'r', label='model')
 plt.legend()
 plt.show()
 # -


--- a/1_logistic_regression/Logistic_regression.ipynb
+++ b/1_logistic_regression/Logistic_regression.ipynb
--- a/1_logistic_regression/demo1/3a
+++ b/1_logistic_regression/demo1/3a
--- a/1_logistic_regression/demo1/3b
+++ b/1_logistic_regression/demo1/3b
--- a/1_logistic_regression/demo1/4
+++ b/1_logistic_regression/demo1/4
--- a/1_logistic_regression/demo1/data/artifical_lin.txt
+++ b/1_logistic_regression/demo1/data/artifical_lin.txt
--- a/1_logistic_regression/demo1/data/artifical_lin_2.txt
+++ b/1_logistic_regression/demo1/data/artifical_lin_2.txt
--- a/1_logistic_regression/demo1/data/breast-cancer-wisconsin.data
+++ b/1_logistic_regression/demo1/data/breast-cancer-wisconsin.data
--- a/1_logistic_regression/demo1/ipython_notebook_config.py
+++ b/1_logistic_regression/demo1/ipython_notebook_config.py
--- a/1_logistic_regression/demo1/utility.py
+++ b/1_logistic_regression/demo1/utility.py
--- a/1_logistic_regression/linear
+++ b/1_logistic_regression/linear
--- a/1_logistic_regression/linear_regression.py
+++ b/1_logistic_regression/linear_regression.py
--- a/1_logistic_regression/logistic3.py
+++ b/1_logistic_regression/logistic3.py
--- a/1_logistic_regression/logistic_demo.py
+++ b/1_logistic_regression/logistic_demo.py
--- a/logistic_regression/Least_squares.ipynb
+++ b/logistic_regression/Least_squares.ipynb