Linear regression là gì, lý thuyết hồi quy tuyến tính linear regression

     

Hi chúng ta, bận thừa cần thời hạn ra nội dung bài viết để quá lâu mong muốn hầu như fan thông cảm. Hôm nay mình trở lại với ra mắt đến chúng ta thuật tân oán cơ phiên bản độc nhất vô nhị Machine Learning. Đây chắc chắn là là thuật toán dễ dàng nhất của Machine Learning. Nếu bạn muốn nhập môn machine learning chắc chắn rằng sẽ phải học tập thuật tân oán này. Để mang đến chúng ta hình dung cụ thể về thuật toán thù tuyệt nhất rất có thể, bản thân sẽ trình làng về bài bác toán thù Dự đân oán giá nhà thực hiện thuật toán Linear Regression.

Bạn đang xem: Linear regression là gì, lý thuyết hồi quy tuyến tính linear regression

I. Thuật tân oán Linear Regression là gì ?

Linear Regression là thuật toán dễ nhất machine learning. Trên mạng có khá nhiều định nghĩa mà lại bản thân xin tư tưởng theo cách gọi của bản thân nhỏng sau : Hồi quy đường tính hay Linear Regression là 1 thuật toán nhằm mục đích mục đích đi tìm những hệ số của một phương trình:

*

Với đầu vào là hầu hết mặt hàng trong dữ liệu đựng những cực hiếm x1, x2 , .. xn và giá trị y => Nhiệm vụ của thuật tân oán vẫn phụ thuộc vào cực hiếm đầu vào với đưa ra được các thông số anpha0 , anpha1 , … anpha n. Nghe có vẻ thuật tân oán khá đơn giản và dễ dàng. Nhưng bài bác toán thù này so với con người là một chiếc gì đó cực khó khăn.

Tất nhiên thuật toán machine learning thì cần Loss Function (Hàm mất mát). Theo blog.vietnamlab.vn thì phương pháp nhỏng sau:

*

Sau Loss Function là công thức đưa ra mọi antrộn bắt đầu phù hợp rộng đến phương thơm trình lúc đi qua từng loại của tài liệu. Cũng theo blog.vietnamlab.vn thì cách làm như sau :

*
*

Sơ sơ kim chỉ nan nhiêu đây thôi , tiếp theo sau mình sẽ đến phần thực hành dự đân oán giá nhà đất bằng thuật toán thù này. Để vận dụng thuật toán thù này bạn cần gửi hết toàn bộ các thông số ví như ngày cài đặt , tọa độ căn nhà … về dạng số để lấy vào thuật tân oán.

II. Dự Đân oán Giá Nhà Với Linear Regression

1.Môi ngôi trường thao tác với cách xử trí data

Vì bài bác này tương quan cho tính toán với vẽ hình liên tục cần bản thân vẫn sử dụng google colab làm khu vực lập trình sẵn. quý khách như thế nào không biết rõ về google colab rất có thể tìm hiểu thêm trên : https://bacninhtrade.com.vn/ai/cach-dung-google-colab-va-thu-vien-numpy-phuc-vu-cho-machine-learning-phan-1-2/

Trước tiên các bạn tạo một project google colab bắt đầu. Cách sản xuất tôi đã nói sinh sống link phía trên. Hoặc các bạn truy vấn thẳng links : https://colab.research.google.com/ singin tài khoản google với chọn sổ tay mới.

*

Tiếp theo các bạn sẽ download dự liệu áp dụng mang đến việc dự đoán thù về. Dữ liệu này mình tìm kiếm thấy trên kaggle. Các các bạn chạy lệnh này trên top google colab sẽ mua tài liệu về cùng với pandas và coi dữ liệu tất cả gì:

import pandas as pddata = pd.read_csv("https://raw.githubusernội dung.com/sonrasa2k/bacninhtrade.com.vn_dudoangianha/master/Real%20estate.csv")data

*
Để coi một giải pháp tổng quát hơn về dữ liệu , ta cần sử dụng lệnh:

data.describe()

*
Ở phía trên chúng ta có count là tổng thể loại data của từng cột. mean là giá trịn mức độ vừa phải của từng côt … các bạn chịu khó quan sát đã rõ.Dữ liệu bao gồm những thuộc tính nlỗi ngày thiết lập , tuổi của nơi ở, …. với chi phí.

Kế tiếp họ test vẽ trang bị thị xem sự phân bổ của giá nhà đất vào tài liệu , ta cần sử dụng thư viện matplotlib :

import matplotlib.pyplot as pltx = data<"No">y = data<<"Y house price of unit area">>plt.plot(x,y,"go")

*
Rất đưa ra là lộn xộn, thử hỏi làm sao đồ vật nó dự đoán thù được ta? Chúng ta thường xuyên cùng với phần quan lại vào tốt nhất chính là dùng thuật tân oán Linear Regression để cho lắp thêm đối chiếu và học tập để dự đoán.

Xem thêm: Ngân Hàng Bidv Liên Kết Với Ngân Hàng Nào Chưa? Ngân Hàng Bidv Liên Kết Với Những Ngân Hàng Nào

Để hỗ trợ mang lại việc áp dụng thuật tân oán, bản thân sẽ sử dụng thỏng viện scikit-learn.

Chúng ta 2 dữ liệu là X_train với Y_train . X là tài liệu đầu vào , Y là hiệu quả dự đoán làm việc đó là giá nhà.

names = <"X1 transaction date","X2 house age","X3 distance khổng lồ the nearest MRT station","X4 number of convenience stores","X5 latitude","X6 longitude">X_train = dataX_trainY_train= data<"Y house price of unit area">Y_train

*
2.Train Model cùng dự đoánDữ liệu train sẽ tất cả, giờ tiếp theo đã triển khai train nào. Với vài ba mẫu đơn giản và dễ dàng thôi. Tlỗi viện scikit-learn hỗ trợ.

from sklearn.linear_model import LinearRegressionreg = LinearRegression().fit(X_train,Y_train)Sau Khi train để biết được phần đông anpha1 , anpha2 … là các số gì thì ta sử dụng lênh:

reg.coef_

*
Để biết được anpha0 là số gì ta dùng lệnh:

reg.intercept_

*
Và sau cùng, phương trình họ đề nghị tra cứu để dự đân oán nhà đang là:

*

OK! Vậy nên đã ra được phương thơm trình rồi, tiếp theo chúng ta cũng có thể phụ thuộc vào phương thơm trình để tham dự đân oán cùng với X1,X2,X3… đang gồm trong data để test quý hiếm dự đân oán bằng cách cố từng quý giá vào phương trình. Hoặc các bạn sẽ sử dụng tlỗi viện scikit-learn để tham dự đoán thù lại tập dữ liệu train với lệnh:

x_chạy thử = X_trainy_predict=reg.predict(x_test)y_predict

*
Hoặc dự đoán thù một chiếc ngẫu nhiên tròn data đang trả về quý giá Y.

3.Vẽ Biểu Đồ cực hiếm dự đoán

Cuối thuộc,chúng ta vẽ biểu đồ xem cực hiếm dự đoán với mức giá trị, thực tế nó như thế nào:

plt.scatter(x,y, color="black")plt.plot(y_predict, color="blue", linewidth=3)plt.xticks(())plt.yticks(())plt.show()

*
Những con đường màu xanh là quý giá dự đoán, chnóng black là quý hiếm thực tế. Cũng khởi sắc kiểu như nhau, mặc dù đấy là mình dự đoán thù lại tập train sẽ không tạo nên được điều gì, tôi chỉ minh chứng là rất có thể dự đoán giá nhà với thuật toán thù này. Quý Khách có thể từ sản xuất giữ lại liệu với đánh giá demo độ chính xác.

III. Kết Luận

Như vậy sơ sơ chúng ta đang gắng được biện pháp sử dụng thuật toán Linear Regression. Dễ dàng với thư viện scikit-learn. quý khách hàng rất có thể từ lập trình sẵn lại bởi code của mình nhé!

Để biết thêm những kiến thức và kỹ năng tốt ho các chúng ta cũng có thể tmê mệt gia nhóm của mình trên links :https://www.facebook.com/groups/164371998723215

Các bạn phải thêm thông tin tốt sự trợ giúp trường đoản cú bản thân có thể ấn theo dõi và quan sát mình bên trên Facebook với Nhắn tin trực tiếp với bản thân qua liên kết :https://www.facebook.com/sonnguyen16032000

Cảm ơn chúng ta vẫn theo dõi bài viết khá nhiều năm của chính bản thân mình , hi vọng qua nội dung bài viết các bạn tất cả tầm nhìn khái quát rộng về thuật toán. Xin chào tạm biệt cùng hứa gặp lại vào ngày ngay sát nhất!

Tài liệu tham khảo từ: https://scikit-learn.org/stable/getting_started.html, blog.vietnamlab.vn


Chuyên mục: Đầu tư