本篇內(nèi)容介紹了“github線性回歸怎么實(shí)現(xiàn)”的有關(guān)知識,在實(shí)際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
成都創(chuàng)新互聯(lián)公司是一家專注于網(wǎng)站建設(shè)、成都做網(wǎng)站與策劃設(shè)計(jì),環(huán)翠網(wǎng)站建設(shè)哪家好?成都創(chuàng)新互聯(lián)公司做網(wǎng)站,專注于網(wǎng)站建設(shè)10余年,網(wǎng)設(shè)計(jì)領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:環(huán)翠等地區(qū)。環(huán)翠做網(wǎng)站價格咨詢:18982081108
Simple Linear Regression
Data Preprocessing
1 讀入數(shù)據(jù)集
# Importing the dataset dataset <- read.csv('studentscores.csv') #時間和得分之間的關(guān)系 Hours Scores 1 2.5 21 2 5.1 47 3 3.2 27 4 8.5 75 5 3.5 30 6 1.5 20 plot(dataset$Hours,dataset$Scores) #
2 數(shù)據(jù)預(yù)處理
首先按照上次分享的進(jìn)行數(shù)據(jù)預(yù)處理
R|ML_code-入門(1)
3 訓(xùn)練集和測試集
將數(shù)據(jù)按照4:1拆分,每一組分別包含自變量和因變量
# Splitting the dataset into the Training set and Test set # install.packages('caTools') library(caTools) set.seed(123) split = sample.split(dataset$Scores, SplitRatio = 1/4) training_set <- subset(dataset, split == TRUE) test_set <- subset(dataset, split == FALSE) # Feature Scaling # training_set <- scale(training_set) # test_set <- scale(test_set)
4 模型擬合及預(yù)測
通過訓(xùn)練集進(jìn)行模型擬合得到曲線,然后將測試集的X_test帶入曲線中,得到預(yù)測結(jié)果y_pred,最后將預(yù)測結(jié)果y_pred與測試集中的y_test進(jìn)行比較,確定預(yù)測是否準(zhǔn)確。
# Fitting Simple Linear Regression to the Training set regressor = lm(formula = Scores ~ Hours, data = training_set) # Predicting the results y_pred <- predict(regressor, newdata = test_set)
5 結(jié)果可視化
# Visualising the Training results library(ggplot2) ggplot() + geom_point(aes(x = training_set$Hours, y = training_set$Scores), colour = 'red') + geom_line(aes(x = training_set$Hours, y = predict(regressor, newdata = training_set)), colour = 'blue') + ggtitle('Scores vs Hours (Training set)') + xlab('Hours') + ylab('Scores') # Visualising the Test results library(ggplot2) ggplot() + geom_point(aes(x = test_set$Hours, y = test_set$Scores), colour = 'red') + geom_line(aes(x = training_set$Hours, y = predict(regressor, newdata = training_set)), colour = 'blue') + ggtitle('Scores vs Hours (Test set)') + xlab('Hours') + ylab('Scores')
“github線性回歸怎么實(shí)現(xiàn)”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!
當(dāng)前名稱:github線性回歸怎么實(shí)現(xiàn)
轉(zhuǎn)載注明:http://jinyejixie.com/article26/ghhhcg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供Google、品牌網(wǎng)站設(shè)計(jì)、小程序開發(fā)、App設(shè)計(jì)、網(wǎng)頁設(shè)計(jì)公司、微信小程序
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)