學(xué)AI，好工作就找北大青鳥

關(guān)注小青聽課做題，輕松學(xué)習(xí)

周一至周日

4000-9696-28

首頁品牌優(yōu)勢研究院 AI實驗室教學(xué)實施就業(yè)保障校企共育青鳥動態(tài) 校區(qū)查詢

首頁> 青鳥動態(tài)> 新聞資訊> 《唐人街探案3》票房如何，有監(jiān)督機(jī)器學(xué)習(xí)算法告訴你！

行業(yè)觀瞻

技術(shù)熱點(diǎn)

面試寶典

青鳥動態(tài)

資料下載

其他

在線咨詢

在線咨詢

《唐人街探案3》票房如何，有監(jiān)督機(jī)器學(xué)習(xí)算法告訴你！

來源：北大青鳥總部 2021年02月07日 10:07

摘要：《唐人街探案3》票房如何，有監(jiān)督機(jī)器學(xué)習(xí)算法告訴你！

在人工智能的眾多應(yīng)用方向中，最重要的方向之一便是機(jī)器學(xué)習(xí)，在機(jī)器學(xué)習(xí)中又分為有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)等，今天我們要介紹的便是有監(jiān)督機(jī)器學(xué)習(xí)。

有監(jiān)督機(jī)器學(xué)習(xí)指的是通過有標(biāo)記的訓(xùn)練樣本集去進(jìn)行學(xué)習(xí)訓(xùn)練，獲得一個最優(yōu)模型，此后同類的數(shù)據(jù)可按照此模型進(jìn)行輸入，根據(jù)輸出的結(jié)果進(jìn)行預(yù)測、分類，在像人一樣進(jìn)行思考的道路上實現(xiàn)第一步。常見的有監(jiān)督學(xué)習(xí)算法包含線性回歸算法、決策樹、支持向量機(jī)、KNN。

那這些算法具體又是怎么樣呢？我們一起來看看吧。為了幫助大家更好的理解、吸收，我們以預(yù)測《唐人街探案3》電影票房為例進(jìn)行講解～

KNN，即KNearestNeighbors，K個最近的鄰居，指的是當(dāng)預(yù)測集中來了一個新的數(shù)據(jù)時，我們看這個數(shù)據(jù)距離它最近的K個點(diǎn)分別是什么，從而判斷新數(shù)據(jù)是什么類別。春節(jié)檔馬上上映電影《唐探3》（下圖中的小綠點(diǎn)），我們要預(yù)測它的票房，這時候可以獲取同類電影、同類導(dǎo)演、演員、上映時間、上映時長的電影數(shù)據(jù)，計算《唐探3》到這些電影（下圖中的小紅點(diǎn)、小藍(lán)角）之間的距離，看看前K個的值，如果前K個值中大部分是5億～10一，少部分是低于5億，少部分是高于10億，那么預(yù)測《唐探3》票房在5-10億是最可能的。

在KNN算法中，K的值是很重要的，K過小或過大，都會對結(jié)果有影響，因此在實際操作中，也需要通過不斷的實踐，找到最合適的K值。KNN算法的好處是簡單、模型訓(xùn)練時間快、預(yù)測效果好，缺點(diǎn)是耗內(nèi)存、速度慢、對不相關(guān)的數(shù)據(jù)規(guī)模敏感，因為存儲了大量的數(shù)據(jù)、每個數(shù)據(jù)逐次計算。當(dāng)數(shù)據(jù)量較大時，可以選擇使用KNN算法。

線性回歸算法，即LinearRegression，線性指的是直線型關(guān)系，兩個變量之間的關(guān)系是一次函數(shù)（如y=a*x+b），通過對大量數(shù)據(jù)進(jìn)行處理，找到符合數(shù)據(jù)之間的規(guī)律關(guān)系，從而對新的值輸入時進(jìn)行結(jié)果預(yù)測，比較常見的是股價預(yù)測、電影票房預(yù)測等場景。

以預(yù)測春節(jié)檔馬上上映的《唐人街探案3》票房為例，已知數(shù)據(jù)有電影上映時間、價格、拍攝國家、電影類型、觀影時長、演員陣容、上映電影院數(shù)量、上映時長、宣傳平臺、宣傳時長、電影票房等數(shù)據(jù)，基于基準(zhǔn)數(shù)據(jù)，我們可以計算出電影票房與電影之間的關(guān)系（y=a1*x1+a2*x2+a3*x3+a4*x4+a5*x5+...+b），再將《唐探3》的對應(yīng)數(shù)據(jù)帶入之后，大概就能得到預(yù)估票房了。

在線性回歸算法中，還有一個重要的模型便是損失函數(shù)，即用來估量預(yù)測值與真實值之間的不一致程度，損失函數(shù)越小，模型效果越好，我們可以通過損失函數(shù)來調(diào)優(yōu)線性回歸模型。

決策樹算法，是與線性算法相對的，在決策樹中是一個類似N叉樹的樹形結(jié)構(gòu)，每一個數(shù)內(nèi)部節(jié)點(diǎn)代表對特征的一個測試，樹的分支代表測試結(jié)果，最高層就是根節(jié)點(diǎn)。在決策樹模型的生成中，一般包含特征選擇、決策樹生成、決策樹修剪三部分，在特征選擇中，一般對實例的某一特征進(jìn)行測試。在構(gòu)造決策樹時，首先把所有的訓(xùn)練數(shù)據(jù)都放在根節(jié)點(diǎn)，選擇一個最優(yōu)特征，按特征把訓(xùn)練數(shù)據(jù)分割成子集，如果子集可以被正確分類，則繼續(xù)構(gòu)造葉子節(jié)點(diǎn)，根據(jù)測試結(jié)果把實例分配到子節(jié)點(diǎn)，每個子節(jié)點(diǎn)都對該特征的一個取值，不斷的進(jìn)行測試分配，直到所有子集都分配到葉子節(jié)點(diǎn)。

我們還是以《唐人街探案3》為例，我們拿到了所有電影的票房數(shù)據(jù)，并且設(shè)定了電影票房的相關(guān)屬性，包括電影類型、上映時間、拍攝成本、導(dǎo)演水平、演員評價等，通過決策樹模型來訓(xùn)練電影票房與對應(yīng)屬性的關(guān)系，得到如下決策樹模型，我們再把《唐探3》的相關(guān)電影屬性進(jìn)行代入，預(yù)測電影票房。

預(yù)測電影票房只是機(jī)器學(xué)習(xí)中的一種實踐，只要有了對應(yīng)的數(shù)據(jù)集，我們可以預(yù)測房價、股價、天氣走勢，甚至是疫情走勢。人工智能正在讓我們的生活變得越來越簡單、可控，而其對應(yīng)的有監(jiān)督機(jī)器學(xué)習(xí)算法你掌握了嗎？今年春節(jié)檔上映的《唐人街探案3》票房你又預(yù)測多少呢？

文章來源“AI課工場”

標(biāo)簽: 《唐人街探案3》票房北大青鳥機(jī)器學(xué)習(xí)算法監(jiān)督機(jī)器學(xué)習(xí)算法預(yù)測電影票房

IT熱門趨勢

1 新媒體運(yùn)營2

2 全媒體設(shè)計證書

3 大數(shù)據(jù)應(yīng)用

4 AI大模型開發(fā)實訓(xùn)營

5 云計算與網(wǎng)絡(luò)安全

6 Java全棧開發(fā)與大數(shù)據(jù)

熱門班型時間

人工智能就業(yè)班即將爆滿

AI應(yīng)用線上班即將爆滿

UI設(shè)計全能班即將爆滿

數(shù)據(jù)分析綜合班即將爆滿

軟件開發(fā)全能班爆滿開班

網(wǎng)絡(luò)安全運(yùn)營班爆滿開班

職場就業(yè)資訊

1 IT行業(yè)就業(yè)前景向好

2 IT人才需求保持穩(wěn)定

3 網(wǎng)絡(luò)安全人才緊缺

4 IT看重專業(yè)技能經(jīng)驗

5 畢業(yè)生投身IT行業(yè)熱

6 程序員職場晉升新路徑

技術(shù)熱點(diǎn)榜單

1 AIGC應(yīng)用

2 機(jī)器學(xué)習(xí)與深度學(xué)習(xí)

3 虛擬化與分布式計算

4 數(shù)據(jù)采集與數(shù)據(jù)存儲

5 傳感器與無線通信技術(shù)

青鳥課程

AI全棧開發(fā)工程師 AI全媒體電商運(yùn)營數(shù)據(jù)智能 AI時代全鏈路UI設(shè)計師 AI時代網(wǎng)絡(luò)運(yùn)維工程師

學(xué)習(xí)入口

云題庫云豆網(wǎng) 在線視頻課學(xué)籍查詢證書查詢

招生咨詢熱線： 4000-9696-28

手機(jī)端官網(wǎng)

免費(fèi)領(lǐng)熱門課程

北京市海淀區(qū)成府路207號

北京市海淀區(qū)成府路207號北大青鳥（總部）

友情鏈接：

Copyright © 1999- 北京青鳥職業(yè)教育科技發(fā)展有限公司版權(quán)所有

京公網(wǎng)安備 11010802020714號京ICP備2020047077號-2

感谢您访问我们的网站，您可能还对以下资源感兴趣：

成年人在线免费观看毛片

国产古代一级a毛片亚洲国产中文AV无码精品国产精品中文第一字幕毛片无遮挡高清免费观看