來源:北大青鳥總部 2020年01月09日 09:32
相信經(jīng)常網(wǎng)上購物的同學(xué)都遇到過這樣的情況:同樣的淘寶APP,自己手機顯示的內(nèi)容卻和別人不一樣。那到底是什么原因造成這種差異的呢?
其實,這一切都是個性化推薦在作祟。所謂的個性化推薦實際背后有一套成熟依托推薦算法的系統(tǒng),它能通過各種細節(jié)洞悉客戶的喜愛偏愛,以及客戶的性格、購買習(xí)慣、經(jīng)濟實力等等,從而 給用戶精準(zhǔn)推薦她最感興趣和可能購買的商品。
今天小編就以最為簡潔的方式介紹推薦系統(tǒng)中的一個小小的角落,基于用戶的協(xié)同過濾算法進行個性化推薦。它是一種依據(jù)用戶行為數(shù)據(jù),根據(jù)用戶之間的相似性向目標(biāo)用戶推薦它可能喜歡的物品的一種方法,說起來比較繞口,舉個栗子...
小美是個資深淘寶控,閑著沒事兒就會逛淘寶,看到喜歡的商品的時候,她就會點進去詳情頁仔細查看,如果更喜歡一點她就會將這件商品收藏起來,如果實在恰入小美法眼的話,二話不說小美拿出我的花唄就開始買買買。當(dāng)然這一切的操作行為都被淘寶的算法團隊看的明明白白,所以他們通過小美的操作行為抽象出一個“喜歡程度”,規(guī)則如下: 1.如果查看了商品詳情并瀏覽10秒以上,得1分 2.如果瀏覽了商品并點擊了收藏商品,得4分(瀏覽操作不單獨加分) 3.如果購買了商品直接,得8分(其余操作不單獨加分)
經(jīng)過一個小時的逛淘寶過程,小美的操作行為都被日志記錄下: 1.小美對商品A查看了詳情并瀏覽18秒 2.小美對商品B進行了收藏 3.小美對商品C進行了慘無人道的購買行為
經(jīng)過這些行為后,可以總結(jié)出小美對商品的一些“喜歡程度”。我們假設(shè)這家淘寶只有5件商品,可以得到如下內(nèi)容:
可以看到,商品A、B、C都因為小美對其產(chǎn)生了一些行為后,得到了對應(yīng)的喜歡程度得分,那小美對商品D、E的喜歡程度是空缺的,那就一定代表小美不喜歡商品D、E嗎?這顯然是不準(zhǔn)確的,因為可能小美就沒有在淘寶上發(fā)現(xiàn)這兩件商品,并不能直接說小美對這兩件商品一點都不感興趣?,F(xiàn)在商家想要將商品D或E介紹給小美,但是到底首先應(yīng)該推薦哪個商品給小美呢?這時就體現(xiàn)了個性化推薦的重要性。淘寶除了收集小美的操作行為之外還收集了其他用戶的行為,如狗剩、建國、小花三人的行為,這時就有如下的數(shù)據(jù):
有了這4個客戶的行為數(shù)據(jù),現(xiàn)在我想給小美推薦商品,優(yōu)先推薦商品D還是E?具體的步驟如下(user-based協(xié)同過濾算法): 1.分別計算小美與狗剩、建國、小花的偏好相似性,計算辦法通常采用余弦相似度計算,公式為:
如計算小美與狗剩的相似度就是向量[1,4,8,0,0]與向量[0,0,1,1,8]的相似度,結(jié)果為0.109。 按同樣的公式求出小美與建國和小花的相似度分別為:0.079,0.736。
2.計算用戶對待推薦商品的預(yù)測評分,具體計算方式與結(jié)果如下。 小美對商品D的預(yù)測喜歡程度: (0.109*1+0.079*0+0.736*8)/(0.109+0.079+0.736)=6.49 小美對商品E的預(yù)測喜歡程度: (0.109*8+0.079*4+0.736*1)/(0.109+0.079+0.736) = 2.08
實際這就是將相似度和用戶對該商品喜歡程度相乘,然后相加,然后再除以相似度的和。狗剩對商品D的喜歡程度為1,建國為0,小花為8。將它們分別乘以與小美的相似度,最終得到小美對商品D的喜歡程度。相似的方法求出小美對商品E的喜歡程度。
3.選取喜歡程度分值更高的商品進行最終推薦,最終向小美推薦商品D。這就是基于用戶的協(xié)同過濾算法。 總結(jié)一下: user-based協(xié)同過濾算法就是通過計算用戶之間的相似度,然后對目標(biāo)用戶未發(fā)生過行為的商品進行“喜歡程度”的預(yù)測,預(yù)測的方式就是通過用戶之間相似度與他們給該商品的評分做一下加權(quán)。最終向用戶推薦經(jīng)過算法預(yù)測“喜歡程度”較高的商品。你明白了嗎? 須知: 真實電商網(wǎng)站的推薦算法遠比上述介紹復(fù)雜的多??梢哉f推薦系統(tǒng)是一項藝術(shù),這一點也不為過。 看完小編的這篇文章,怎么樣,女朋友好奇或者朋友詢問技術(shù)的時候,知道怎么回答他們了嗎