濮阳杆衣贸易有限公司

主頁(yè) > 知識(shí)庫(kù) > 京東在數(shù)據(jù)挖掘方面對(duì)推薦技術(shù)的優(yōu)化

京東在數(shù)據(jù)挖掘方面對(duì)推薦技術(shù)的優(yōu)化

熱門標(biāo)簽:怎樣明顯的顯示地圖標(biāo)注入駐注冊(cè) 魔獸世界污染者套裝地圖標(biāo)注 高德地圖標(biāo)注免費(fèi)版 眉山電銷 外呼系統(tǒng)是什么時(shí)候出現(xiàn)的 房產(chǎn)外呼系統(tǒng)免費(fèi) 公司在騰訊地圖標(biāo)注 福州企業(yè)外呼系統(tǒng)價(jià)格 外呼系統(tǒng)是座機(jī)號(hào)嗎

京東集團(tuán)高級(jí)副總裁張晨總結(jié):京東是一家以互聯(lián)網(wǎng)科學(xué)引領(lǐng)的網(wǎng)絡(luò)零售企業(yè),零售是它的基因,而零售最根本的是要給用戶做好服務(wù),京東可以通過(guò)技術(shù)手段把服務(wù)體驗(yàn)提升更多。

物流已經(jīng)成為京東的核心競(jìng)爭(zhēng)力,在今年618大促期間,有大量的商品實(shí)現(xiàn)了當(dāng)日達(dá),要讓物流更快可以通過(guò)大數(shù)據(jù)的方式來(lái)實(shí)現(xiàn),例如對(duì)某個(gè)居住小區(qū)的消費(fèi)偏好進(jìn)行分析,可以預(yù)先判斷哪些商品最暢銷,把商品放在小區(qū)附近的配送站,當(dāng)有消費(fèi)者下單,便可實(shí)現(xiàn)配送,這樣能提升用戶體驗(yàn)。

提升用戶體驗(yàn)的第二方面,是在大數(shù)據(jù)的基礎(chǔ)上實(shí)現(xiàn)的精準(zhǔn)推送。零售企業(yè)對(duì)商品是否暢銷的一個(gè)判斷是周轉(zhuǎn)率,而京東要實(shí)現(xiàn)提升周轉(zhuǎn)率便是對(duì)商品的精準(zhǔn)推送,“千人千面”產(chǎn)品體現(xiàn)的是這樣的思路,京東商城研發(fā)部“推薦搜索部”劉尚堃表示:“在當(dāng)前推薦位的情況下,再提升40%、50%的效能是能做到的,因?yàn)榫〇|個(gè)性化首頁(yè)產(chǎn)品上線的時(shí)間并不長(zhǎng)。”

張晨認(rèn)為,數(shù)據(jù)量越大,后發(fā)的價(jià)值越大,因?yàn)榫〇|的商品大多數(shù)屬于自營(yíng),貨品有來(lái)源、質(zhì)量有保障、交易是真實(shí)的,這些讓京東成為“中國(guó)互聯(lián)網(wǎng)企業(yè)里數(shù)據(jù)最好的公司之一,用這些優(yōu)質(zhì)的數(shù)據(jù)反過(guò)來(lái)服務(wù)好用戶,可挖的細(xì)節(jié)太多,是一件做不完的事情。”


京東的數(shù)據(jù)主要兩大類,用戶行為數(shù)據(jù)和基于內(nèi)容的數(shù)據(jù)。京東會(huì)根據(jù)用戶的行為數(shù)據(jù)構(gòu)建用戶畫像,比如是不是有小孩,是不是男性,在京東的生命周期怎么樣,促銷的敏感度如何,在家還是單位購(gòu)物多,購(gòu)買率的等級(jí)是什么?京東會(huì)根據(jù)用戶的行為做推薦,這大多是通過(guò)離線數(shù)據(jù)計(jì)算的。此外,系統(tǒng)還會(huì)根據(jù)用戶的實(shí)時(shí)行為進(jìn)行推薦,比如判斷出用戶喜歡瀏覽牙刷的品類,喜歡電動(dòng)牙刷,而且偏好聲波類電動(dòng)牙刷。

通過(guò)“共現(xiàn)矩陣”的辦法,京東推薦系統(tǒng)可以度量商品到商品的、用戶到用戶的商品、商品到商品的相似指數(shù)。比如用戶對(duì)某個(gè)商品的分值比較高,瀏覽的分值比較高,購(gòu)買的分值更高。通過(guò)這些辦法,可以找到比較貼近其需求和愛好的產(chǎn)品推薦給消費(fèi)者,在這些基礎(chǔ)算法之外,京東還會(huì)應(yīng)用高級(jí)算法提升推薦的效果。

京東還會(huì)通過(guò)一些模型進(jìn)行推薦,比如用戶的購(gòu)買力模型、周期商品購(gòu)買模型、LDA模型等。例如,京東現(xiàn)在有大量第三方商家,會(huì)存在有“一品多商”的問(wèn)題,京東就會(huì)用圖片相似等方法做過(guò)濾。

在排序上,京東會(huì)進(jìn)行兩級(jí)預(yù)估,先預(yù)估CTR(點(diǎn)擊率),再預(yù)估CVR(轉(zhuǎn)化率),由此進(jìn)行排序。這是如何實(shí)現(xiàn)的呢?對(duì)于任何一個(gè)商品,京東都認(rèn)為它具備品牌、中心詞、類目、擴(kuò)展屬性等指標(biāo),可以用銷售量來(lái)度量。每個(gè)商品和商品之間有一張購(gòu)買的網(wǎng),每個(gè)商品的pagerank也可以使用,這個(gè)指標(biāo)不但考慮了數(shù)量問(wèn)題,還考慮了網(wǎng)狀關(guān)系,考量的指標(biāo)還有評(píng)論數(shù)、好評(píng)度、瀏覽深度等。拿一個(gè)實(shí)際的例子來(lái)說(shuō),如果某用戶購(gòu)買產(chǎn)后塑身產(chǎn)品,那么孕婦裝雖然有關(guān)聯(lián)度,但這種關(guān)系會(huì)被劇烈地降低權(quán)重,因?yàn)檫壿嬌鲜窍葢言泻笊a(chǎn)再塑身。

京東個(gè)性化與排序平臺(tái)部高級(jí)總監(jiān)鄒宇分享了對(duì)冷啟動(dòng)用戶的處理方法。所謂的“冷啟動(dòng)”是指一個(gè)新用戶,系統(tǒng)中沒有他的行為數(shù)據(jù)。這個(gè)時(shí)候,京東做法就是根據(jù)人以群分的歸類法則。比如基于社交關(guān)系推薦。當(dāng)然如果這些沒有,可能找更粗的人群分群的方式,比如性別、年齡、地域。當(dāng)然最極端的情況下,完全沒有,那就根據(jù)最近的熱點(diǎn)進(jìn)行類別多樣化精選推薦的策略,把每一類當(dāng)下最流行的商品拼在一起推薦給新用戶去看,這其實(shí)是試探的過(guò)程,然后根據(jù)用戶的交互反饋,慢慢向用戶主信息上收斂。

重視實(shí)驗(yàn)與監(jiān)控迅速確認(rèn)算法優(yōu)劣

京東推薦平臺(tái)部總監(jiān)劉思喆介紹,在推薦系統(tǒng)中,京東非常重視實(shí)驗(yàn)與監(jiān)控。京東是算法和架構(gòu)分離,架構(gòu)可以管頂層工程,算法就是每天嘗試各種各樣的特征、數(shù)據(jù)、規(guī)則,以及流量最終的效果怎么樣。

京東推薦的實(shí)驗(yàn)系統(tǒng)采用了外部的頁(yè)面配置。流量實(shí)時(shí)生效,而且流量比例是可以任意分配的。簡(jiǎn)單修改某一個(gè)線上實(shí)驗(yàn),它的流量就可以實(shí)現(xiàn)秒級(jí)線上更新,第二天甚至實(shí)時(shí)可以看到結(jié)果。京東的分流策略常用兩種,第一種是隨機(jī),每次刷新看到的結(jié)果可能都不一樣,比如十組實(shí)驗(yàn),每一版都是10%的概率呈現(xiàn);第二種就是相對(duì)固定,一旦看到第一次結(jié)果之后,就保證你以后看到的結(jié)果都是這個(gè)樣子。京東的實(shí)驗(yàn)系統(tǒng)支持版本回溯,算法工程師一旦出現(xiàn)誤配,可以找回相關(guān)的版本和權(quán)限。

除了實(shí)時(shí)實(shí)驗(yàn)之外,京東實(shí)驗(yàn)系統(tǒng)同樣有離線debug平臺(tái)支持,輸入?yún)?shù)可以是一個(gè)或多個(gè)SKU,也可以是類,進(jìn)行不同實(shí)驗(yàn)的結(jié)果召回,定位不同實(shí)驗(yàn)的效果。這樣算法工程師可以通過(guò)自測(cè)幾個(gè)小的例子,迅速找到自己的算法,在沒有切流量之前問(wèn)題在哪,或者到底好在什么地方。

持續(xù)優(yōu)化迭代提升推薦系統(tǒng)價(jià)值

劉思喆認(rèn)為,算法優(yōu)化必須逐步迭代。不可能忽然上一個(gè)很牛的算法保證效果提高50%,工程師之間的相互交流有助于提高算法優(yōu)化效果。

而通過(guò)數(shù)據(jù)的挖掘,京東也會(huì)發(fā)現(xiàn),某些用戶從來(lái)不點(diǎn)任何推薦,不點(diǎn)任何廣告,也就是對(duì)這個(gè)東西完完全全不感冒。那可能京東也有可能對(duì)該用戶隱藏推薦系統(tǒng)。“用戶如果能深度地參與到推薦系統(tǒng)里面來(lái),當(dāng)然可能是無(wú)意識(shí)的,這時(shí)推薦系統(tǒng)才真正做到了極致。”

鄒宇認(rèn)為,京東大數(shù)據(jù)的價(jià)值越來(lái)越大。舉例來(lái)說(shuō),互聯(lián)網(wǎng)展示廣告的點(diǎn)擊率通常能到千分之一就不錯(cuò)了,轉(zhuǎn)化率更低,通常是萬(wàn)分之幾。但京東的搜索轉(zhuǎn)化率高于這種廣告轉(zhuǎn)化率的幾個(gè)數(shù)量級(jí),因此,京東的數(shù)據(jù)會(huì)有越來(lái)越高的價(jià)值,京東的推薦系統(tǒng)在推動(dòng)業(yè)務(wù)成長(zhǎng)方面的作用也將越來(lái)越重要。

標(biāo)簽:麗水 三明 臺(tái)灣 赤峰 銅川 曲靖 辛集 秦皇島

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《京東在數(shù)據(jù)挖掘方面對(duì)推薦技術(shù)的優(yōu)化》,本文關(guān)鍵詞  京東,在,數(shù)據(jù)挖掘,方面對(duì),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《京東在數(shù)據(jù)挖掘方面對(duì)推薦技術(shù)的優(yōu)化》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于京東在數(shù)據(jù)挖掘方面對(duì)推薦技術(shù)的優(yōu)化的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    吕梁市| 新郑市| 北京市| 来宾市| 武穴市| 台南县| 金阳县| 即墨市| 延边| 驻马店市| 抚宁县| 罗江县| 呼和浩特市| 灵璧县| 贡觉县| 克什克腾旗| 富平县| 睢宁县| 河池市| 西乌珠穆沁旗| 达州市| 阿拉尔市| 丰台区| 双牌县| 资源县| 乌鲁木齐县| 丰镇市| 五大连池市| 定陶县| 永济市| 宕昌县| 武山县| 阿坝县| 胶南市| 晋宁县| 郓城县| 迭部县| 南汇区| 象州县| 神木县| 历史|