軟件預(yù)測能比人工預(yù)測準(zhǔn)多少?
這是我們?cè)谂c同行業(yè)溝通探討時(shí)經(jīng)常會(huì)被問道的一個(gè)問題,其實(shí)這里面存在一個(gè)誤區(qū),準(zhǔn)確度的高低并不是由系統(tǒng)或者人工來決定的,而是由選取的歷史數(shù)據(jù)、分析的方法以及特殊事宜的考慮而決定的,要做到精準(zhǔn)的預(yù)測,往往與預(yù)測人員的工作經(jīng)驗(yàn)有著非常大的關(guān)系。
要做好準(zhǔn)確的預(yù)測,目前普遍認(rèn)為需要做到以下三點(diǎn):
1、選取適當(dāng)?shù)臍v史數(shù)據(jù);
2、依靠經(jīng)驗(yàn)來撫平或剔除業(yè)務(wù)異常數(shù)據(jù);
3、對(duì)業(yè)務(wù)未來活動(dòng)、節(jié)假日等因素的預(yù)估。
選取適當(dāng)?shù)臍v史數(shù)據(jù)
歷史數(shù)據(jù)是一切預(yù)測的基礎(chǔ),后續(xù)的話量預(yù)測都會(huì)是在歷史數(shù)據(jù)的基礎(chǔ)上進(jìn)行提升或下降的,那么按照統(tǒng)計(jì)學(xué)的原理來說是不是收集的樣本數(shù)越多就越可以反映出未來話量趨勢的走向呢?
其實(shí)不然。按理說數(shù)據(jù)應(yīng)選取與未來業(yè)務(wù)變化一致的歷史數(shù)據(jù)進(jìn)行預(yù)測,如下周或下個(gè)月業(yè)務(wù)將進(jìn)行技能的調(diào)整或用戶群體的變化,那之前取的長時(shí)間的歷史話量參考性將會(huì)大幅下降,應(yīng)該多參考近期業(yè)務(wù)的話量變化作為預(yù)測歷史數(shù)據(jù),也就是說業(yè)務(wù)越不穩(wěn)定,我們選擇的歷史數(shù)據(jù)應(yīng)當(dāng)越短較好,因?yàn)槎虝r(shí)間的數(shù)據(jù)可以反應(yīng)出業(yè)務(wù)話量起伏變化的趨勢與規(guī)律,而長時(shí)間的歷史數(shù)據(jù)會(huì)將業(yè)務(wù)的話務(wù)起伏抹平”;
反之,如果業(yè)務(wù)較為穩(wěn)定且未來沒有重大的變化,我們就可以選擇較長的歷史數(shù)據(jù)進(jìn)行預(yù)測,這樣會(huì)將短期內(nèi)或少量的異常情況進(jìn)行撫平”。
依靠經(jīng)驗(yàn)來撫平或剔除業(yè)務(wù)異常數(shù)據(jù)
在選取歷史數(shù)據(jù)中往往會(huì)選到節(jié)假日、活動(dòng)日以及線路故障等日期數(shù)據(jù),如果使用這部分?jǐn)?shù)據(jù)對(duì)未來話量進(jìn)行預(yù)測將會(huì)默認(rèn)未來的一段時(shí)間內(nèi)會(huì)同樣有節(jié)假日、活動(dòng)日或故障,這顯然是不合適的,我們無法預(yù)測未來會(huì)出現(xiàn)故障問題,這就需要我們?cè)跇I(yè)務(wù)運(yùn)營時(shí)每日要記錄業(yè)務(wù)出現(xiàn)的臨時(shí)狀況如線路故障、天氣異常、國家政策等對(duì)于話務(wù)線路的沖擊,在將來進(jìn)行預(yù)測的時(shí)候需要將這部分異常的日期數(shù)據(jù)進(jìn)行拋出;
至于活動(dòng)日和節(jié)假日,它們與故障不同,活動(dòng)日和節(jié)假日無論是歷史數(shù)據(jù)還是未來都是有明確日期的,所以像這類特殊情況一般是將他們單獨(dú)提取出來單獨(dú)進(jìn)行預(yù)測。
在上述的選取適當(dāng)?shù)臍v史數(shù)據(jù)”與依靠經(jīng)驗(yàn)撫平或剔除業(yè)務(wù)異常數(shù)據(jù)”中可以看出基本上是依靠個(gè)人經(jīng)驗(yàn)或者是說直覺進(jìn)行數(shù)據(jù)選取和話務(wù)剔除,有人會(huì)說這完全就是拍腦袋的決定,毫無科學(xué)依據(jù)”,但如果大家能夠真正能明白直覺”是什么時(shí)就會(huì)知道依靠直覺來進(jìn)行判斷并不是毫無依據(jù),歷史數(shù)據(jù)與數(shù)據(jù)剔除的影響因素有千千萬萬,我們必須承認(rèn)如此海量的影響因素是無法全部收集的,既然無法收集全部的影響因素,那么即使運(yùn)用科學(xué)的方法做出的預(yù)測又怎么會(huì)有科學(xué)依據(jù)呢?
反而直覺是依靠自己在平時(shí)工作、生活中的經(jīng)驗(yàn)而通過左右權(quán)衡得出的一個(gè)大體的數(shù)字,雖然這在很大程度上取決于操作者的時(shí)間經(jīng)驗(yàn),但我們必須相信這種經(jīng)驗(yàn)并且頻繁地實(shí)施,之后我們才可以從經(jīng)驗(yàn)中得出數(shù)據(jù)上的結(jié)論,當(dāng)然,這個(gè)結(jié)論可能只適用于某個(gè)業(yè)務(wù)。
對(duì)業(yè)務(wù)未來活動(dòng)、節(jié)假日等因素的預(yù)估
對(duì)于這列特殊日期的預(yù)測需要用到特殊方法,不能像其他普通日期使用長時(shí)間歷史話量進(jìn)行預(yù)測,而是提取特殊因子進(jìn)行計(jì)算。
特殊因子存在于歷史發(fā)生過的活動(dòng)日或節(jié)假日中,我們需要分析往年的活動(dòng)或節(jié)假日對(duì)于線路的影響比例并將這種影響的比例進(jìn)行計(jì)算后套用到今年的活動(dòng)或節(jié)假日中,在基礎(chǔ)數(shù)據(jù)上進(jìn)行折算,譬如對(duì)2017年國慶日的節(jié)假日預(yù)測,我們可以取2016年及2015年國慶日當(dāng)周的話量以及前1-7天、8-14天、15-21天、22-28天來計(jì)算出國慶日當(dāng)周的話量下降因子,例如把2016年國慶周的前22-28天話量當(dāng)做是100%從而分析出前15-21天話量已經(jīng)開始出現(xiàn)下降,假設(shè)話量下降了5%,那國慶前15-21天的話量只有國慶前22-28天話量的95%。
以此類推,一直展示到國慶當(dāng)周的話量是百分之多少,這樣當(dāng)我們預(yù)測出國慶前22-28天的話量時(shí)就可以套用話量下降或上升的百分比因子來計(jì)算出國慶當(dāng)周的話量。
最終,我們將獲取一段時(shí)間業(yè)務(wù)穩(wěn)定的話務(wù)數(shù)據(jù),之后進(jìn)行了異常數(shù)據(jù)的剔除并在加入了未來活動(dòng)、節(jié)假日的考慮后得到了想要的基礎(chǔ)數(shù)據(jù)。
1、 將這些基礎(chǔ)數(shù)據(jù)按周維度統(tǒng)計(jì)后可以看到業(yè)務(wù)的話量在周中是存在遞減或遞增的趨勢,同樣可以將遞增或遞減的趨勢與當(dāng)周的話量進(jìn)行計(jì)算來得到未來一周的話量。
2、將選取的歷史數(shù)據(jù)按照星期維度再進(jìn)行統(tǒng)計(jì)可以得到一周內(nèi)每天的話量比例,即星期占比,用預(yù)測出的未來一周的話量與星期占比相乘可以計(jì)算出未來一周每天的話務(wù)量。
3、將選擇的歷史數(shù)據(jù)以時(shí)段的形式進(jìn)行統(tǒng)計(jì),這樣可以得到星期一至星期日每個(gè)時(shí)段的話量數(shù)據(jù),將每個(gè)時(shí)段的話量與全天總量相除就可以得到歷史星期一至星期日每個(gè)時(shí)段的時(shí)段話量占比。
4、最終將我們計(jì)算出的未來一周每日的話務(wù)量與每天的時(shí)段占比相乘,就可以得出最終預(yù)測的每天每時(shí)段的話量數(shù)據(jù)。
預(yù)測的終點(diǎn)其實(shí)并不是100%契合實(shí)際話量,話量是自然發(fā)生的事情,任何人都無法做到預(yù)測與實(shí)際完全一致,我們能做到的是不斷收集數(shù)據(jù)并分析問題,在未來的預(yù)測中盡可能全面地考慮未來的影響因素,這樣即使無法與實(shí)際相同,但也不至于出現(xiàn)重大的預(yù)測錯(cuò)誤。
隨著我們工作經(jīng)驗(yàn)的增加和預(yù)測水平的提升,終會(huì)有一天,我們可以完全地掌握未來話務(wù)所發(fā)生的所有因素,到時(shí)候,預(yù)測的準(zhǔn)確度自然會(huì)得到提升。