數(shù)據(jù)分析該如何與算法合作,是個(gè)老大難問題。一方面是業(yè)務(wù)方日益提高的,對模型的幻想。另一方面是大量企業(yè)里存在的,數(shù)據(jù)采集差,缺少足夠數(shù)據(jù)人員,工作目標(biāo)不清晰等等問題。到底該如何和分析與算法協(xié)同增效?今天系統(tǒng)分享一下。
01兩種典型的錯(cuò)誤做法
狗不理式:有些公司領(lǐng)導(dǎo)喜歡嫌棄自家數(shù)據(jù)分析師沒本事,總認(rèn)為“上個(gè)模型才牛逼”。于是數(shù)據(jù)分析師們皆明哲保身,干脆和所有帶“模型”倆字的工作劃清界限,統(tǒng)統(tǒng)甩給算法工程師。
這么干,當(dāng)然會坑死算法。
且不說,很多時(shí)候領(lǐng)導(dǎo)口中的模型根本就是“SWOT”一類虛無縹緲的東西;
且不說,很多建模目標(biāo)根本就是:“預(yù)測我做什么能成功”一類不切實(shí)際的東西。
就單單基礎(chǔ)特征篩選工作沒人支持一項(xiàng),就會讓算法工程師累死。項(xiàng)目進(jìn)度慢,最后還是被嫌棄:“為啥你的模型不能100%精準(zhǔn)預(yù)測?。?!”
當(dāng)然,此類問題常見于傳統(tǒng)企業(yè)。特別是數(shù)字化轉(zhuǎn)型階段,領(lǐng)導(dǎo)們看了很多高大上的ppt,自以為自己很懂的傳統(tǒng)企業(yè)。
當(dāng)狗用式:一些互聯(lián)網(wǎng)公司對于算法的應(yīng)用有相對清晰的定位,算法小組的地位也較高。于是走向另一極端:把配給算法組的分析師當(dāng)狗使。做啥你不用管,你按我說的取數(shù)就好了。用無休無止的取數(shù)表淹沒了數(shù)據(jù)分析的工作。
這么干,坑的是所有人。因?yàn)檫B數(shù)據(jù)分析師都不懂算法邏輯,那運(yùn)營部門更不懂。在茫然無知的情況下,運(yùn)營部門只能通過簡單的數(shù)據(jù)指標(biāo)監(jiān)控,來推測算法效果。并且稍有風(fēng)吹草動,就開始質(zhì)疑:“算法不靈了吧!”,“你們悄悄改了啥!”,“就是你們瞎搞!”這些質(zhì)疑,又會成為部門間甩鍋、扯皮的導(dǎo)火索,引發(fā)無休無止的內(nèi)耗。
02破局的基本思路
從本質(zhì)上看,分析和算法,都是數(shù)據(jù)的應(yīng)用。那么靈魂拷問來了:是不是有了數(shù)據(jù),鈔票就源源不斷從電腦里噴出來了?顯然不是!數(shù)據(jù)本身不能包治百病,想讓數(shù)據(jù)發(fā)揮作用,得緊密結(jié)合業(yè)務(wù)實(shí)際,找好數(shù)據(jù)能幫上忙的發(fā)力點(diǎn)才行。
而業(yè)務(wù)的實(shí)際情況又很復(fù)雜,經(jīng)常是數(shù)據(jù)和業(yè)務(wù)行為交織在一起。
比如:
短視頻DAU下降,是算法推薦不給力,還是創(chuàng)作者本身質(zhì)量太差
交易轉(zhuǎn)化率下降,是商品推薦不給力,還是貨源本身沒有選好
業(yè)績預(yù)測不精準(zhǔn),是預(yù)測模型不給力,還是業(yè)務(wù)自己放水了
這時(shí)候,業(yè)務(wù)部門永遠(yuǎn)可以甩鍋:“我們的數(shù)據(jù)太無能,我們要是有字節(jié)的算法就牛逼了”。而數(shù)據(jù)這邊,不管是算法還是分析,都是背鍋的。所以最終的破局思路,是數(shù)據(jù)的同學(xué)們團(tuán)結(jié)一致,找好場景,做出成績,減少背鍋,而不是自己人踩自己人。
空口說顯得太空洞,下邊結(jié)合一個(gè)具體問題場景看看。
03典型合作場景之一:項(xiàng)目立項(xiàng)
問題場景:某大型制造企業(yè),期望建立“多維度立體式分析模型”,提升招聘效率。問,此時(shí)該怎么接需求?
這是個(gè)典型的需求不清晰場景。
什么叫:招聘效率?
招聘成本更低?招聘回來以后留存更好?招聘到合適的人?
什么叫合適的人?是否已經(jīng)有清晰定義?
流水線工人、銷售、營銷策劃、管理人員的“合適”定義是否一致?
流水線工人、銷售、營銷策劃、管理人員的招聘問題是否相同?
以上情況統(tǒng)統(tǒng)不清楚
因此無論是算法/分析,誰接需求,都得先問清上邊的問題。當(dāng)然,在問題定義都模糊不清的時(shí)候,讓數(shù)據(jù)分析師站出來溝通更合適。數(shù)據(jù)分析師和業(yè)務(wù)貼的更近,更容易理解業(yè)務(wù)語言,引導(dǎo)業(yè)務(wù)思路。
業(yè)務(wù)方進(jìn)一步給出的回答是:
1、要幫助管理崗位招到更合適的人
2、要發(fā)現(xiàn):XX省市的流水線工人更容易招,我們集中招聘
3、要讓整個(gè)部門的用人成本,控制在XXX萬元以內(nèi)
那么,是不是可開始建“多維度”“立體式”的模型了呢?
不!遠(yuǎn)遠(yuǎn)不到!
04典型合作場景之二:任務(wù)分解
有三大問題,制約著項(xiàng)目推進(jìn):
1、管理崗位的“合適”定義不清晰。管理人員的考核,遠(yuǎn)比流水線工人復(fù)雜。流水線工人只要考察年齡、身份證、學(xué)歷幾個(gè)簡單維度即可,考操作技巧也能通過標(biāo)準(zhǔn)化作業(yè)考核。管理人員則復(fù)雜的多,還有“領(lǐng)導(dǎo)看他順不順眼”這種高度個(gè)性化、無法量化的考核點(diǎn)。因此不能簡單的止步在這里。需要進(jìn)一步定義。
2、各省市勞動力數(shù)據(jù)缺失。注意:從現(xiàn)在HR收到的簡歷里篩選出合適的,和從茫茫人海里鎖定哪里的勞動力多,完全是兩個(gè)問題。因?yàn)橐呀?jīng)收到的可以統(tǒng)計(jì)數(shù)據(jù),茫茫人海壓根連數(shù)據(jù)都沒有。如果盲目開工,很有可能引發(fā)誤判。
3、整體部門用人成本與招聘效率,根本就是兩個(gè)問題。整個(gè)部門用人成本,除了新招聘以外,還有在職工資福利,還有離職人員賠償?shù)鹊取H绻繕?biāo)是控部門整體成本,那到底哪一塊總量最高,哪一塊占比最大,哪一塊是冗余,哪一塊增長最快,要提前一一分析清楚。再看怎么解決。
此時(shí),可以拆出至少五個(gè)任務(wù)
任務(wù)1:定義管理崗位的“合適”(可能為了定義合適,要單獨(dú)建個(gè)業(yè)務(wù)模型,比如勝任力模型)。
任務(wù)2:基于過往面試數(shù)據(jù),為管理崗位“合適”做標(biāo)注,為建模做準(zhǔn)備。
任務(wù)3:收集各地區(qū)勞動力市場數(shù)據(jù)(勞動力市場發(fā)布信息、中介提供信息等)。
任務(wù)4:結(jié)合過往招聘活動,驗(yàn)證分地區(qū)招聘合理性(也有可能求職者雖然是內(nèi)地省份的人,但是找工作還是跑到沿海省份找,分地區(qū)意義沒那么大,這些假設(shè)都待驗(yàn)證)。
任務(wù)5:分析整體用人成本結(jié)構(gòu)與走勢,找到成本控制關(guān)鍵點(diǎn)。
這五個(gè)任務(wù),主要都是數(shù)據(jù)分析的活。數(shù)據(jù)分析理清現(xiàn)狀,采集數(shù)據(jù),后邊算法就能有的放矢。比如:
1、在已有管理崗位“合適/不合適”標(biāo)注的情況下,結(jié)合簡歷信息、獵頭給到信息、招聘渠道信息,對面試人員建分類預(yù)測的模型(邏輯回歸/決策樹),預(yù)測“合適”概率
2、在已經(jīng)有整體用人成本結(jié)構(gòu)、增長原因、發(fā)展趨勢數(shù)據(jù)情況下,建預(yù)測模型(時(shí)間序列/多元回歸)判斷用人成本是否會超出預(yù)期,從而干預(yù)決策(不要因?yàn)槎唐谌比司痛罅空衅?,對比給加班費(fèi)和增加新人成本差異)。
當(dāng)然,還有第三個(gè)合作點(diǎn):在工作中遭遇挑戰(zhàn),大家一起應(yīng)對。
05典型合作場景之三:問題解答
面對“模型為什么不準(zhǔn)!”終極問題,一定是所有人一起努力。首先要排除的,是外部因素、意外波動、業(yè)務(wù)主動行為的影響。不要是個(gè)問題就往模型身上潑臟水。
比如:
突然有高管變動,引發(fā)管理層招聘要求全變
招工來源地發(fā)生疫情,人員出不來
行業(yè)領(lǐng)頭企業(yè)突然提高了薪資,拉高了整個(gè)行業(yè)成本
原定的招聘計(jì)劃因?yàn)楦鞣N原因推遲
原定招聘計(jì)劃,沒有達(dá)成預(yù)期,要加新渠道/新方式
所有這些因素都會讓原先設(shè)計(jì)的模型不成立或者效果下降。應(yīng)對這些變化,數(shù)據(jù)分析要沖在前邊,在日常監(jiān)控?cái)?shù)據(jù)的時(shí)候,就及早發(fā)現(xiàn)問題,提示業(yè)務(wù)風(fēng)險(xiǎn),提醒所有人關(guān)注變化。而不是等著業(yè)務(wù)打上門來再來扯皮。
06小結(jié)
算法和分析的工作性質(zhì)差異,使得這兩者合作分工的時(shí)候,天生側(cè)重點(diǎn)不同。理想的合作方式,就是:分析掃清業(yè)務(wù)障礙,算法集中提升效率。大家一起做出成績。
實(shí)際上,如果你工作時(shí)間夠久,和業(yè)務(wù)接觸的夠多,就會發(fā)現(xiàn):大部分直接從業(yè)務(wù)口中冒出來的“建模型”需求,都不靠譜,不是數(shù)據(jù)缺失,就是目標(biāo)不清。別是涉及預(yù)測問題的時(shí)候(分類問題相對好一點(diǎn))。經(jīng)過數(shù)據(jù)分析師轉(zhuǎn)化的需求,反而靠譜很多。
本文來自微信公眾號 “接地氣學(xué)堂”(ID:gh_ff21afe83da7),作者:接地氣的陳老師,36氪經(jīng)授權(quán)發(fā)布。
- 濕地之美|廣州海珠濕地
- (熱點(diǎn)觀察 漫評)美國對歐洲盟友“下狠手”
- 全球微動態(tài)丨德媒文章:政治極化愈演愈烈,美國民主面臨墮落
- 每日觀察!海河觀津丨百萬候鳥來“息”,它們?yōu)楹纹珢郾贝蟾郏?/a>
- 焦點(diǎn)!一起來拍中國空間站!
- 焦點(diǎn)播報(bào):北京新增本土感染者16例 詳情公布
- 天天快看點(diǎn)丨遼寧匯聚高校校友資源 引青年人才在遼創(chuàng)新創(chuàng)業(yè)
- 每日熱文:夢天成功發(fā)射!天空飄來一個(gè)字:6
- 環(huán)球最資訊丨長圖丨“院士天團(tuán)”做優(yōu)“湖南飯”,該是什么味?
- 常益懷等5市州明早有大霧 出行請注意安全
- 環(huán)球動態(tài):11月全省溫高干旱持續(xù)發(fā)展
- 【全球獨(dú)家】10月制造業(yè)PMI為49.2% 建筑業(yè)景氣水平較高
- 環(huán)球今日訊!亞馬遜營業(yè)利潤率下降至2% 國內(nèi)頭部電商或進(jìn)一步搶占海外市場
- 國家藥監(jiān)局:促進(jìn)彩色隱形眼鏡生產(chǎn)經(jīng)營企業(yè)規(guī)范化發(fā)展
- 即時(shí)焦點(diǎn):智慧芽升級科創(chuàng)力評估平臺 累計(jì)上線12條產(chǎn)業(yè)技術(shù)鏈
- 【世界熱聞】內(nèi)蒙古啟動人力資源誠信服務(wù)示范機(jī)構(gòu)評選
- 環(huán)球觀焦點(diǎn):內(nèi)蒙古:這5項(xiàng)職業(yè)資格考試暫停
- 全球熱門:飛天圓夢|靜待夢天,中國空間站在軌建造收官在即
- 飛天圓夢|“夢天”已就位!楊利偉動情講述“初代”航天人故事
- 對標(biāo)保時(shí)捷Taycan?大眾中國功勛蘇偉銘親自下場造車
- 北京石景山開展冬季供暖前特種設(shè)備安全專項(xiàng)檢查
- 陜西延安:開展兒童化妝品專項(xiàng)檢查 規(guī)范化妝品市
- 北京海淀開展商品條碼專項(xiàng)監(jiān)督檢查 努力打造穩(wěn)定
- 金華推進(jìn)網(wǎng)絡(luò)直播營銷治理顯成效 培育放心消費(fèi)直
- 北京延慶對重點(diǎn)行業(yè)開展格式條款專項(xiàng)檢查 做好市
- 北京海淀開展電動自行車整治夜查行動 全力保障轄
- 江蘇昆山全力規(guī)范大閘蟹市場秩序 營造安全放心消
- 福建寧化開展“兩品一械”網(wǎng)絡(luò)銷售專項(xiàng)檢查 保障
- 北京懷柔:開展市場綜合執(zhí)法監(jiān)督檢查 督導(dǎo)各類經(jīng)
- 天津河?xùn)|:多措并舉推進(jìn)企業(yè)信用修復(fù)工作 助力轄