首頁(yè)>資訊 >
大數(shù)據(jù)殺熟仍未絕跡,工程師:公開(kāi)“黑盒”算法幾乎不可能 2021-11-26 19:52:15  來(lái)源:36氪

“電視里放著關(guān)于故宮的紀(jì)錄片,打開(kāi)手機(jī)電商App首頁(yè)就被推送大量文創(chuàng)類(lèi)商品?!毕矚g看歷史節(jié)目的云云(化名)說(shuō)道?!笆謾C(jī)‘偷聽(tīng)’+算法推薦”似乎已經(jīng)成為網(wǎng)民們見(jiàn)怪不怪的平常事,“比你自己更了解你”的各種互聯(lián)網(wǎng)應(yīng)用在消費(fèi)端變幻出五花八門(mén)的玩法,只為滿(mǎn)足你的所謂“需求”。

近日,上海制定發(fā)布的《上海市網(wǎng)絡(luò)交易平臺(tái)網(wǎng)絡(luò)營(yíng)銷(xiāo)活動(dòng)算法應(yīng)用指引(試行)》(以下簡(jiǎn)稱(chēng)《指引》)提出了多種存在風(fēng)險(xiǎn)的網(wǎng)絡(luò)營(yíng)銷(xiāo)活動(dòng)算法應(yīng)用方式,包含了數(shù)據(jù)處理、參數(shù)設(shè)置、消費(fèi)者畫(huà)像、差別待遇、信息推送或商業(yè)營(yíng)銷(xiāo)等。

同時(shí),《指引》也提出了相關(guān)合規(guī)管理建議,其中“鼓勵(lì)平臺(tái)經(jīng)營(yíng)者通過(guò)公開(kāi)算法原理、目的意圖、決策規(guī)則、可能產(chǎn)生的影響等信息,提供算法應(yīng)用結(jié)果解釋等方式提升公眾對(duì)算法應(yīng)用的理解”值得關(guān)注。

01 價(jià)格“私人定制”

“大數(shù)據(jù)殺熟”一詞進(jìn)入大眾的視野可以追溯到2018年,成為當(dāng)時(shí)年度社會(huì)生活類(lèi)十大流行語(yǔ)之一。

“大數(shù)據(jù)殺熟”的主要表現(xiàn)形式在于“不同人不同價(jià)”。北京市消協(xié)曾發(fā)布的“大數(shù)據(jù)殺熟”問(wèn)題調(diào)查結(jié)果顯示,88.32%的被調(diào)查者認(rèn)為“大數(shù)據(jù)殺熟”現(xiàn)象普遍或很普遍,沒(méi)有被調(diào)查者認(rèn)為“大數(shù)據(jù)殺熟”現(xiàn)象不存在。此外,還有56.92%的被調(diào)查者表示有過(guò)被“大數(shù)據(jù)殺熟”的經(jīng)歷,而網(wǎng)購(gòu)平臺(tái)、在線旅游、網(wǎng)約車(chē)類(lèi)移動(dòng)客戶(hù)端或網(wǎng)站是“重災(zāi)區(qū)”。

圖源:北京市消協(xié)

《IT時(shí)報(bào)》記者在黑貓投訴平臺(tái)輸入“大數(shù)據(jù)殺熟”,一共出現(xiàn)了1882條投訴信息,排在前10條的幾乎都和2021年“雙11”有關(guān)?!氨救嗽谀成坛穷I(lǐng)取優(yōu)惠券購(gòu)買(mǎi)商品最終價(jià)格1349元,而用另一個(gè)不常用的賬號(hào)領(lǐng)取相同優(yōu)惠券,最終價(jià)格1249元。主號(hào)和不常用的號(hào)最終價(jià)格相差100元”;“原價(jià)3.8元的坐墊,從購(gòu)物平臺(tái)的簽到頻道進(jìn)去購(gòu)買(mǎi),同一個(gè)店鋪的同一款商品變成5.8元”。

比起價(jià)格上的顯性差異,有些“大數(shù)據(jù)殺熟”則是潛移默化的?!耙?yàn)椤髷?shù)據(jù)殺熟’,所以我一直不買(mǎi)某自營(yíng)生鮮平臺(tái)的會(huì)員?!奔渭危ɑ└嬖V記者,“正因?yàn)槲也皇菚?huì)員,所以經(jīng)??梢允盏狡脚_(tái)給我發(fā)放的大額優(yōu)惠券,比如‘99減50’‘199減100’等。而我的同事辦了會(huì)員之后就收不到這類(lèi)優(yōu)惠券了,大多是會(huì)員每月領(lǐng)取的‘79減5’‘109減7’之類(lèi)。不過(guò),由于我使用次數(shù)增多,現(xiàn)在這種大額優(yōu)惠券也很少收到了?!?/p>

中南財(cái)經(jīng)政法大學(xué)數(shù)字經(jīng)濟(jì)研究院執(zhí)行院長(zhǎng)、教授盤(pán)和林在接受記者采訪時(shí)指出:“‘大數(shù)據(jù)殺熟’是互聯(lián)網(wǎng)平臺(tái)收集特定用戶(hù)的信息,對(duì)用戶(hù)進(jìn)行畫(huà)像。比如如果你經(jīng)常買(mǎi)奶粉,系統(tǒng)就給你貼上一個(gè)‘?huà)寢尅臉?biāo)簽;如果你經(jīng)常買(mǎi)貴的奶粉,系統(tǒng)就給你貼上一個(gè)‘購(gòu)買(mǎi)力強(qiáng)’的標(biāo)簽;如果算法判定你的價(jià)格敏感度低,算法就推送較高的報(bào)價(jià),從而抬高產(chǎn)品售價(jià)。這里的關(guān)鍵是精準(zhǔn)性,也就是‘大數(shù)據(jù)殺熟’必須是算法針對(duì)個(gè)人做出的精準(zhǔn)報(bào)價(jià),其前提是算法通過(guò)個(gè)人用戶(hù)的數(shù)據(jù)收集而完成對(duì)個(gè)人用戶(hù)的定位?!?/p>

對(duì)此,《IT時(shí)報(bào)》記者測(cè)試同時(shí)在某網(wǎng)購(gòu)平臺(tái)搜索“兒童鞋”,并按照價(jià)格升序排列。相比之下,年輕媽媽因?yàn)榻?jīng)常搜索兒童類(lèi)產(chǎn)品,所以最低價(jià)格的鞋子為33元;而另一位記者從未搜過(guò)兒童類(lèi)產(chǎn)品,最低價(jià)為21元,相差12元。隨后兩位記者又用“兒童舞蹈裙”關(guān)鍵詞進(jìn)行了測(cè)試,得到了類(lèi)似的結(jié)果,年輕媽媽得到的推薦商品更貴。

左為從未搜過(guò)兒童產(chǎn)品的用戶(hù),右為經(jīng)常搜索兒童產(chǎn)品的年輕媽媽

02 “不能說(shuō)的秘密”

“大數(shù)據(jù)殺熟”的前提是通過(guò)各種渠道收集用戶(hù)數(shù)據(jù),而技術(shù)的成熟,使得算法在互聯(lián)網(wǎng)行業(yè)大規(guī)模應(yīng)用成為現(xiàn)實(shí)。

算法工程師阿石(化名)在一次算法研討會(huì)上提及:“有一次客戶(hù)提出想讓我們提高部分用戶(hù)對(duì)曾經(jīng)購(gòu)買(mǎi)過(guò)產(chǎn)品的回購(gòu)次數(shù),如口紅、酒等??蛻?hù)提供用戶(hù)的相關(guān)數(shù)據(jù),讓我們定位用戶(hù)信息,給用戶(hù)做合適的推送。針對(duì)這樣的要求,我們的團(tuán)隊(duì)就要考慮這樣做合不合適,要不要接單?!?/p>

某互聯(lián)網(wǎng)公司軟件測(cè)試工程師阿蔚(化名)告訴《IT時(shí)報(bào)》記者:“很多算法是數(shù)據(jù)互通的,尤其在屬于同一公司產(chǎn)品時(shí)比較明顯。說(shuō)白了就是用戶(hù)被A平臺(tái)搜集的數(shù)據(jù),被B平臺(tái)檢索到,B平臺(tái)也能直接掌握你的喜好、習(xí)慣等,并嘗試精準(zhǔn)推送,采集到的數(shù)據(jù)越多,推送就會(huì)越精準(zhǔn)?!?/p>

對(duì)消費(fèi)者來(lái)說(shuō),他們往往無(wú)法掌握規(guī)則,雖然質(zhì)疑互聯(lián)網(wǎng)平臺(tái)存在“大數(shù)據(jù)殺熟”行為,但又沒(méi)有明確證據(jù)。

《指引》指出,鼓勵(lì)平臺(tái)經(jīng)營(yíng)者提供算法應(yīng)用結(jié)果解釋等方式提升公眾對(duì)算法應(yīng)用的理解。對(duì)于算法公開(kāi),算法從業(yè)者阿林(化名)告訴《IT時(shí)報(bào)》記者:“算法分為‘白盒’與‘黑盒’?!缀小惴ū容^直接,程序員編寫(xiě)程序代碼后能夠知道輸出的結(jié)果。而‘黑盒’算法則根據(jù)獲得的數(shù)據(jù)自動(dòng)升級(jí),數(shù)據(jù)越多升級(jí)越快,一直都處于更改狀態(tài),而最后輸出的結(jié)果程序員自己也不清楚,也不可控。相比之下,‘黑盒’算法運(yùn)用更多,也很難公開(kāi)?!?/p>

盤(pán)和林表示,對(duì)于平臺(tái)來(lái)說(shuō),一方面擔(dān)憂算法機(jī)制泄露降低自身競(jìng)爭(zhēng)能力,因?yàn)樗惴ü_(kāi)需要大量調(diào)出長(zhǎng)期累積的算法數(shù)據(jù),這也是平臺(tái)技術(shù)能力的一部分;另一方面,平臺(tái)也擔(dān)心算法公開(kāi)后引起爭(zhēng)議,比如某些數(shù)據(jù)在用戶(hù)看來(lái)是很敏感的,由于恐懼隱私泄露,大多數(shù)人會(huì)選擇不要推薦。

03 互聯(lián)網(wǎng)行業(yè)自律的平衡點(diǎn)

“大數(shù)據(jù)殺熟”是由互聯(lián)網(wǎng)平臺(tái)實(shí)施差異化營(yíng)銷(xiāo)導(dǎo)致的。在日常生活中,我們經(jīng)常會(huì)碰到這類(lèi)營(yíng)銷(xiāo)方式。比如點(diǎn)開(kāi)一個(gè)視頻網(wǎng)站,系統(tǒng)根據(jù)用戶(hù)平時(shí)的觀看種類(lèi)、時(shí)長(zhǎng)等推薦一些影片,避免用戶(hù)在海量影庫(kù)中搜索。如果推薦影片正好用戶(hù)喜歡,用戶(hù)就愿意花錢(qián)購(gòu)買(mǎi)。這種差異化營(yíng)銷(xiāo)既使得平臺(tái)營(yíng)收增加,又節(jié)約了用戶(hù)的搜索時(shí)間。

在很長(zhǎng)一段時(shí)間里,社會(huì)和產(chǎn)業(yè)對(duì)“大數(shù)據(jù)殺熟”的定義邊界并沒(méi)有那么清晰。有的時(shí)候用戶(hù)希望獲得相關(guān)推薦;當(dāng)算法推薦損害利益的時(shí)候,用戶(hù)又希望能夠通過(guò)一些手段阻止;更多的時(shí)候,“大數(shù)據(jù)殺熟”是無(wú)形的,用戶(hù)并不確定自己是否正在被殺熟。

上海申倫律師事務(wù)所律師夏海龍?jiān)诮邮苊襟w采訪時(shí)表示:“‘大數(shù)據(jù)殺熟’和差異化營(yíng)銷(xiāo)的真實(shí)關(guān)系是一體兩面,站在企業(yè)的角度是差異化營(yíng)銷(xiāo),站在用戶(hù)的角度就是被殺熟。”

“算法規(guī)則的制定并不是針對(duì)具體的某個(gè)人,但算法在執(zhí)行過(guò)程中可能傷害到了某些人群?!蓖瑵?jì)大學(xué)CIMS研究中心副研究員馬云龍認(rèn)為,“‘大數(shù)據(jù)殺熟’并不是一個(gè)互聯(lián)網(wǎng)化的概念,但是互聯(lián)網(wǎng)平臺(tái)利用它的壟斷地位,掌握大量的用戶(hù)數(shù)據(jù)實(shí)現(xiàn)利益最大化,造成的交易不公平侵害了個(gè)人消費(fèi)者的權(quán)益。這次上海出臺(tái)的《指引》是希望互聯(lián)網(wǎng)行業(yè)能夠從自律的角度去找到一個(gè)平衡點(diǎn)?!?/p>

《指引》更多鼓勵(lì)網(wǎng)絡(luò)交易平臺(tái)經(jīng)營(yíng)者根據(jù)自身業(yè)務(wù)類(lèi)型、規(guī)模大小等,建立相適應(yīng)的算法應(yīng)用合規(guī)管理制度,加強(qiáng)對(duì)算法應(yīng)用的風(fēng)險(xiǎn)防控和隱患排查治理。

電子商務(wù)研究中心主任曹磊也認(rèn)為:“由于數(shù)據(jù)掌握在平臺(tái)手中,對(duì)于數(shù)據(jù)的處理方式外人不得而知,對(duì)于殺熟現(xiàn)象的規(guī)避還要依靠企業(yè)的自覺(jué),只有平臺(tái)正視大數(shù)據(jù)的價(jià)值,對(duì)其進(jìn)行合理的管理與應(yīng)用,才能更好地服務(wù)消費(fèi)者。”

本文來(lái)自微信公眾號(hào)“IT時(shí)報(bào)”(ID:vittimes),作者:江麗雯,編輯:王昕 挨踢妹,36氪經(jīng)授權(quán)發(fā)布。

關(guān)鍵詞: 仍未 算法 工程師

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片