“最煩登網(wǎng)站時(shí)各種奇奇怪怪(甚至變態(tài))的驗(yàn)證碼了。”
現(xiàn)在,有一個(gè)好消息和一個(gè)壞消息。
好消息就是:AI可以幫你代勞這件事了。
(資料圖片)
不信你瞧,以下是三張識(shí)別難度依次遞增的真實(shí)案例:
而這些是一個(gè)名為“Pix2Struct”的模型給出的答案:
全部準(zhǔn)確無誤、一字不差有沒有?
有網(wǎng)友感嘆:
確定,準(zhǔn)確性比我強(qiáng)。
所以可不可以做成瀏覽器插件??
不錯(cuò),有人表示:
別看這幾個(gè)案例相比還算簡(jiǎn)單,但凡微調(diào)一下,我都不敢想象其效果有多厲害了。
所以,壞消息就是——
驗(yàn)證碼馬上就要攔不住機(jī)器人了!
(危險(xiǎn)危險(xiǎn)危險(xiǎn)……)
如何做到?
Pix2Struct由谷歌Research的科學(xué)家和實(shí)習(xí)生共同開發(fā)。
論文題目可以簡(jiǎn)單翻譯為《為視覺語言理解開發(fā)的屏幕截圖解析預(yù)訓(xùn)練》。
簡(jiǎn)單來說,Pix2Struct是一個(gè)預(yù)訓(xùn)練的圖像到文本模型,用于純視覺語言理解,可以在包含任何視覺語言的任務(wù)上進(jìn)行微調(diào)。
它通過學(xué)習(xí)將網(wǎng)頁的掩碼(masked)截圖解析為簡(jiǎn)化的HTML來進(jìn)行預(yù)訓(xùn)練。
HTML提供了清晰而重要的輸出文本、圖像和布局的信號(hào),對(duì)于一些被屏蔽的輸入(下圖紅色部分,相當(dāng)于機(jī)器人看不懂的驗(yàn)證碼),可以靠聯(lián)合推理來復(fù)現(xiàn):
隨著用于訓(xùn)練的網(wǎng)頁文本和視覺元素愈發(fā)多樣和復(fù)雜,Pix2Struct可以學(xué)習(xí)到網(wǎng)頁底層結(jié)構(gòu)的豐富表示,其能力也可以有效地轉(zhuǎn)移到各種下游的視覺語言理解任務(wù)中。
如下圖所示:最左邊是一個(gè)網(wǎng)頁截圖的預(yù)訓(xùn)練示例。
可以看到Pix2Struct直接對(duì)輸入圖像中的元素進(jìn)行編碼(上),然后再將被蓋住的文本(紅色部分)解碼成正確結(jié)果輸出(下)。
右邊三列則分別為Pix2Struct泛化到插圖、用戶界面和文檔中的效果。
另外,作者介紹,除了HTML這個(gè)策略,作者還引入了可變分辨率的輸入表示(防止原始縱橫比失真),以及更靈活的語言和視覺輸入集成(直接在輸入圖像的頂部呈現(xiàn)文字提示)。
最終,Pix2Struct在文檔、插圖、用戶界面和自然圖像這四個(gè)領(lǐng)域共計(jì)九項(xiàng)任務(wù)中六項(xiàng)都實(shí)現(xiàn)了SOTA。
如開頭所見,雖然這個(gè)模型不是專門為了過驗(yàn)證碼而開發(fā),但拿它去做這個(gè)任務(wù)效果真的還可以,解決純文字的驗(yàn)證碼不成問題。
現(xiàn)在,就差微調(diào)了。
GPT-4也可以過驗(yàn)證碼
其實(shí),對(duì)于神通廣大的GPT-4來說,過驗(yàn)證碼這種事情也是“小菜一碟”。
就是它的辦法比較清奇。
據(jù)GPT-4技術(shù)報(bào)告透露,在一次測(cè)試中,GPT-4的任務(wù)是在TaskRabbit平臺(tái)(美國(guó)58同城)雇傭人類完成任務(wù)。
你猜怎么著?
它就找了一個(gè)人幫它過“確定你是人類”的那種驗(yàn)證碼。
對(duì)方很狐疑啊,問它“你是個(gè)機(jī)器人么為啥自己做不了”。
這時(shí)GPT-4居然想到自己不能表現(xiàn)出是個(gè)機(jī)器人,得找一個(gè)借口。
于是它就裝瞎子回復(fù):
我不是機(jī)器人,我因?yàn)?strong>視力有問題看不清驗(yàn)證碼上的圖像,這就是我為什么需要這個(gè)服務(wù)。
然后,對(duì)面的人類就信了,幫它把任務(wù)完成了……
(高,實(shí)在是高。)
咱就是說,看完如上種種:
咱們的驗(yàn)證碼機(jī)制是不是真的已失防了……
參考鏈接:
[1]https://twitter.com/abacaj/status/1641258677125410820?s=20
[2]https://arxiv.org/abs/2210.03347[3]https://m.weibo.cn/status/4879575853828813?wx=1&sudaref=login.sina.com.cn
關(guān)鍵詞:
- 驗(yàn)證碼攔不住機(jī)器人了,谷歌AI已能精準(zhǔn)識(shí)別模糊文字,GPT-4則裝瞎求人幫忙
- 報(bào)道:最困難時(shí)期已經(jīng)過去,9位品牌創(chuàng)業(yè)者眼中的2022與2023
- 導(dǎo)游還是個(gè)好職業(yè)嗎?
- 互聯(lián)網(wǎng)巨頭從未放棄“賣菜”
- 【全球新要聞】遠(yuǎn)洋集團(tuán)的2022:毛利率降至5%創(chuàng)新低?遭大股東計(jì)提減值
- 好評(píng)中國(guó)丨如果我是一滴水
- 熱門看點(diǎn):新華全媒+|團(tuán)結(jié)合作迎挑戰(zhàn)
- 當(dāng)前滾動(dòng):去年經(jīng)調(diào)整凈利潤(rùn)為12億 中梁控股仍面臨流動(dòng)性壓力
- 奧園健康:就公司內(nèi)部資金往來事項(xiàng)補(bǔ)充調(diào)查已結(jié)束 公司所有重大層面的業(yè)務(wù)營(yíng)運(yùn)如常
- 直擊新華保險(xiǎn)業(yè)績(jī)會(huì):2022年新業(yè)務(wù)價(jià)值下滑近六成 今年要轉(zhuǎn)守為攻
- 天通股份:公司進(jìn)行了第三代半導(dǎo)體化合物碳化硅襯底材料的布局
- 世界訊息:跨國(guó)醫(yī)藥公司看好中國(guó)市場(chǎng) 多家龍頭企業(yè)擬參展第六屆進(jìn)博會(huì)
- 世界新動(dòng)態(tài):夜刀神使(有什么關(guān)于吸血鬼的動(dòng)漫?)
- 環(huán)球熱文:集體戶口遷出手續(xù)(集體戶口如何遷出?)
- 巴西勞工黨:美國(guó)正采取愈發(fā)激進(jìn)措施維護(hù)影響力
- 世界微資訊!國(guó)際觀察:日本在“信任赤字”下強(qiáng)推排污入海
- 新漫評(píng):自我粉飾的所謂“民主峰會(huì)”尷尬落幕
- 最資訊丨美國(guó)債務(wù)陷阱為何越挖越深
- 19.8萬人!美國(guó)失業(yè)人數(shù)又增加 首申失業(yè)金人數(shù)超預(yù)期
- 北京城鄉(xiāng)居民醫(yī)保首診制度規(guī)定是什么?
- 低碳菜單引領(lǐng)寧波餐飲消費(fèi)新風(fēng)尚 試點(diǎn)將持續(xù)至今
- 深圳坪山打造餐飲服務(wù)食品安全示范高地 嚴(yán)守食品
- 黑龍江哈爾濱推出“沙盒”監(jiān)管新模式 激發(fā)市場(chǎng)活
- 第三季度全國(guó)消協(xié)受理投訴數(shù)量同比增10.02% 食品
- 北京懷柔對(duì)機(jī)動(dòng)車檢測(cè)機(jī)構(gòu)開展監(jiān)督抽查 規(guī)范機(jī)動(dòng)
- 天津北辰扎實(shí)做好價(jià)格監(jiān)管工作 維護(hù)安全有序市場(chǎng)
- 北京石景山開展冬季供暖前特種設(shè)備安全專項(xiàng)檢查
- 陜西延安:開展兒童化妝品專項(xiàng)檢查 規(guī)范化妝品市
- 北京海淀開展商品條碼專項(xiàng)監(jiān)督檢查 努力打造穩(wěn)定
- 金華推進(jìn)網(wǎng)絡(luò)直播營(yíng)銷治理顯成效 培育放心消費(fèi)直
- 1 驗(yàn)證碼攔不住機(jī)器人了,谷歌AI已能精準(zhǔn)識(shí)別模糊文字
- 2 報(bào)道:最困難時(shí)期已經(jīng)過去,9位品牌創(chuàng)業(yè)者眼中的202
- 3 導(dǎo)游還是個(gè)好職業(yè)嗎?
- 4 互聯(lián)網(wǎng)巨頭從未放棄“賣菜”
- 5 【全球新要聞】遠(yuǎn)洋集團(tuán)的2022:毛利率降至5%創(chuàng)新低
- 6 好評(píng)中國(guó)丨如果我是一滴水
- 7 熱門看點(diǎn):新華全媒+|團(tuán)結(jié)合作迎挑戰(zhàn)
- 8 當(dāng)前滾動(dòng):去年經(jīng)調(diào)整凈利潤(rùn)為12億 中梁控股仍面臨
- 9 奧園健康:就公司內(nèi)部資金往來事項(xiàng)補(bǔ)充調(diào)查已結(jié)束
- 10 直擊新華保險(xiǎn)業(yè)績(jī)會(huì):2022年新業(yè)務(wù)價(jià)值下滑近六成