说起来你可能不信,大伙可能都被验证码白嫖过了
只要上網沖過浪的人,基本上就沒有不知道驗證碼這玩意的。這些年來,驗證碼的形式也被玩得越來越花。有不少的網友吐槽,沒有一些知識儲備,連驗證碼都要看不懂了。
差評君的驗證碼成績也并不理想,特別是在遇到滑動式驗證碼這種細致活兒時,就經常因為手抖而前功盡棄。
還有這種高數答題式驗證碼,沒有點數學知識積累的用戶,基本上就只能行法式軍禮就地放棄抵抗了。
面對這些驗證碼的時候,不知道差友們有沒有想過,這種明顯讓用戶體驗不佳的東西,到底有啥存在的意義呢?
其實啊,驗證碼的用處可以用簡單的一句來解釋清楚:區分計算機和真正的人。而這一切要從驗證碼的歷史講起。驗證碼英文叫做“ CAPTCHA ”,這七個大寫的字母是“ Completely Automated Public Turing test to tell Computers and Humans Apart ”這個超長詞組的縮寫,直譯就是“全自動區分計算機和人類的圖靈測試”。
而圖靈測試是人工智能圈一個著名的實驗,實驗者詢問一臺機器和一個人類一些問題,如果實驗者無法分辨他倆的差別,那么這臺機器便通過的圖靈測試。
驗證碼就是這個圖靈測試的反向和變種,用來區分計算機和人類。在 2000年初,互聯網的浪潮剛剛在全世界掀起,當時最讓大伙苦惱的一件事就是垃圾郵件太多了。甚至有一群家伙還特意制作了程序,可以終日無休地大量注冊新郵箱賬號,然后用來發送垃圾推廣郵件。公司封號刪除的速度遠遠趕不上他們注冊的速度,用戶郵箱中的重要郵件也常常被一大波的垃圾郵件所淹沒。
互聯網公司和用戶都深受其苦。一位名叫 Luis 的天才程序員就想到了法子,他發現計算機程序很難認清手寫的文本,而人類可以輕松地看懂。可以在注冊賬號的時候設一道門檻,必須輸入“歪曲”的文本才能完成注冊,用來識別計算機和真人。
驗證碼從此孕育而生,無數的黃牛、垃圾郵件、還有爬蟲程序就這樣被驗證碼擋在了外面。如今,國內外就有許多公司專門為網站提供驗證碼服務,例如為 12306 提供驗證碼的微觸科技、為斗魚和 B 站提供服務的極驗科技,甚至身為互聯網巨頭的谷歌,也同時是世界最大的驗證碼服務提供商。
隨著計算機的識別技術越來強,驗證碼也變得越來越"扭曲",驗證碼的形式和花樣也越來越多。到目前為止,輸驗證碼還是區別人和計算機最有效率的方法。
但也有網友做過計算,全世界的網民一天共要輸入的近 2 億次驗證碼,每次輸入按花費十秒計算,那么人類每天花在驗證碼上的時間已經超過了 50萬小時。。。或許有差友會脫口而出:浪費時間就是浪費生命!驗證碼浪費了人類大量的生命!
球都嘛得,說起來你可能不信,實際上輸入驗證碼的時間并沒有全被浪費,反而每一次輸入驗證碼,你都可能是在為人類的文化事業,或者是為人工智能貢獻著一份力。
還是那個發明了驗證碼的天才 Luis,他發現許多公益組織在把舊書籍掃描成電子版,對計算機來說,那些斑駁的文字太難識別了。
書籍的內容大部分是文本、驗證碼也是文本,把掃描版的書籍文本對接到驗證碼上,讓用戶來識別不就行了?于是乎一個叫做 reCAPTCHA 的新式驗證碼系統誕生了。reCAPTCHA 會提供兩個單詞給用戶來識別。這兩個單詞都是書籍掃描版的一部分。
計算機其實已經知道第一個單詞是啥了,之所以要展示出來,就是為了測試一下你是不是真人。不過第二個單詞計算機暫時還沒能力認出來。面對這第二個單詞,一旦有 10個人輸入了同樣的答案,那么這答案就會被當作是正確答案。靠這種方法,reCAPTCHA 每年能成功數字化 230多萬本舊書。仔細看 reCAPTCHA 驗證碼的右下角,你還能看到正能量滿滿的話語:Stop spam.Read books.
別發垃圾郵件了,去讀些書吧!
除此之外,你輸的驗證碼,還可能成為了人工智能訓練的養料。大伙們肯定遇到過這類街景驗證碼,讓我們選中小轎車、路牌或是自行車等等圖片。在你費眼又費腦地輸入它們的時候,你其實是在為谷歌的人工智能免費打工。
因為這些圖片大都來自于谷歌街景,其中的一部分圖片是 AI 已經識別出來的,用于來識別你是否是真人。和之前的書籍電子化一樣的套路,其中還夾雜了幾張 AI 難以識別的街景,用來白嫖你的勞動力。而這些數據,最后會被用于培訓人工智能。
對于這種空手套白狼的行為,谷歌官方也不藏著掖著,就直接叫告訴大家:你們的免費勞動力,我拿走了!
在各位的“辛勤喂養”之下,運用了谷歌 AI 技術的無人駕駛汽車 Waymo,已經在自動駕駛領域處于遙遙領先的地位,被稱作是世界上最可能最先到 L5 級別(完全自動駕駛)的公司。。。
如今,收購了 reCAPCHA 的谷歌已經把大部分驗證碼都升級成了 reCAPCHA v3。用戶只要點擊一下“我不是機器人”的按鈕,就能輕松通過驗證。但即使是你鼠標的這么輕輕一點,驗證碼還是能從你身上吸點油水。
因為在你點擊按鈕的同時,谷歌會監控你的用戶行為。鼠標的運動軌跡甚至是你打開的網頁都可能被收集,這些數據會被用來判斷你是否是真人,并且幫助驗證碼系統進化。而且目前國外有超過 65 萬個網站用 reCAPCHA v3,每點擊一次驗證按鈕,就等于打卡告訴谷歌你來過這兒,谷歌就會根據你去過的網站來給你推送定制的廣告。。。
而點擊驗證碼的用戶,只不過是在無償地為谷歌提供數據罷了。。。
隨著OCR(光學字符識別)技術和 AI 的發展,驗證碼也在不斷被破解中,過去簡單扭曲一下的字母,可擋不住現在的程序了。但無論驗證碼怎么進化,只要你是真真切切的人,驗證碼這關都不可能真正擋住你。就像 reCAPCHA 一直所倡導的那樣:Tough on bots,Easy on humans(對機器人困難,對人類簡單)。
而你每一次輸入驗證碼,都可能是在為人類文明添磚加瓦,或是在為人工智能的發展貢獻著一份力。
這么一想,是不是感覺自己的鍵鼠都在散發著無私的榮光呢?
圖片、資料來源:
36氪,《41歲的天才數學教授,創造了“驗證碼”和“多鄰國”,身家7億美元》維基百科,reCAPCHA
搜狐科技,《你以為自己在填驗證碼,其實你是在給Google義務勞動》
總結
以上是生活随笔為你收集整理的说起来你可能不信,大伙可能都被验证码白嫖过了的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 芯源微:上半年净利约1.36亿元 同比增
- 下一篇: 神州泰岳:上半年净利润4.04亿元 同比