【粉丝福利】赠《机器学习算法竞赛实战》10 本书
隨著互聯(lián)網(wǎng)時(shí)代的到來(lái),以及計(jì)算機(jī)硬件性能的提升,人工智能在近幾年可以說(shuō)是得到了爆發(fā)式的增長(zhǎng)。互聯(lián)網(wǎng)時(shí)代帶來(lái)了大量的信息,這些信息是名副其實(shí)的大數(shù)據(jù)。另外,性能極佳的硬件也使得計(jì)算機(jī)的計(jì)算能力大大增強(qiáng),這二者結(jié)合到一起,人工智能的蓬勃興盛就變成了自然而然的事情。機(jī)器學(xué)習(xí)作為一種傳統(tǒng)的、可解釋性較強(qiáng)的算法,在人工智能三駕馬車(chē)之算法中也占有一席之地。
一本《機(jī)器學(xué)習(xí)算法競(jìng)賽實(shí)戰(zhàn)》應(yīng)運(yùn)而生,意在幫助機(jī)器學(xué)習(xí)初學(xué)者通過(guò)實(shí)戰(zhàn)的方法從雖然優(yōu)美但是略顯枯燥的各種公式和理論當(dāng)中脫離出來(lái),感受機(jī)器學(xué)習(xí)在實(shí)際應(yīng)用中的奧秘,而競(jìng)賽則是一種最特殊的實(shí)戰(zhàn)。
算法競(jìng)賽時(shí)代
2010 年,全球著名算法競(jìng)賽平臺(tái) Kaggle 舉辦了第一場(chǎng)競(jìng)賽 Forecast Eurovision Voting,獎(jiǎng)金為 1000 美元。
2015 年,國(guó)內(nèi)第一場(chǎng)算法競(jìng)賽在天池舉辦,比賽題目是阿里移動(dòng)推薦算法,獎(jiǎng)金為 30 萬(wàn)元人民幣,吸引了 7000 多人參加。雖然國(guó)內(nèi)的算法競(jìng)賽起步時(shí)間晚于國(guó)外,但從 2015 年開(kāi)始,在全球舉辦的一共 1000 多場(chǎng)賽事中,中國(guó)就舉辦了 400 多場(chǎng),并且場(chǎng)次的年均增長(zhǎng)率高達(dá) 108.8%,累計(jì)有超過(guò) 120 萬(wàn)人參加,獎(jiǎng)金累計(jì)達(dá)到 2.8 億元人民幣。在算法競(jìng)賽的舉辦場(chǎng)次擁有如此高增長(zhǎng)率的情況下,其技術(shù)價(jià)值、業(yè)務(wù)價(jià)值和創(chuàng)新價(jià)值自然不容小覷。
對(duì)于有志于進(jìn)軍機(jī)器學(xué)習(xí)相關(guān)領(lǐng)域從事研究或者相關(guān)工作的初學(xué)者來(lái)說(shuō),競(jìng)賽是性?xún)r(jià)比極高的一個(gè)實(shí)戰(zhàn)選擇,可以說(shuō)是零門(mén)檻,任何人都能參加。
易于學(xué)習(xí)的競(jìng)賽寶典
對(duì)于想?yún)⒓訖C(jī)器學(xué)習(xí)競(jìng)賽的初學(xué)者來(lái)說(shuō),一本內(nèi)容友好的圖書(shū)極其重要,可以少走很多彎路。這本《機(jī)器學(xué)習(xí)算法競(jìng)賽實(shí)戰(zhàn)》合理地規(guī)劃了章節(jié)架構(gòu),作者們除了仔細(xì)的討論外,還采納了國(guó)內(nèi)多名頂尖競(jìng)賽選手的建議,深入剖析算法的本質(zhì)內(nèi)容,還結(jié)合多個(gè)領(lǐng)域模塊進(jìn)行了實(shí)戰(zhàn)講解。全書(shū)分為五個(gè)部分,作者還給每部分都取了一個(gè)名字。
PART.
01
磨刀事半,砍柴功倍
第一部分以算法競(jìng)賽的通用化流程為主,介紹競(jìng)賽中各個(gè)部分的核心內(nèi)容和具體工作,且每章都配有具體的實(shí)戰(zhàn)部分,以便加深理解。
PART.
02
物以類(lèi)聚,人以群分
第二部分主要介紹用戶(hù)畫(huà)像相關(guān)的問(wèn)題,構(gòu)建完善的標(biāo)簽體系是用戶(hù)畫(huà)像的核心,也是解決用戶(hù)畫(huà)像類(lèi)賽題的關(guān)鍵,比如個(gè)性化推薦和金融風(fēng)控等問(wèn)題都需要以用戶(hù)畫(huà)像作為支撐。為了幫助讀者加快對(duì)此類(lèi)競(jìng)賽問(wèn)題的學(xué)習(xí)、理解,會(huì)講解具體的競(jìng)賽案例,即 Kaggle 平臺(tái)的 Elo Merchant Category Recommendation。
(題目背景:想象一下,當(dāng)你在一個(gè)不熟悉的地方餓著肚子想要找好吃的東西時(shí),你是不是會(huì)得到基于你的個(gè)人喜好而被專(zhuān)屬推薦的餐館,且該推薦還附帶著你的信用卡提供商為你提供的附近餐館的折扣信息。
目前,巴西最大的支付品牌之一 Elo 已經(jīng)與商家建立了合作關(guān)系,以便向顧客提供促銷(xiāo)或折扣活動(dòng)。但這些促銷(xiāo)活動(dòng)對(duì)顧客和商家都有益嗎?顧客喜歡他們的活動(dòng)體驗(yàn)嗎?商家能夠看到重復(fù)交易嗎?要回答這些問(wèn)題,個(gè)性化是關(guān)鍵。
Elo 建立了機(jī)器學(xué)習(xí)模型,以了解顧客生命周期中從食品到購(gòu)物等最重要方面的偏好。但到目前為止,那些學(xué)習(xí)模型都不是專(zhuān)門(mén)為個(gè)人或個(gè)人資料量身定做的,這也就是這場(chǎng)競(jìng)賽舉辦的原因。
在這場(chǎng)競(jìng)賽中,需要參賽者開(kāi)發(fā)算法,通過(guò)發(fā)現(xiàn)顧客忠誠(chéng)度的信號(hào),識(shí)別并為個(gè)人提供最相關(guān)的機(jī)會(huì)。你的意見(jiàn)將改善顧客的生活,幫助 Elo 減少不必要的活動(dòng),為顧客創(chuàng)造精準(zhǔn)正確的體驗(yàn)。)
PART.
03
以史為鑒,未來(lái)可期
第三部分以時(shí)間序列預(yù)測(cè)問(wèn)題為主,先講述這類(lèi)問(wèn)題的常見(jiàn)解題思路和技巧,然后分析兩個(gè)具體的實(shí)戰(zhàn)案例,分別是天池平臺(tái)的全球城市計(jì)算 AI 挑戰(zhàn)賽和Kaggle 平臺(tái)的Corporación Favorita Grocery Sales Forecasting。
(題目背景:在實(shí)體雜貨店里,銷(xiāo)量預(yù)測(cè)和顧客采購(gòu)量之間的關(guān)系總是很微妙。如果銷(xiāo)量預(yù)測(cè)得多,而顧客采購(gòu)得少,那么雜貨店的商品就會(huì)積壓過(guò)多,尤其對(duì)易腐商品的影響較大;如果銷(xiāo)量預(yù)測(cè)較少,而顧客采購(gòu)量較大,那么商品很快就會(huì)賣(mài)光,短時(shí)間內(nèi)顧客的體驗(yàn)會(huì)變差。?
隨著零售商不斷增加新地點(diǎn)、新產(chǎn)品,以及季節(jié)性口味的變化多樣和產(chǎn)品營(yíng)銷(xiāo)的不可預(yù)測(cè), 問(wèn)題變得更加復(fù)雜。位于厄瓜多爾的大型雜貨零售商 Corporación Favorita 也非常清楚這點(diǎn),其經(jīng)營(yíng)著數(shù)百家超市,售賣(mài)的商品超過(guò) 20 萬(wàn)種。
于是 Corporación Favorita 向 Kaggle 社區(qū)提出了挑戰(zhàn),要求其建立一個(gè)可以準(zhǔn)確預(yù)測(cè)商品銷(xiāo)量的模型。Corporación Favorita 目前依靠主觀預(yù)測(cè)來(lái)備份數(shù)據(jù),很少通過(guò)自動(dòng)化工具執(zhí)行計(jì)劃, 他們非常期待通過(guò)機(jī)器學(xué)習(xí)實(shí)現(xiàn)在正確的時(shí)間提供足夠正確的商品,來(lái)更好地讓顧客滿(mǎn)意。)
PART.
04
精準(zhǔn)投放,優(yōu)化體驗(yàn)
計(jì)算廣告相關(guān)的業(yè)務(wù)大多是很好的競(jìng)賽題目,第四部分主要介紹了計(jì)算廣告的核心技術(shù)和業(yè)務(wù),包括廣告召回、廣告排序和廣告競(jìng)價(jià)。實(shí)戰(zhàn)案例部分則包括兩道賽題,分別是 2018 騰訊廣告算法大賽——相似人群拓展,以及 Kaggle 平臺(tái)的 TalkingData AdTracking Fraud Detection Challenge。
PART.
05
聽(tīng)你所說(shuō),懂你所寫(xiě)
第五部分基于自然語(yǔ)言處理相關(guān)的內(nèi)容進(jìn)行講解,包括常見(jiàn)任務(wù)和常見(jiàn)技術(shù),實(shí)戰(zhàn)案例部分是 Kaggle 平臺(tái)上的經(jīng)典競(jìng)賽 Quora Question Pairs。
這本書(shū)可以說(shuō)是算法競(jìng)賽領(lǐng)域一本系統(tǒng)性介紹競(jìng)賽的書(shū),不僅包含競(jìng)賽的基本理論知識(shí),還結(jié)合多個(gè)方向和案例詳細(xì)闡述了競(jìng)賽中的上分思路和技巧。
本書(shū)還附贈(zèng)讀書(shū)思維導(dǎo)圖,輕松定位學(xué)習(xí)要點(diǎn)。
本書(shū)特色
1
騰訊廣告算法大賽兩屆冠軍、Kaggle?Grandmaster傾力打造
2
賽題案例來(lái)自 Kaggle、阿里天池、騰訊廣告算法大賽
3
按照問(wèn)題建模、數(shù)據(jù)探索、特征工程、模型訓(xùn)練、模型融合的步驟講解競(jìng)賽流程
適合誰(shuí)讀
對(duì)算法競(jìng)賽感興趣的人。興趣是最大的驅(qū)動(dòng)力,為了讓算法競(jìng)賽變得更加有趣和更加多樣性,本書(shū)增加了很多擴(kuò)展與探索性的內(nèi)容,從多個(gè)方向、多個(gè)領(lǐng)域進(jìn)行介紹和實(shí)戰(zhàn)。
想要研究機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法實(shí)戰(zhàn)的人。實(shí)戰(zhàn)的最佳方式之一是參加一場(chǎng)算法競(jìng)賽,加深對(duì)理論知識(shí)的理解,這也是本書(shū)的核心思想。
計(jì)算機(jī)相關(guān)專(zhuān)業(yè)的人。機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法作為目前計(jì)算機(jī)行業(yè)一個(gè)火熱的就業(yè)方向,值得去深入研究。本書(shū)提供了很好的實(shí)戰(zhàn)講解,幫助讀者知其然,并知其所以然。
《機(jī)器學(xué)習(xí)算法競(jìng)賽實(shí)戰(zhàn)》
王賀 劉鵬 錢(qián)乾 著
本書(shū)是算法競(jìng)賽領(lǐng)域一本系統(tǒng)介紹競(jìng)賽的圖書(shū),書(shū)中不僅包含競(jìng)賽的基本理論知識(shí),還結(jié)合多個(gè)方向和案例詳細(xì)闡述了競(jìng)賽中的上分思路和技巧。
全書(shū)分為五部分:第一部分以算法競(jìng)賽的通用流程為主,介紹競(jìng)賽中各個(gè)部分的核心內(nèi)容和具體工作;第二部分介紹了用戶(hù)畫(huà)像相關(guān)的問(wèn)題;第三部分以時(shí)間序列預(yù)測(cè)問(wèn)題為主,先講述這類(lèi)問(wèn)題的常見(jiàn)解題思路和技巧,然后分析天池平臺(tái)的全球城市計(jì)算 AI 挑戰(zhàn)賽和 Kaggle 平臺(tái)的Corporación Favorita Grocery Sales Forecasting;第四部分主要介紹計(jì)算廣告的核心技術(shù)和業(yè)務(wù),包括廣告召回、廣告排序和廣告競(jìng)價(jià),其中兩個(gè)實(shí)戰(zhàn)案例是 2018 騰訊廣告算法大賽——相似人群拓展和Kaggle 平臺(tái)的TalkingData AdTracking Fraud Detection Challenge;第五部分基于自然語(yǔ)言處理相關(guān)的內(nèi)容進(jìn)行講解,其中實(shí)戰(zhàn)案例是 Kaggle 平臺(tái)上的經(jīng)典競(jìng)賽 Quora Question Pairs。
作者簡(jiǎn)介
王賀(魚(yú)遇雨欲語(yǔ)與余),現(xiàn)任職于小米商業(yè)算法部,從事應(yīng)用商店廣告推薦的研究和開(kāi)發(fā)。從 2018 年至 2020 年多次參加國(guó)內(nèi)外算法競(jìng)賽,共獲得 5 次冠軍和 5 次亞軍,是 2019 年和 2020 年騰訊廣告算法大賽的冠軍。畢業(yè)于武漢大學(xué)計(jì)算機(jī)學(xué)院,碩士學(xué)位,研究方向?yàn)閳D數(shù)據(jù)挖掘。
劉鵬,華為技術(shù)有限公司算法工程師,從事電信運(yùn)營(yíng)商和智能運(yùn)維領(lǐng)域的算法研究和開(kāi)發(fā)工作。2016 年本科畢業(yè)于武漢大學(xué)數(shù)學(xué)基地班,保研至中國(guó)科學(xué)技術(shù)大學(xué)自動(dòng)化系,碩士期間研究方向?yàn)閺?fù)雜網(wǎng)絡(luò)與機(jī)器學(xué)習(xí),2018 年起多次獲得機(jī)器學(xué)習(xí)相關(guān)競(jìng)賽獎(jiǎng)項(xiàng)。
錢(qián)乾,數(shù)程科技大數(shù)據(jù)技術(shù)負(fù)責(zé)人,工作方向?yàn)槲锪黝I(lǐng)域的智能算法應(yīng)用。本科就讀于美國(guó)佐治亞理工大學(xué),研究方向包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語(yǔ)言處理等。
目錄搶先看
(向右劃動(dòng)查看)
贈(zèng)書(shū)福利
你對(duì) Kaggle 感興趣嗎?
歡迎與我們分享
王的機(jī)器將選出十名優(yōu)質(zhì)留言
攜手【圖靈教育】送出
《機(jī)器學(xué)習(xí)算法競(jìng)賽實(shí)戰(zhàn)》一本
截止 2021 年 9 月 25 日晚上 20:00
?? 京東購(gòu)買(mǎi)
總結(jié)
以上是生活随笔為你收集整理的【粉丝福利】赠《机器学习算法竞赛实战》10 本书的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 抖音二面:为什么模块循环依赖不会死循环?
- 下一篇: second life 新手必读 原文h