搜索,推荐,广告系统架构及算法技术资料大合集吐血整理——2020年终分享
算法學習資料: AI_Tutorial
架構、搜索、推薦、廣告系統優質資源
你還在為學習算法摸不著頭腦么?你還在為技術調研各種Google么?AI的牛b吹不上去?盯緊了,這里就是你的2020女朋友~。本項目會持續關注AI落地的一些優質技術資料。大家也可以去網站投稿。
算法學習資料: AI_Tutorial 記得Star哦~!
后端架構、AI架構、搜索系統、推薦系統、廣告系統技術資料整理。這篇文章意圖是收集市面上質量不錯的后端架構、AI架構、搜索、 推薦、 廣告引擎技術資料,內容來源包括開源項目官網(Lucene、Solr、Elastic)、綜合技術網站(AIQ 、infoQ、Stackoverflow、github 等、國內外知名互聯網公司技術博客(阿里中間件團隊博客、美團技術博客等)、知名技術牛人公眾號博客等。
以下整理的內容大致根據來源進行分類。@AIQ-人工智能
github地址:https://github.com/cbamls/full_stack_coder
個人視角有限,謝謝。
開源相關
Lucene
-
Lucene 官網
-
Lucene 7.6.0源碼
-
Lucene Wiki
-
索引結構 -Lucene6.6.0
Solr
-
Solr 官網
-
Solr Wiki
Elastic
-
Elastic 官網
-
Elastic Blog
-
Elastic Formus
-
Elasticsearch: 權威指南 - 中文版
-
Elastic 中文社區
LucidWorks
-
LucidWorks
-
LucidWorks Blog
中文分詞
-
ansj 分詞
-
HanLP 分詞
-
ES-Analysis-IK
大公司
阿里
-
天貓推薦算法團隊的那些事兒 - 20140401 - infoQ
本文以訪談的方式呈現,對搜索和推薦算法進行了簡單的比較,提到了 AB 測試和離線測試,主要對推薦算法團隊的工作方式、工作考評、任務分配、招聘等進行了介紹。 -
天貓 11.11:搜索引擎實時秒級更新 - 20141111 - infoQ
文章簡單介紹了阿里搜索引擎架構,提到了以下內容:1)為提高數據實時性(庫存、價格等),去掉應用層和業務層的緩存,重點提升引擎層的服務能力。2)排序鏈,根據業務場景定制排序鏈。3)sku 搜索,搜索結果和屬性導航聯動(標類產品)。 -
阿里搜索離線技術團隊負責人談 Hadoop:阿里離線平臺、YARN 和 iStream
-
基于 Apache Flink 的實時計算引擎 Blink 在阿里搜索中的應用 - 20170216 - infoQ
-
阿里開源深度學習框架 XDL,面向廣告、推薦、搜索場景 - 20181128 - AIQ
-
阿里巴巴搜索引擎平臺 Ha3 揭秘 - 201811 - AIQ
阿里搜索事業部技術團隊
阿里集團搜索、推薦、圖像技術的大本營,大數據時代的創新主場。
-
阿里搜索事業部技術團隊
-
OpenSearch:輕松構建大數據搜索服務 - 20160222
-
搜索雙鏈路實時計算體系 @雙 11 實戰 - 20160111
阿里中間件團隊博客
2012 年期間,阿里中間件博客記錄了 20 多篇 Lucene、Solr 相關博文,主要記錄了一些在項目開發過程中遇到的問題,以及部分源碼解讀。內容豐富、實用,但不是很系統。
-
阿里中間件團隊博客
-
Solr 調優參考 - 20120521
-
Solr Lucene 優劣勢分析 - 20120626
-
SolrQuery 性能壓測參考 - 20120731
-
NumericField NumericRangeQuery 原理分析 - 20120731
-
Solr schema 編寫指導 - 20120731
-
關于搜索挖掘所想 - 20120731
-
SolrQuery 挖掘 – 單維度聚合分析 - 20120920
-
我感受到的排序機制參考 - 20120920
-
垂直搜索新問題 - 20120920
-
Solr 平臺化搜索實戰必知場景 - 20120921
-
Solr Schema 配置小細節大問題 - 20121015
-
Solr DisjunctionMax 注解 - 20121015
-
Sql Support within Solr- 類 Sql 的 solr 搜索實現 (1) - 20121015
-
Sql Support within Solr- 類 Sql 的 solr 搜索實現 (2) - 20121015
-
關于 TrieField 的全面認識、理解、運用 - 20121015
-
Solr Facet 引發思考 on the road - 20121029
-
查詢問題 —queryparse 深入理解 - 20121029
-
TermRangeQuery 源碼解析 - 20121106
-
Solr 之緩存篇 - 20121106
-
搜索的測試話題 - 20121113
-
關于搜索夜話 ---- 作為階段序列的告別 - 20121113
-
solr 長文本搜索問題 - 20121210
-
SolrCore2.9.1 源碼分析備忘 - 20121210
百度
- 百度萬億量級數據庫 Tera 架構應用、設計與實踐全攻略 - 20170526 - infoQ
京東
-
京東 618:揭秘大促銷背后的個性化推薦 - 20150618 - infoQ
-
京東 11.11:商品搜索系統架構設計 - 20151111 - infoQ
-
京東 618:機器學習與商品數據挖掘和知識抽取 - 20170618 - infoQ
美團點評
美團點評技術團隊博客
在國內互聯網公司中,個人認為“美團點評技術團隊博客”是最持之以恒的,而且非常干貨。
-
美團點評技術團隊
-
美團 O2O 排序解決方案——線下篇 - 20151207
-
美團O2O排序解決方案——線上篇 - 2015-11-16 17:00
-
美團點評旅游搜索召回策略的演進 - 20170616 - AIQ
攜程
- 攜程技術中心
去哪兒
- 去哪兒網機票搜索系統的高并發架構設計 20170421 - AIQ
搜狗
-
搜狗搜索廣告檢索系統 - 彈性架構演進之路 - 20160111 - infoQ
-
深度學習在搜狗無線搜索廣告中的應用 - 20160808 - infoQ
-
以搜狗為例,談語音輸入如何影響你的生活 - 20161208 - infoQ
一號店
-
1 號店 11.11:分布式搜索引擎的架構實踐 - 20151112 - infoQ
-
1 號店 11.11:機器排序學習在電商搜索中的實戰 - 20161111 - AIQ
-
機器學習在 1 號店商品匹配中的實踐 - 20170506 - 攜程技術中心
待分類
國內
-
當當 11.11:促銷系統與交易系統的重構實踐 - 20151113 - infoQ
-
蘇寧易購 11.11:商品詳情系統架構設計 - 20151227 - infoQ
-
達觀數據 點擊模型:提升算法精度的利器 - 20160315 - infoQ
-
達觀數據 一個可供參考的搜索引擎排序架構實踐案例 - 20160830 - infoQ
-
達觀數據 “搜你所想” 之用戶搜索意圖識別 - 20170608 - AIQ
-
鏈家網 數據驅動在搜索優化與推薦策略中的實踐 - 20170406 - infoQ
-
深度學習在 Airbnb 大規模搜索排名上的實戰經驗 - 20181118 - AIQ
-
51 信用卡的個性化推薦體系 - 2018 - AIQ
-
蘇寧 11.11:搜索引擎 Solr 在蘇寧易購商品評價系統中的應用 - 20181105 - AIQ
國外 -
Twitter 實時檢索 6700 億條推文,細談 Twitter 搜索引擎的演進歷程 - 20160330 - infoQ
-
Yelp 是如何用數據驅動搜索過濾器的? - 20151209 - infoQ
開發應用
理論基礎
-
我愛自然語言處理 推薦
-
漫話中文自動分詞和語義識別
源碼解讀
-
劉超覺先 詳細分析了 Lucene3.x 的源碼,推薦。
-
Anatomy of an Elasticsearch Cluster: Part I
-
Anatomy of an Elasticsearch Cluster: Part II
-
Anatomy of an Elasticsearch Cluster: Part III
常見問題
-
Stackoverflow - Lucene
-
Stackoverflow - Solr
-
Stackoverflow - Elastic
其他
-
對話 Kibana 之父:如果需要,你應該自己動手編寫工具 - 20170111 - infoQ
-
配置高性能 Elasticsearch 集群的 9 個小貼士 - 20170104 - infoQ
-
基于 ElasticStack 的數據探索與分析 - 20161018 - infoQ
-
使用 Akka、Kafka 和 ElasticSearch 等構建分析引擎 - 20160825 - infoQ
-
萬億級日志與行為數據存儲查詢技術剖析 - 20170222 - infoQ
-
谷歌的自然語言部門是啥樣的? - 20160118 - infoQ
-
通過 Baratine 將 Lucene 庫暴露為微服務 - 20160225 - infoQ
人工智能領域文集
算法一些落地的優質資料,都在這個開源項目里了!覺得不錯記得Star哦~! 算法學習資料: AI_Tutorial
總結
以上是生活随笔為你收集整理的搜索,推荐,广告系统架构及算法技术资料大合集吐血整理——2020年终分享的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: YoC RTOS 实战:FOTA系统升级
- 下一篇: FME转换器 正则字符查找(String