Faiss优化:针对OMP_NUM_THREADS环境变量设置的测试验证
生活随笔
收集整理的這篇文章主要介紹了
Faiss优化:针对OMP_NUM_THREADS环境变量设置的测试验证
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
前言
記錄一下Faiss在項(xiàng)目使用中的一些優(yōu)化,對(duì)OMP_NUM_THREADS 環(huán)境變量參數(shù)的測(cè)試驗(yàn)證~
OMP_NUM_THREADS 用于控制線程并發(fā)數(shù).測(cè)試條件:單個(gè)循環(huán)請(qǐng)求,持續(xù)時(shí)間大于15m;基礎(chǔ)數(shù)據(jù):200w軟件環(huán)境:docker; ubuntu 16.04 ;python2.7; faiss:1.4.0-cpu檢索服務(wù)功能: (漢明距離計(jì)算 + 歐式距離計(jì)算 )結(jié)論:
測(cè)試總結(jié)如下:* CPU=1 & OMP_NUM_THREADS=1時(shí),- 1m,5m,15m load average 分布為 31.54,41.16,43.43;- CPUs(%) 用戶空間占比:32.1;內(nèi)核空間占比:2.4;空閑占比:65.2;- faiss 檢索耗時(shí)大約在5-6ms左右;- 檢索服務(wù)整體響應(yīng)時(shí)間較平穩(wěn),大部分在12ms左右;* CPU=3 & OMP_NUM_THREADS=1時(shí),- 1m,5m,15m load average 分布為 49.17,48.70,50.54;- CPUs(%) 用戶空間占比:39.5;內(nèi)核空間占比:4.2;空閑占比:30.3;- faiss 檢索耗時(shí)大約在5-7ms左右;- 檢索服務(wù)整體響應(yīng)時(shí)間較平穩(wěn),大部分耗時(shí)在12ms左右;* CPU=3 & OMP_NUM_THREADS=10時(shí),- 1m,5m,15m load average 分布為 41.33,43.90,55.87;- CPUs(%) 用戶空間占比:20.7;內(nèi)核空間占比:2.3;空閑占比:58.0;- faiss 檢索耗時(shí)不穩(wěn)定,抖動(dòng)較大, 大約在10-90ms左右;- 檢索服務(wù)整體響應(yīng)時(shí)間存在抖動(dòng),大約在14-92ms左右;* CPU=1 & OMP_NUM_THREADS=10時(shí),- 1m,5m,15m load average 分布為 67.77,61.89,61.07;- CPUs(%) 用戶空間占比:20.6;內(nèi)核空間占比:2.9;空閑占比:18.2;- faiss 檢索耗時(shí)不穩(wěn)定,抖動(dòng)較大, 大約在5-80ms左右;- 檢索服務(wù)整體響應(yīng)時(shí)間存在抖動(dòng),大約在13-99ms左右;最終結(jié)論:a: OMP_NUM_THREADS=1時(shí),faiss檢索耗時(shí)較穩(wěn)定;b: OMP_NUM_THREADS=10時(shí),faiss檢索耗時(shí)不穩(wěn)定,抖動(dòng)較大;b: OMP_NUM_THREADS=1時(shí), 多核CPU相較于單核CPU,負(fù)載略高,利用率略高,空閑占比較低;c: OMP_NUM_THREADS=10時(shí), 多核CPU相較于單核CPU,負(fù)載較低,利用率較低,空閑占比較高;d: 優(yōu)化方向:OMP_NUM_THREADS=1 + 多進(jìn)程測(cè)試結(jié)果統(tǒng)計(jì):
* CPU=1 & OMP_NUM_THREADS=1
* CPU=3 & OMP_NUM_THREADS=1
* CPU=3 & OMP_NUM_THREADS=10
* CPU=1 & OMP_NUM_THREADS=10
總結(jié)
以上是生活随笔為你收集整理的Faiss优化:针对OMP_NUM_THREADS环境变量设置的测试验证的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux 安装 memcached
- 下一篇: JUnit5 快速指南