Django + DRF + Elasticsearch 实现搜索功能
django使用haystack來調用Elasticsearch搜索引擎
如何使用django來調用Elasticsearch實現全文的搜索
Haystack為Django提供了模塊化的搜索。它的特點是統一的,熟悉的API,可以讓你在不修改代碼的情況下使用不同的搜索后端(比如 Solr, Elasticsearch, Whoosh, Xapian 等等)。
環境:django ==1.11.11
1.首先安裝相關的依賴包:(這里原作者使用的是drf-haystack,如果項目沒有使用drf組件,應該選用haystack包)
pip install drf-haystack pip install elasticsearch==2.4.1 # drf-haystack官方文檔:https://drf-haystack.readthedocs.io/en/latest/2.在django項目配置文件settings.py中注冊應用:
INSTALLED_APPS = [...'haystack',... ]3.在django項目配置文件settings.py中指定搜索的后端:(指定使用那個搜索引擎,服務器地址的配置,索引庫的名稱等配置)
''' 遇到問題沒人解答?小編創建了一個Python學習交流QQ群:579817333 尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書! ''' # Haystack HAYSTACK_CONNECTIONS = {'default': {'ENGINE': 'haystack.backends.elasticsearch_backend.ElasticsearchSearchEngine', # 指定使用 elasticsearch 為搜索引擎, 如果搜索內容包含中文, 需要將 elasticsearch 配置支持中文分詞'URL': 'http://your_ip:9200/', # 此處為elasticsearch運行的服務器ip地址,端口號默認為9200# elasticsearch建立的索引庫的名稱'INDEX_NAME': 'demo', # 保存索引文件的路徑# 'PATH': os.path.join(BASE_DIR, 'elastic_index'), # 如果搜索引擎是whoosh, 還需要設置PATH參數}, }# 當添加、修改、刪除數據時,自動生成索引 HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'# 指定搜索結果每頁的條數 這里設置成了1條HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1注意:
HAYSTACK_SIGNAL_PROCESSOR 的配置保證了在Django運行起來后,有新的數據產生時,haystack仍然可以讓Elasticsearch實時生成新數據的索引
4.創建索引類:(在需要進行索引的應用的目錄下創建文件search_indexes.py, 在該文件內創建該索引類,轉載者注
''' 遇到問題沒人解答?小編創建了一個Python學習交流QQ群:579817333 尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書! ''' from haystack import indexes from .models import Demo # 原作者在代碼中沒有給出模型代碼,這個模型里擁有的字段就是需要提供搜索的字段,建議保留模型字段中自增的主鍵字段id, 在我實際項目開發中發現如果不保留就無法實現搜索# 索引模型類的名稱必須是 模型類名稱 + Index class DemoIndex(indexes.SearchIndex, indexes.Indexable):"""索引數據模型類"""text = indexes.CharField(document=True, use_template=True) # 一般此字段約定為text default_image_url = indexes.CharField(model_attr='default_image_url')def get_model(self):"""返回建立索引的模型類"""return Demomodeldef index_queryset(self, using=None):"""返回要建立索引的數據查詢集"""return self.get_model().objects.filter(is_launched=True) """ 說明: 1.在DemoIndex建立的字段,都可以借助haystack由elasticsearch搜索引擎查詢。 2.其中text字段聲明為document=True,表名該字段是主要進行關鍵字查詢的字段, 該字段的索引值可以由多個數據庫模型類字段組成(是多個字段,不是多個數據庫模型類,轉者注),具體由哪些模型類字段組成,我們用use_template=True表示后續通過模板來指明,其他字段都是通過model_attr選項指明引用數據庫模型類的特定字段。 3.在 REST framework中,索引類的字段會作為查詢結果返回數據的來源, """5.在templates目錄中創建text字段使用的模板文件:
templates/search/indexes/demo/demo_text.txt文件中定義(關于路徑的定義和文件的命名的說明:templates是項目原來的html文件的目錄,search是在其下新建的,名稱一定,indexes名稱也一定,demo是應用的名稱,demo_text.txt 就是需要進行索引的模型類名的小寫 + “_” + 索引類中定義的字段名稱(text) + “.txt” 轉載者注)
在demo_text.txt文件中 指定為模型類中那些字段建立索引
{{ object.name }} {{ object.id }}然后使用命令手動創建索引:
進入manage.py所在的目錄執行命令:
python manage.py rebuild_index6.創建haystack序列化器:(返回查詢到的查詢集數據)
''' 遇到問題沒人解答?小編創建了一個Python學習交流QQ群:579817333 尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書! ''' from drf_haystack.serializers import HaystackSerializerclass DemoSerializer(serializers.ModelSerializer):"""序列化器"""class Meta:model = Demo # 返回除了搜索字段外的所需要的其他字段數據, 可以將所有需要返回的字段數據寫上,便于提取fields = ('id', 'name')class DemoIndexSerializer(HaystackSerializer):"""SKU索引結果數據序列化器"""# 變量名稱必須為 object 否則無法返回object = DemoSerializer(read_only=True)# 只讀,不可以進行反序列化class Meta:index_classes = [DemoIndex] # 索引類的名稱,可以有多個# text 由索引類進行返回, object 由序列化類進行返回,第一個參數必須是textfields = ('text', object, 'default_image_url')注意:fields屬性的字段名與DemoIndex類的字段對應。
7.創建視圖
from drf_haystack.viewsets import HaystackViewSetclass DemoSearchViewSet(HaystackViewSet):index_models = [Demo]#這里可以寫入多個已經進行了索引的模型類serializer_class = DemoIndexSerializer# 這里是通過父類默認的方法進行返回了數據, 可以在視圖中對數據進行篩選和處理,詳細的使用方法可以去查看官方文檔,drf-haystack官方文檔:https://drf-haystack.readthedocs.io/en/latest/- 該視圖會返回搜索結果的列表數據,所以如果可以為視圖增加REST framework的分頁功能。
- 我們在配置文件已經定義了分頁配置,所以此搜索視圖會進行分頁。
8.添加路由,使用通過REST framework的router來定義路由.
router = DefaultRouter() router.register('/', views.DemoSearchViewSet, base_name='demo_search')...urlpatterns += router.urls9.測試
http://127.0.0.1:8000/?text=something如果在配置完haystack并啟動程序后,出現如下異常,是因為drf-haystack還沒有適配最新版本的REST framework框架
可以通過修改REST framework框架代碼,補充_get_count函數定義即可
文件路徑 虛擬環境下的 lib/python3.6/site-packages/rest_framework/pagination.py
def _get_count(queryset):"""Determine an object count, supporting either querysets or regular lists."""try:return queryset.count()except (AttributeError, TypeError):return len(queryset)總結
以上是生活随笔為你收集整理的Django + DRF + Elasticsearch 实现搜索功能的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python 使用dir() help(
- 下一篇: django 获取外键对应数据的方式