成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

如何使用Django和Postgres進(jìn)行全文搜索-創(chuàng)新互聯(lián)

這篇文章主要介紹如何使用Django和Postgres進(jìn)行全文搜索,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

成都創(chuàng)新互聯(lián)是一家專業(yè)提供防城港企業(yè)網(wǎng)站建設(shè),專注與成都網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站、H5技術(shù)、小程序制作等業(yè)務(wù)。10年已為防城港眾多企業(yè)、政府機(jī)構(gòu)等服務(wù)。創(chuàng)新互聯(lián)專業(yè)網(wǎng)站建設(shè)公司優(yōu)惠進(jìn)行中。

項(xiàng)目及其要求

您可能已經(jīng)注意到,我正在運(yùn)行工作板。 Voorjob基本上是從lever.co聚合工作,并讓用戶搜索它。目前,我在數(shù)據(jù)庫中大約有25,000個(gè)工作,這個(gè)數(shù)字增長緩慢,每增加2或3個(gè)工作,就會關(guān)閉另一個(gè)工作。是的,如果我采用了彈性搜索路徑,那將是一本教科書過度設(shè)計(jì)的情況。

實(shí)施

從9.4版開始,postgres添加了一些允許全文本搜索的功能。不久之后,Django在postgres特定功能中鏡像了這些功能。

要開始使用此新功能,我基本上需要在模型中使用SearchVectorField,并需要使用矢量化的職位描述來更新此字段的方法:

from django.contrib.postgres.search import SearchVectorField, SearchVector
class Job(models.Model):
  title = models.CharField(max_length=200, blank=True)
  location = models.CharField(max_length=50, blank=True)
  body = models.TextField(null=True)
  body_vector = SearchVectorField(null=True)
 
  def make_search_vector():
    self.body_vector=SearchVector('body')
 
  def save(self, *args, **kwargs):
    self.make_search_vector()
    super(Model, self).save(*args, **kwargs)

這種方法適用于很少更新的工作,例如工作板,但是如果您的應(yīng)用程序經(jīng)常更新,則應(yīng)避免使用此策略,并應(yīng)定期執(zhí)行一些任務(wù)來填充向量:

Job.objects.all().update(body_vector=SearchVector('body'))

甚至更好的是,您可以通過閱讀本文檔,使用postgres觸發(fā)器直接進(jìn)行操作。

查詢工作

現(xiàn)在您已經(jīng)準(zhǔn)備好數(shù)據(jù)庫,現(xiàn)在可以查詢它了,讓我們看一下voorjob搜索視圖的教學(xué)版本:

from django.contrib.postgres.search import SearchQuery
 
class Index(ListView):
  model = Job
  paginate_by = 30
 
  def get_queryset(self):
    search = self.request.GET.get("search", None)
    queryset = Job.objects.all()
 
    if search:
      if '"' in search:
        query = SearchQuery(search.replace('"', ''), search_type='phrase')
      else:
        query = SearchQuery(search)
      queryset = queryset.filter(body_vector=query)
    else:
      queryset = queryset
 
    return queryset

我基本上在這里考慮兩種查詢:單詞存在和“精確表達(dá)式”。是的,該邏輯中存在一些缺陷,請繼續(xù)起訴我:D

還有很多可以改進(jìn)的地方,django支持加權(quán)查詢:

vector = SearchVector('title',weight ='A')+ SearchVector('body',weight ='B')
Job.objects.all()。update(body_vector = vector)

這最終將以更好的順序返回結(jié)果,其中標(biāo)題中的匹配比正文中的匹配更重。

查詢系統(tǒng)也更加靈活,允許進(jìn)行邏輯運(yùn)算OR / AND和NOT。在不久的將來,我將改善對工作板的搜索,并更新此帖子以描述所做的更改。

性能

在開發(fā)過程中,我使用了具有16GB內(nèi)存和不錯(cuò)的NVMe的I5。對本地計(jì)算機(jī)中的25k作業(yè)運(yùn)行查詢基本上是瞬時(shí)的。

當(dāng)我將項(xiàng)目轉(zhuǎn)移到生產(chǎn)環(huán)境時(shí)(每滴5美元),事情變得越來越慢了。

運(yùn)行密西西比基準(zhǔn)測試,我得到以下結(jié)果:

在/ django rest framework上搜索((1個(gè)密西西比州以掃描5K條目))

在/ full /上搜索“ django rest framework”(-3個(gè)密西西比州,掃描25K條目)

不是最好的性能,但現(xiàn)在可以使用。本文將進(jìn)行更新以反映任何性能改進(jìn)。

考慮到我的搜索需求不高-超過25k的條目,且字?jǐn)?shù)過多的文章并不比本文大很多-使用postgres作為我的全文搜索的后端,對于此早期MVP來說效果很好?,F(xiàn)在,我比每天給我20個(gè)用戶提供最快的體驗(yàn),對嘗試事物和擴(kuò)大董事會成員更感興趣。

更新(2020年2月9日)

好消息! 我了解到可以將索引添加到SearchVectorField中:

from django.contrib.postgres.indexes import GinIndex
 
class Job(models.Model):
  class Meta:
    indexes = (GinIndex(fields=["body_vector"]),)
  title = models.CharField(max_length=200, blank=True)
  location = models.CharField(max_length=50, blank=True)
  body = models.TextField(null=True)
  body_vector = SearchVectorField(null=True)
  def make_search_vector():
    self.body_vector=SearchVector('body')
  def save(self, *args, **kwargs):
    self.make_search_vector()
    super(Model, self).save(*args, **kwargs)

現(xiàn)在,所有情況下的搜索時(shí)間均降至1個(gè)密西西比州。 由于我的數(shù)據(jù)很小,因此用于該索引的內(nèi)存量可以忽略不計(jì)。

以上是“如何使用Django和Postgres進(jìn)行全文搜索”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計(jì)公司行業(yè)資訊頻道!

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。

網(wǎng)站標(biāo)題:如何使用Django和Postgres進(jìn)行全文搜索-創(chuàng)新互聯(lián)
本文鏈接:http://jinyejixie.com/article10/ccjogo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站維護(hù)手機(jī)網(wǎng)站建設(shè)、品牌網(wǎng)站制作、企業(yè)網(wǎng)站制作、電子商務(wù)、全網(wǎng)營銷推廣

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站建設(shè)網(wǎng)站維護(hù)公司
桐乡市| 庆云县| 瑞昌市| 桐梓县| 盱眙县| 天气| 顺义区| 河津市| 保德县| 博湖县| 汶川县| 霍山县| 大埔区| 博兴县| 繁峙县| 城口县| 嘉荫县| 双峰县| 澎湖县| 阜城县| 武宁县| 长顺县| 巴林右旗| 兴仁县| 鄯善县| 永年县| 莱芜市| 日土县| 马公市| 余庆县| 潜江市| 星子县| 大同县| 瓮安县| 来凤县| 赣榆县| 彩票| 柏乡县| 措美县| 鹤壁市| 休宁县|