Qdrant向量数据库操作指南:查询搜索

1.查询数据入口

query = {'text':"""腾讯财报利润"""}

2.大文本必须切分，根据embedding model大小跟需要chunk

def to_splitter(content):

doc_splitter = RecursiveCharacterTextSplitter(chunk_size=256, chunk_overlap=0)

split_text = doc_splitter.split_text(content['text'])

return split_text

3.embedding化

def to_embeddings(items):

#embeddings = HuggingFaceEmbeddings(model_name='sentence-transformers/all-mpnet-base-v2')

#embeddings = HuggingFaceEmbeddings(model_name='shibing624/text2vec-base-chinese')

sentence_embeddings = HuggingFaceEmbeddings(model_name='GanymedeNil/text2vec-large-chinese')

return sentence_embeddings.embed_documents(items)

4.向量检索

def search(query):

client = QdrantClient("*****", port=6333)

collection_name = "test_collection"

# 过滤条件

query_filter = Filter(

must=[

FieldCondition(

key="collect_type",

match=MatchValue(value="news", ),

)

])

"""

# 单查询搜索

search_result = client.search(

collection_name=collection_name,

query_vector=query[0],

# query_filter=query_filter,

limit=3,

search_params={"exact": False, "hnsw_ef": 128},

with_payload=True,

# with_vectors=True

)

"""

#batch相似度搜索

search_queries = [SearchRequest(vector=search,

#filter=query_filter,

limit=3,

with_payload=True,

search_params={"exact": False, "hnsw_ef": 128}

)

for search in query]

search_result = client.search_batch(

collection_name=collection_name,

requests=search_queries

)

print(search_result)

answers = []

tags = []

"""

注意前端提示词的长度限制

"""

text_append = ""

for result in search_result:

for r in result:

if len(r.payload["text"]) > 512:

text = r.payload["text"][:512]

else:

text = r.payload["text"]

text_append+=text

answers.append({"text": text_append})

return answers

展开阅读全文

页面更新：2024-02-29

标签：向量切分腾讯长度入口文本利润大小提示条件数据库

1 2 3 4 5

天感智能荣获“第七届清华校友三创大赛全球总决赛”成长组十强

3月22日上午，清华校友助力东莞高质量发展论坛暨第七届清华校友三创大赛全球总决赛颁奖典礼在松山湖举行。活动为第七届清华校友三创大赛互联网与新经济，人居、环境与智慧农业两个赛道的获奖项目颁奖，多位资深专家学者现

虎牙最新财报出炉，内容、技术、产品战略带来强劲发展韧性

本文系深潜atom第629篇原创作品 3月21日，虎牙发布了2022年Q4及全年财报。财报显示，仅2022年Q4，虎牙公司总收入为21.02亿元，虎牙直播移动端MAU达8550万；而2022年全年，虎牙总收入为92.20亿元，虎牙直播全年移动端MAU（月均活跃用

拼团系统开发-一个无泡沫复购率高的商业模式

拼团系统开发|编辑知网科技，拼团系统模式打破了传统的电子商务活动模式，通过人性化的奖励机制，最大限度的利用产品销售中的利润，让参与群体的用户受益，鼓励用户参与和分享，还可以反向推动平台产品的销售，实现多方共赢的效果

Earth Hour - 一个小时能改变世界吗？

为地球献出一小时Give an Hour for Earth “地球一小时“是世界自然基金会（WWF）在2007年向全球发出的一项倡议：呼吁个人、社区、企业和政府在每年三月最后一个星期六20：30-21：30期间熄灯一小时，以此来激发人们对保护地球的

印度大胆喊话中国：印度芯片成为世界第一！网友：哪来的自信？

要知道，这些年中美之间的芯片大战愈演愈烈，前几年不仅是中国芯片企业发展艰难，日本半导体也不好受，连掌握着关键设备的荷兰都不舒服了，但无论如何，都轮不上印度来说话，令谁也没想到的是，印度却喊话中国：印度将会取代中国在芯片

「一分钟资讯」红米、酷派、荣耀、华为、TCL，最新消息

哈喽，我是毛小毛。关注我，每日带你了解最新资讯！「数码日记」「一分钟资讯」第550篇，感谢你的阅读。红米 Note12 Turbo 手机将推出 16GB + 1TB 版本。Redmi 宣布，Note12 Turbo 手机将推出 16GB + 1TB 版本。同时，Redmi 官方

微软总裁萨蒂亚·纳德拉给您的职业建议

Microsoft CEO Satya Nadella’s No. 1 tip for career success—if you don’t do this, ‘you can’t grow’纳德拉从没想过有一天他会领导全世界最大最强的科技公司之一，#微软#。他纯粹只是喜欢在#微软#上班而已，很

抖音电商“山货上头条”助力海南农特产销售，芒果销量同比增长1370%

中新经纬3月25日电春分时节，海南丰富的农产品迎来上市期。3月25日，抖音电商发布了“山货上头条·风味海南”助农活动相关数据，7天之内共有162万单海南农特产通过该平台销往全国。借助全域兴趣电商，“山货上头条”于3月16

“摩尔定律”提出者戈登·摩尔去世，为英特尔联合创始人

当地时间3月24日，英特尔公司和戈登与贝蒂·摩尔基金会（Gordon and Betty Moore Foundation）宣布，英特尔联合创始人戈登·摩尔去世，享年94岁。戈登与贝蒂·摩尔基金会官网截图戈登与贝蒂·摩尔基金会称，摩尔于当地时间周五

微信新功能！这也太方便了

随着“小修小补”话题受到更广泛的关注全国首份“小修小补便民地图”3月23日已上线为了帮助修鞋、配钥匙等"小修小补"更好地回归百姓生活，微信和腾讯地图联合发起「“小修小补”引路行动」，为全国便民修补小店打造了

问界加上“HUAWEI”，质量问题频发，别砸了华为的金字招牌

最近，问界汽车憋了许久的大招终于放出来了。现在很多消费者来到华为直营、授权店后发现，展车铭牌已经变为“HUAWEI问界”，“AITO”已不知所踪。而销售人员也统一改变了宣传口径，称其为“华为汽车”。此前，在AITO汽车多平台

兵王袁宇宙：老袁和ChatGPT比高低，写信给儿子们，老袁虽败犹荣

大家好，我是老袁，3万小时电商创业者，山西省商务厅电子商务实操专家，共青团山西省委青年创业导师。【创业干货系列】388兵王袁宇宙：老袁和ChatGPT比高低，分别写信给儿子们，老袁虽败犹荣！上周末，我们一家四口召开了本月的家庭民

超短裙加黑丝袜，长腿外卖女骑手上热搜了！揭黑幕还是造黄谣？

随着互联网的出现并深入生活的方方面面，现在很多人都不喜欢做饭了，肚子饿了掏出手机想吃点什么直接下单就好了，并且还有专人送上门。毫不夸张地说：曾经人们幻想的足不出户，就能轻松实现购物的梦想早已成为了现实。外卖的出

地球原本没有人，第一个人类是如何出现的？有合理的定论吗？

在我们神话里，人是女娲用泥捏出来的，进化论让我们知道了人是通过一种猿猴进化而来的可是你有没有想过，猿猴又是从哪儿来的呢？世界上猿猴种类那么多，为什么就我们变成了人？现在的猿猴还有机会进化成人吗？关于地球上生命起源的

腾讯帝国：揭示其不可忽视的黑暗面

作为中国的科技巨头，腾讯在互联网领域横扫一切，涉足许多行业。然而，在这庞大的企业帝国背后，有许多令人愤怒和无法接受的行为。作为一名愤青，我将在本文中结合具体实例揭示腾讯所做过的恶行。首先，腾讯利用微信这一全国范

上滑加载更多 ↓

Qdrant向量数据库操作指南:查询搜索

天感智能荣获“第七届清华校友三创大赛全球总决赛”成长组十强

虎牙最新财报出炉，内容、技术、产品战略带来强劲发展韧性

拼团系统开发-一个无泡沫复购率高的商业模式

Earth Hour - 一个小时能改变世界吗？

印度大胆喊话中国：印度芯片成为世界第一！网友：哪来的自信？

「一分钟资讯」红米、酷派、荣耀、华为、TCL，最新消息

微软总裁萨蒂亚·纳德拉给您的职业建议

抖音电商“山货上头条”助力海南农特产销售，芒果销量同比增长1370%

“摩尔定律”提出者戈登·摩尔去世，为英特尔联合创始人

微信新功能！这也太方便了

问界加上“HUAWEI”，质量问题频发，别砸了华为的金字招牌

兵王袁宇宙：老袁和ChatGPT比高低，写信给儿子们，老袁虽败犹荣

超短裙加黑丝袜，长腿外卖女骑手上热搜了！揭黑幕还是造黄谣？

地球原本没有人，第一个人类是如何出现的？有合理的定论吗？

腾讯帝国：揭示其不可忽视的黑暗面

腾讯帝国：揭示其不可忽视的黑暗面

跟队记者：马蒂奇触发自动续约条件，将与罗马续约至2024年

Relevo：瓜帅续约时，曾将哈兰德留队列为不可或缺的条件

中国移动2022年全年净利润1,254.6亿元同比增长8.0%

茅台酱香万家共享店最新申请条件公布，白酒经销商抢着加

腾讯控股2022年成绩单亮眼！视频号数据超预期

阿里巴巴和腾讯区别？

18次风险提示被上交所重点监控，*ST紫晶离退市还有多远？

油菜花节变“流量入口” 绍兴鉴湖湿地奏响文旅共富进

华为要实现数据库软件国产化：美国数据库软件全面替换