《向量数据库:大模型驱动的智能检索与应用》
内容涵盖从理论基础到技术实践的多个方面,详细讨论高维向量表示中的信息丢失、嵌入空间误差和维度诅咒等问题,
结合FAISS和Milvus等主流开源工具,深入剖析向量数据库的索引机制、搜索算法和优化策略。
通过实际案例,展示向量数据库在推荐系统、行为分析、智能诊断、语义搜索等领域的应用,
并特别强调企业级语义搜索系统的开发与部署经验。
适合从事搜索引擎与推荐系统开发的工程师,数据科学、人工智能及相关领域的从业者、研究人员,以及对向量数据库与相似性搜索感兴趣的读者
在自然语言处理(NLP)和机器学习领域,
静态嵌入(Static Embeddings) 和动态嵌入(Dynamic Embeddings) 是两种生成词向量的核心技术,
它们的核心区别在于词向量是否会根据上下文动态变化;
简单场景用静态嵌入(如 Word2Vec),复杂场景用动态嵌入(如 BERT)
向量嵌入(Vector Embeddings)是向量数据库的核心基础,
将非结构化数据转换为高维向量,使其能够在向量空间中进行存储、检索与分析。
通过嵌入技术,文本、图像和音频等数据被映射为语义相关的向量表示,为相似性搜索和数据挖掘提供了可能。
查看python版本
python -v
python --version
import sys
sys.version
# f-string 格式化字符串
print(f"{sys.version}")
θ(theta) 表示角度或方向相关的量
Δ(delta) 表示变化量或差值
大模型对话
国内:
DeepSeek:使用面广
通义千问:综合能力强
豆包:多模态能力突出,尤其擅长文字、图片、视频混合任务
国外:
ChatGPT:经典,综合能力强
Gemini:擅长长文本分析
Claude:适合逻辑推理、编程任务
计划去北欧度假
用大模型对话,它最多帮我规划日程
如果用一个私人旅游智能体,它可以
制定行程
邀请同行伙伴
订机票和酒店
安排当地商务访问
智能体(AI Agent)的价值:不仅“说”,还能“做”
拥抱AI 多用AI
当随机变量分布右侧出现一个长尾时,这一分布正偏或者右偏;
反之,若左边出现一个长尾,则为负偏或者左偏
AI编程
Cursor(国外)
内嵌Claude等多种大模型
TRAE(国内)
Cursor的国内平替
Trae 是字节跳动推出的国内首个 AI 原生 IDE ;
Trae 的含义是 The Real AI Engineer,即真正的 AI 工程师。
2025 年 1 月,Trae 国际版上线,3 月 3 日,Trae 国内版正式上线。
Cursor 采用付费模式,会员费为 20 美元 / 月,而 Trae 完全免费,
用户无需支付任何费用即可无限量使用其内置的 AI 模型,
大大降低了开发成本,尤其适合预算有限的开发者;
集成主流 AI 模型:国内版集成豆包 1.5Pro 和满血版 DeepSeek R1、V3 模型,
还内置了 GPT-4o、Claude-3.5-Sonnet 模型供免费使用。
第一页
上一页
下一页
最后一页