首页

LangChain 和 LangChain4j不是由同一个组织在维护 ;
LangChain 是由 Harrison Chase 和 Ankush Gola 创建的,
目前主要有面向 Python 和 JavaScript/TypeScript 生态的两个官方维护版本 ;
而 LangChain4j 是 LangChain 的 Java 实现版本,由 langchain4j 官方团队开发,
其目标是将 LangChain 的核心概念和功能移植到 Java 生态系统中,使 Java 开发者能够更方便地构建基于大语言模型的应用程序
MMR 搜索即最大边际相关性搜索(Maximal Marginal Relevance Search),是信息检索和推荐系统中的重要算法 ;
相较于相似度搜索,MMR 搜索更注重结果的多样性 ;
相似度搜索专注于精确匹配,通过向量空间距离计算实现高精度匹配,适用于专利检索、学术论文查重等需要高精度匹配的场景 ;
而 MMR 搜索在需要覆盖多角度信息或提供多样化内容推荐的场景中,能显著提升用户体验和信息获取效率
在电商环境中,可实现跨品类推荐,帮助用户发现更多潜在兴趣点;
在科研文献探索中,能提供多角度观点,促进学术创新和知识交叉融合;
在内容生成系统中,可为创作者提供多样化的素材和灵感,避免内容同质化
LlamaIndex 是一个与 LangChain 类似的框架,但它们的实现逻辑和方法不同:
LangChain 最初围绕“链”(chain)概念设计(这也是其名称的由来);
LlamaIndex 则专注于上下文增强(context-augmented)LLM 应用,特别适用于 RAG 解决方案;
LlamaIndex 官网:
LlamaIndex 是一个简单、灵活的数据框架,用于将自定义数据源连接到 LLM
《LangChain 核心技术与 LLM 项目实践》 凌峰
LangChain 技术与大语言模型(LLM)项目实践 
内容简介:
该书全面系统地介绍了 LangChain 的主要功能模块及具体应用 ;
全书共 12 章,从大语言模型的基础知识入手,
涵盖任务链的设计、内存模块的管理、表达式语言的使用、Agent 系统的实现、回调机制、模型 I/O 与数据检索等方面的内容 ;
书中还通过代码示例和应用场景,逐步引导读者掌握模型优化、并发处理和多级任务链设计等高级技术 ;
最后,详细展示了如何运用 LangChain 技术开发一个企业级智能问答系统,
帮助开发者打造高效、可靠的企业级解决方案 ;
读者对象:
适合大模型及 LangChain 开发人员、高校学生以及对 LangChain 开发感兴趣的人员和研究人员阅读,也可作为培训机构和高校相关专业的教学用书 ;
书籍特色:
聚焦于前沿技术与落地实践,内容从入门到高级,既介绍了 LangChain 的基础概念和功能,
又深入探讨了其在企业应用实践中的深度开发和技术优化,能够帮助读者全面掌握 LangChain 技术并应用于实际项目中
概率与统计学是金融分析的 “量化基石”:
它们将模糊的 “感觉” 转化为可衡量的 “概率”,将杂乱的数据提炼为可分析的 “规律”,帮助投资者更理性地评估风险、制定策略
金融市场收益率往往呈现 “肥尾” 特征(极端涨跌的概率远高于正态分布预测),
例如 2008 年金融危机、2020 年疫情暴跌等 “黑天鹅” 事件;
因此,概率分析需结合历史数据修正分布,避免低估极端风险
LangChain 是 “LLM 的操作系统”,负责调度 LLM 与外部世界的交互;
LlamaIndex 是 “私有数据的翻译器”,负责让 LLM 理解和使用人类世界的知识。
实际项目中,两者往往互补,共同构成 LLM 应用的基础设施
Milvus作为一款开源的向量数据库,专为高性能、高可用的向量数据管理与检索设计,已成为处理海量非结构化数据的核心工具之一。
其架构融合了分布式存储与索引机制,通过模块化设计实现了存储、计算和检索的高效协同
FAISS(Facebook AI Similarity Search)作为一款高效的向量搜索工具,在大规模高维数据的索引与检索中展现了卓越的性能。
FAISS是一个开源的向量检索库,专为高效的相似性搜索和密集向量聚类任务设计,适用于大规模数据集处理场景,
FAISS支持多种索引类型,用于满足不同场景下的向量检索需求。
Flat索引以高精度著称,但计算量较大,适合小规模数据集;
IVF(Inverted File)索引通过分区减少计算量,适合中等规模的数据场景;
HNSW(Hierarchical Navigable Small World)索引则在大规模高维向量检索中展现出了高效性。
近似最近邻(ANN)算法
若直接计算所有向量的余弦相似度,检索效率会很低,例如处理 100 万向量时,计算量将达到 100 万次 。
为提升检索速度,向量数据库采用近似最近邻(ANN, Approximate Nearest Neighbor)算法 。
该算法通过构建索引(如树形结构或图结构),快速缩小搜索范围,虽然会牺牲一点精度,
但时间效率大幅提升,且误差可控制在 1% 以内 。
常见的 ANN 算法有:
FAISS(Facebook 开源):采用倒排文件 + PQ 量化,适合大规模数据处理;
HNSW(层次化可导航小世界图):利用图结构连接相似向量,适合实时检索场景 。

第一页 上一页 下一页 最后一页