Levis's GenAI Fullstack Engineer Blog

時代と共に、生成AIフルスタックエンジニアへ。

RAG

打造高质量企业知识库:常见自动分段(chunking)技术全景解析

RAG

在构建企业知识库系统时,自动分段(自动切分文本)是将长文档合理切分成若干信息单元(如段落、知识片段、FAQ、条目等)的关键步骤,对后续的向量化检索、语义匹配、摘要生成、问答系统等具有极大的影响。选择合适的分段算法可以大幅提升知识库的质量和问答…

GPT-4 Turbo 的 128k 长上下文如何重塑 RAG 系统架构?

GPT-4 Turbo 支持 128k token 的超长上下文,这对 RAG(Retrieval-Augmented Generation,检索增强生成)系统的设计带来了重大变革。下面从原理、结构设计、优势与挑战四个层面详细分析: 一、原理层面:长上下文提升了 RAG 的“生成质量”和“架构自由度” 传统…

FastGPT中HNSW与IVF索引的应用场景与对比分析

FastGPT 是一个基于向量数据库(如 Milvus、FAISS 等)和大模型推理服务搭建的应用框架,用于快速搭建 AI 问答系统、知识库系统等。它在底层检索时常用向量检索索引,其中最重要的两种是: HNSW(Hierarchical Navigable Small World)索引 IVF(Inverted Fi…

FastGPT 知识库机制深度解析:如何提升生成式问答系统质量

FastGPT 是一款集成了文档问答、知识库管理和 API 接入能力的生成式 AI 应用框架,其「知识库」模块对自动问答技术的质量有着深远影响。以下是关于 FastGPT 知识库如何影响问答质量的详细分析: 一、FastGPT 知识库的核心作用 FastGPT 的知识库承担以下核心…

打造高效RAG系统:向量数据库选型的关键技术考量

在生成式 AI 全栈应用中,向量数据库(Vector Database)是实现高效语义检索、RAG(Retrieval-Augmented Generation)等关键能力的基础组件。选择合适的向量数据库对系统性能、开发效率和可维护性影响巨大。 以下是向量数据库选型时需要重点考虑的技术指标,…

RAG系统与传统问答系统的架构本质差异解析

RAG

我们从传统问答系统架构与RAG(Retrieval-Augmented Generation)系统架构的角度出发,来比较它们在设计上的本质差异。这个问题的关键在于理解它们的信息获取路径(知识来源)与生成方式。 一、传统问答系统架构 1.1 定义 传统问答系统主要分为两类: 基于检…