Levis's GenAI Fullstack Engineer Blog

時代と共に、生成AIフルスタックエンジニアへ。

RAG

打造高质量企业知识库：常见自动分段（chunking）技术全景解析

RAG

在构建企业知识库系统时，自动分段（自动切分文本）是将长文档合理切分成若干信息单元（如段落、知识片段、FAQ、条目等）的关键步骤，对后续的向量化检索、语义匹配、摘要生成、问答系统等具有极大的影响。选择合适的分段算法可以大幅提升知识库的质量和问答…

GPT-4 Turbo 的 128k 长上下文如何重塑 RAG 系统架构？

RAG OpenAI

GPT-4 Turbo 支持 128k token 的超长上下文，这对 RAG（Retrieval-Augmented Generation，检索增强生成）系统的设计带来了重大变革。下面从原理、结构设计、优势与挑战四个层面详细分析：一、原理层面：长上下文提升了 RAG 的“生成质量”和“架构自由度” 传统…

FastGPT中HNSW与IVF索引的应用场景与对比分析

FastGPT RAG Index

FastGPT 是一个基于向量数据库（如 Milvus、FAISS 等）和大模型推理服务搭建的应用框架，用于快速搭建 AI 问答系统、知识库系统等。它在底层检索时常用向量检索索引，其中最重要的两种是： HNSW（Hierarchical Navigable Small World）索引 IVF（Inverted Fi…

FastGPT 知识库机制深度解析：如何提升生成式问答系统质量

RAG FastGPT

FastGPT 是一款集成了文档问答、知识库管理和 API 接入能力的生成式 AI 应用框架，其「知识库」模块对自动问答技术的质量有着深远影响。以下是关于 FastGPT 知识库如何影响问答质量的详细分析：一、FastGPT 知识库的核心作用 FastGPT 的知识库承担以下核心…

打造高效RAG系统：向量数据库选型的关键技术考量

VectorDB RAG

在生成式 AI 全栈应用中，向量数据库（Vector Database）是实现高效语义检索、RAG（Retrieval-Augmented Generation）等关键能力的基础组件。选择合适的向量数据库对系统性能、开发效率和可维护性影响巨大。以下是向量数据库选型时需要重点考虑的技术指标，…

RAG系统与传统问答系统的架构本质差异解析

RAG

我们从传统问答系统架构与RAG（Retrieval-Augmented Generation）系统架构的角度出发，来比较它们在设计上的本质差异。这个问题的关键在于理解它们的信息获取路径（知识来源）与生成方式。一、传统问答系统架构 1.1 定义传统问答系统主要分为两类：基于检…