菜单

知识库机器人原理

什么是RAG?

知识库的整套技术在学术界有一个专业名词,叫RAG,即Retrieval-Augmented Generation,翻译为中文为检索信息增强,是一种将信息检索机制与AI模型结合的创新方法。

RAG还有一个通俗的叫法,叫外挂知识库。外挂的含义就是,和AI大模型是分离的。如果不分离,那就是模型微调了,又是另外一回事了。

 

RAG的原理

RAG的原理其实很简单,就是模型生成回答时,不是自己直接生成,而是先去查一下知识库,再进行生成。通俗的来说,就是开卷考试(RAG)和闭卷考试(直接生成)的差别。

从流程上来说,绝大多数RAG可以分为这3步:

  1. 创建知识库
    1. 输入数据(上传文件)
    2. 处理数据(切片+向量化)
    3. 存储数据(存到向量数据库)
  2. 查询知识库
    1. 搜索数据(向量检索)
    2. 处理数据(重排序)
    3. 输出数据(挑选相关性高的)
  3. AI生成答案

通俗的来说,就是将一个巨大的数据,切成很多小块,当AI进行问答时,搜索出关联性高的小块,根据这些小块的内容进行回答。这样的好处就是:AI不需要处理大量的数据,只需要处理很少量的数据就可以了,提高了速度,降低了成本。

但是劣势也是很明显的,就是断章取义。由于AI只拿到了部分数据,无法看到全局,所以这是RAG的天然劣势。

RAG的关键

RAG的本质就是断章取义,那么怎么断,怎么取,就决定回答的质量,在整个过程中,AI的作用其实是很小的。关键是在第一和第二步中,也就是数据处理数据检索。

数据处理的关键是如何切片,302.AI提供了非常丰富的切片设置,具体可以看这一篇文章

数据检索的关键是如何找到关联性大的内容,302.AI采用了双重检索的机制,先使用向量检索粗检索,再用重排序算法(rerank)精检索,最后输出到大模型,大大提高了精度。

 

GraphRAG

GraphRAG是微软提出的一种新式的RAG技术,原理就是在数据输入阶段,对数据处理阶段,用AI进行了图谱化处理,让AI去理解数据,建立数据语义的关联,使检索精度大大提高。

GraphRAG的本质,是在原有的数据基础上,用AI创造了新的数据。这种新的数据是通过构建知识图谱来实现的,这不仅有助于更好地组织和存储信息,还能使AI在进行检索时能够更智能地识别和推理数据之间的关系。这种方法有效地提升了信息检索的准确性和效率,使得系统在处理复杂查询时表现得更加出色。此外,GraphRAG的图谱化处理还可以帮助发现数据中的隐藏模式和趋势,从而为用户提供更深刻的洞察和决策支持。

GraphRAG也不是没有缺点的,第一就是会比较贵,因为在数据录入的过程中,需要AI进行处理,一定会产生AI的费用。第二就是比传统RAG要慢,因为检索图谱的过程会复杂很多。

302.AI现已独家提供GraphRAG的知识库接入和API接入,代码基于Nano-GraphRAG开发,更加轻量化。

 

总结

知识库的原理就是AI先查询再回答。那么如何查询到关联性高的片段,就是知识库最核心的部分。302.AI提供了2种模式:传统RAG和GraphRAG,可以根据需求去选择。

上一个
知识库机器人介绍
下一个
知识库机器人创建
最近修改: 2024-09-12