WikiEdge:ArXiv-2407.01219/terms

来自WikiEdge
跳转到导航 跳转到搜索
编辑

这篇文章的术语表如下:

  • 生成式大型语言模型(Generative Large Language Models):指通过预训练学习大量文本数据,能够生成连贯、相关文本的大型人工智能模型。
  • 检索增强生成(Retrieval-Augmented Generation, RAG):一种结合预训练生成模型和基于检索的模型的技术,通过检索相关信息来增强生成内容的准确性和质量。
  • 嵌入模型(Embedding Model):在自然语言处理中,用于将文本转换为数值向量,以便在向量空间中进行语义比较的模型。
  • 向量数据库(Vector Database):专门设计用于存储和检索嵌入向量的数据库,支持高效的相似性搜索。
  • 查询重写(Query Rewriting):一种优化查询表达的方法,通过改写查询来提高检索系统的性能。
  • 查询分解(Query Decomposition):将复杂查询分解为更简单、更具体的子查询,以提高检索的相关性和准确性。
  • 伪文档生成(Pseudo-document Generation):基于用户查询生成假设性文档,用于检索与查询更相关的文档。
  • 混合搜索(Hybrid Search):结合稀疏检索(如基于关键词的搜索)和密集检索(如基于向量的搜索)的方法,以提高检索效果。
  • 重排序(Reranking):在初步检索结果基础上,使用更精细的算法重新对文档进行排序,以提高检索的相关性。
  • 文档重打包(Document Repacking):在重排序后,对文档进行重新组织,以优化后续处理模块的性能。
  • 摘要(Summarization):从检索到的文档中提取关键信息,生成简洁的摘要,以减少冗余并提高生成响应的质量。