WikiEdge:ArXiv-2407.01219/terms

编辑

这篇文章的术语表如下：

生成式大型语言模型（Generative Large Language Models）：指通过预训练学习大量文本数据，能够生成连贯、相关文本的大型人工智能模型。
检索增强生成（Retrieval-Augmented Generation, RAG）：一种结合预训练生成模型和基于检索的模型的技术，通过检索相关信息来增强生成内容的准确性和质量。
嵌入模型（Embedding Model）：在自然语言处理中，用于将文本转换为数值向量，以便在向量空间中进行语义比较的模型。
向量数据库（Vector Database）：专门设计用于存储和检索嵌入向量的数据库，支持高效的相似性搜索。
查询重写（Query Rewriting）：一种优化查询表达的方法，通过改写查询来提高检索系统的性能。
查询分解（Query Decomposition）：将复杂查询分解为更简单、更具体的子查询，以提高检索的相关性和准确性。
伪文档生成（Pseudo-document Generation）：基于用户查询生成假设性文档，用于检索与查询更相关的文档。
混合搜索（Hybrid Search）：结合稀疏检索（如基于关键词的搜索）和密集检索（如基于向量的搜索）的方法，以提高检索效果。
重排序（Reranking）：在初步检索结果基础上，使用更精细的算法重新对文档进行排序，以提高检索的相关性。
文档重打包（Document Repacking）：在重排序后，对文档进行重新组织，以优化后续处理模块的性能。
摘要（Summarization）：从检索到的文档中提取关键信息，生成简洁的摘要，以减少冗余并提高生成响应的质量。

WikiEdge:ArXiv-2407.01219/terms

导航菜单

搜索