跳至主要內容
倒排索引原理与应用

倒排索引是信息检索系统(如搜索引擎)中最核心的数据结构之一。

定义

倒排索引是一种将文档内容中的关键词映射到包含该关键词的文档 ID 列表的数据结构。

  • 正排索引:文档ID → 关键词列表
  • 倒排索引:关键词 → 文档ID列表

原理

倒排索引通过扫描所有文档,统计每个关键词出现在哪些文档中,建立关键词到文档ID的映射表。

应用

  • 搜索引擎全文检索
  • 数据库模糊查询
  • 日志分析、推荐系统等

KSJ小于 1 分钟架构师检索系统