倒排索引是信息检索系统(如搜索引擎)中最核心的数据结构之一。
定义
倒排索引是一种将文档内容中的关键词映射到包含该关键词的文档 ID 列表的数据结构。
- 正排索引:文档ID → 关键词列表
- 倒排索引:关键词 → 文档ID列表
原理
倒排索引通过扫描所有文档,统计每个关键词出现在哪些文档中,建立关键词到文档ID的映射表。
应用
- 搜索引擎全文检索
- 数据库模糊查询
- 日志分析、推荐系统等
小于 1 分钟
倒排索引是信息检索系统(如搜索引擎)中最核心的数据结构之一。
倒排索引是一种将文档内容中的关键词映射到包含该关键词的文档 ID 列表的数据结构。
倒排索引通过扫描所有文档,统计每个关键词出现在哪些文档中,建立关键词到文档ID的映射表。
分布式事务用于保证跨多个服务或数据库的数据一致性,是分布式系统设计中的难点。
分布式事务指涉及多个独立节点(数据库/服务)的事务操作,需保证整体一致性。