Feed Flow | Devil King's Blog

倒排索引

倒排的hash冲突问题，通过正排的索引，辅助倒排的关系验证功能

也就是正排的索引在竞价排名中起作用

feed流不同于搜索引擎部分，就是在于hash的函数不一样，提取兴趣点

多源融合

反复拉取->条目反序列化->过滤->是否足够->召回排序->Top100->算法排序

拉取权重的控制粒度：池子、库、分组。首页基于「源」的概念控制比例，而「源」是一个虚拟的组合。这个「源」的组合里，可以包括指定的几个池子，特定的几个库，抑或某些分组。

召回排序在选择 Top 100 时，特定「源」被召回的条目数为 100 * ratio。通过「源」的概念，可以保证特定组合召回权重。

每一层排序策略不同，通过筛选可以减少后续环节的计算量，通过排序保证每个环节最「恰当」的数据可被选出。

使用redis module ，加入filter module以及使用zset的方式，

迭代架构

面向「工程」、面向「合作」，是上个 Q 架构演进的指导思想。只有易学习、易维护的架构才是恰当的架构。如何保证工程团队高效工作，尽力降低人力成本，便是这代架构的最大挑战。