我跟大家说,之前总觉得“问羊知马”这个词,有点儿故弄玄虚。不就是间接了解情况嘛有啥好说的。直到自己真正掉到一个坑里,才明白这事儿不简单,里面门道多着。
掉坑了:推荐系统用户跑光光
我之前不是捣鼓过一个内容推荐的小系统嘛刚上线那会儿,大家新鲜劲儿还在,用的人不少。可没多久,数据就不好看了,用户流失得厉害。我心里急,赶紧拉了一堆报表看,发现点击量唰唰往下掉,用户停留时间也短得可怜。
我当时就想,这肯定是推荐内容不准嘛可问题是,怎么个不准法?我跑去问几个熟悉的用户,问他们为啥不爱用了。结果七嘴八舌的,有人说“没啥好看的”,有人说“老是推那些我早就看过的东西”,还有人说“感觉推荐的都是些垃圾新闻”。听完我更懵了,这些都是表象,真正的问题到底在哪儿?这就好比我想知道那匹“马”为啥不跑了,结果问“马”它不说话,问旁边几只“羊”,它们也只说了些不疼不痒的抱怨。
寻找“羊”的旅程:从数据到人,再到竞品
我意识到,直接问是问不出结果的。那不就得“问羊知马”了吗?可这“羊”是到底有几种?我那阵子就跟个侦探似的,到处找线索。

-
第一种“羊”:数据行为羊。
我先从最容易拿到的地方下手,把所有用户行为日志都翻了个底朝天。用户点了什么?看了多久?在哪一步跳出了?是不是看了某个视频,接着就关掉了应用?是不是看了某篇文章,就立马划走了?我把这些数据拉出来,做各种漏斗分析、路径分析。我发现用户对某种特定类型的内容,无论是点击率还是停留时间,都特别低。就好像这只“数据羊”告诉我,‘喂,你这块草料是坏的,大家都不吃!’但它没告诉我,草料到底怎么坏的,是过期了,还是根本不新鲜。
-
第二种“羊”:客服反馈羊。
光看数据,只能知道“发生了什么”,不知道“为什么发生”。我就又跑去跟我们客服团队的小伙伴聊。问他们平时收到的用户反馈里,有没有什么共同点。我把他们记录的几百条用户反馈挨个儿看了一遍。还真别说,我发现好多用户提到“推荐的都是旧闻”、“标题党太多”、“内容深度不够”。这只“客服羊”就跟我说了:‘大家嫌这块草料不仅坏了,还全是假把式,看着像草,结果是塑料!’这下,我开始明白,问题可能出在内容本身的质量和时效性上。

-
第三种“羊”:竞品观察羊。
光看自己的问题还不够,我还得看看别人家是怎么做的。我扒拉了一堆市面上同类的推荐产品,研究它们推荐的内容类型、风格、更新频率,甚至去他们的用户社区里潜水,看用户都在讨论什么,喜欢什么样的新内容。我发现,那些做得好的产品,他们的内容更新速度快,而且很多原创的、有深度的内容特别受欢迎。这只“竞品羊”就告诉我:‘你看别人家的草料,新鲜又营养,花样还多,怪不得大家爱去那里吃。’
-
第四种“羊”:内部经验羊。
我把这些零零散散的线索,拿到我们团队内部开了个小会。大家都是在行业里混了几年的人,对用户、对内容都有自己的理解和经验。我把数据分析的结果、客服反馈的共性、竞品观察到的趋势都摆出来,让大家一起聊。你一言我一语,有人说是不是我们只重视了热门内容,忽略了长尾和垂直领域;有人说是不是我们对内容的审核标准太宽松了,导致劣质内容混进去;还有人提到我们内容抓取的源头是不是太单一了。这几只“经验羊”你一句我一句的,把我们之前的一些模糊猜测都给点透了。
终于“知马”了:问题出在“喂养”上
把这些来自不同“羊”的线索都拼凑起来后,那匹“马”的真面目就逐渐清晰了。我发现,我们的推荐系统之所以不行,根本问题不是算法多高级多复杂,而在于“喂”给算法的“草料”本身就有问题。我们抓取的内容不够新鲜,甚至有些为了数量去凑,导致大量低质量的标题党内容混了进去。这马不是不想跑,是吃得太差,根本没力气跑!
真正的含义,就是你不能只问一只“羊”,更不能傻傻地想直接问那匹“马”而一无所获。你要问好多只不同脾气、不同角度的“羊”,它们从各自的视角给你反馈、给你线索。你把这些零散的线索都收集起来,就像拼图一样,一点点地拼凑,才能最终看出那匹“马”到底哪里出了问题。
改变策略,马儿跑起来了
搞清楚问题后,我们立马调整了策略。不再光是追求推荐内容的数量,而是把重心放在了内容的质量和时效性上。我们调整了内容抓取的策略,增加了内容审核的力度,甚至还尝试跟一些内容创作者合作,获取独家高质量内容。
慢慢地,用户数据就有了起色。大家停留时间越来越长,跳出率也降低了。甚至有用户开始主动给我们留言,说推荐的内容变好看了。那匹“马”终于又跑起来了!
所以说,“问羊知马”这事儿,核心就是告诉你,当你无法直接获取核心信息时,你得学会从不同来源、不同维度的间接信息中去推敲、去归纳。这“几种动物”,就是我们在实践中,获取这些间接信息的不同渠道和方法。真的是,实践出真知!









