2023年vivo推出蓝心小V智能助手,并在2025年6月升级DeepSeek-R1,通过大模型能力实现个性化内容推荐。为探讨相关技术细节,在7月25-26日深圳举办的DA数智技术大会上,vivo人工智能部算法工程师梁天安分享了蓝心小V的推荐系统优化实践经验。
问答后推荐的核心挑战在于Item内容生成
与传统信息流或电商推荐不同,问答后的相关问题需实时生成候选Item,依赖对话上下文推断用户意图,存在意图瞬时性和话题跳跃性等难点。同时,问题质量评估缺乏明确指标,需关注相关性、实用性、多样性等主观维度。
从单模型输出到完整推荐链路演进
初期蓝心小V使用单一LLM生成推荐结果,面临生成质量不稳定、推荐内容多样性不足的问题。随后引入召回、排序、重排模块,构建完整的推荐体系以支撑后续优化。
SFT/DPO用于对齐用户偏好与语义逻辑
主要目标包括:
生成控制策略保障内容质量
离线评估建设兼顾相关性与安全性
初期依靠规则评估如相似度得分和多样性计算,但存在准确性和与线上效果脱节问题。现采用LLM作为判别器计算Reward得分,使离线评估与实际收益更贴近。
资源平衡与模型部署策略
在移动端应用中,采用INT8量化、Prefix Cache和KVCache缓存等技术降低延迟与显存消耗,有效提升服务器QPS承载能力。
未来技术方向聚焦RM评估优化与多模态落地
当前最大瓶颈包括:
– 离线评估体系不完善,难以精准预测线上表现;
– 相关性与多样性之间难以取得稳定平衡。
计划探索方向:
此外,随着多模态大模型(LMM)的发展,vivo将持续拓展其在手机端感知与服务推荐的应用边界,例如用户出行、一键问屏等新场景。