淘宝闪购 AI 应用研发二面,我笑了!!!
面完试走出来,脑子还是嗡嗡的。说实话,面之前我觉得自己准备得还行,结果一个多小时聊下来,才发现好多东西只是知道个皮毛,稍微往深了问问,就开始冒冷汗。趁着记忆还热乎,赶紧把这场面试复盘一下,主要是淘宝闪购 AI 应用研发的实习岗,问题量不小,有些点我觉得挺值得聊聊的。
Agent 项目上线了吗?用的什么框架?
面试官上来就逮着我的项目问。问我那个 Agent 项目到底有没有上线。嗯,还没,只是一个比较完整的 Demo。他接着问有没有用 LangChain 之类的框架。这个我倒是用了,这种框架确实能省不少事,不用从零去拼积木。不过他也提醒我,用框架得清楚它里面到底干了什么,不然出了问题都不知道去哪查。
意图识别那块咋搞的?
这个问题问得很细。我的做法其实不复杂,说白了就是分层处理。先拿规则去拦截那些特别明确、特别简单的指令,比如“帮我查个订单”这种,直接命中关键字就转给对应的工具。复杂一点的、规则搞不定的,再扔给大模型去做语义理解,让它判断用户到底想干嘛。结构大概是这样:
项目里用了哪些工具?怎么提升调用准确率?
工具就是常见的那些,搜索、计算器、查询数据库的接口。准确率这个事,坑挺多的。我最深的体会是,你得把工具的描述写清楚,就跟给一个新人写操作手册一样。参数要干嘛用的、什么格式,最好再给几个例子。大模型它聪明,但也得你“喂”得明白。有时候它不按你的来,不是它笨,是你没说清楚。
知识库怎么搭的?RAG 有哪些分块策略?
知识库这块,我坦白说踩了不少坑。一开始就是无脑把文档按固定长度切,结果发现经常把一句话切得稀碎,检索出来的东西前言不搭后语。后来学乖了,开始用那种有重叠的切法,让上下 chunk 有点重复内容,保证语义是连贯的。面试官还追问了其他策略,我就提了句可以按段落、按标题这种有语义边界的方式去切,效果会好不少。当时没画图,现在想想,一个简单的语义分块对比图应该能说明白:
怎么提升检索的回答准确率?表格和图片怎么处理?
准确率这个问题,光靠切分还不够。我提到用 query 改写,就是用户问的话有时候很口语化,你得把它扩展或者提炼成更适合检索的关键词。检索回来一堆文档后,也别全扔给模型,做个重排序,把最相关的排在前面。至于表格和图片,表格还好,可以解析成 Markdown 或者 JSON 再存,大模型现在读结构化数据的能力不差。图片就头疼一点,一般是用多模态模型把图片内容转成文字描述,再把描述存进知识库。
系统用 ReAct 模式了吗?
用了。ReAct 就像一个总在思考和行动之间反复横跳的循环。模型拿到问题,先“想”一下下一步该干嘛,然后去“做”,观察做出来的结果,再接着“想”下一步。这个循环一直跑到它觉得任务完成了,或者撞到墙(达到最大步数)为止。这个模式处理复杂任务确实稳,比一次性输出靠谱多了。
怎么提升模型回答性能?Prompt 优化方法?
性能这块,能聊的挺多。像缓存,同样的问题就别让模型再算一遍了。Prompt 优化,我主要说了 few-shot,就是在 prompt 里给它塞几个例子,让它照着学。还有思维链,让它把思考过程一步步写出来,尤其是在做逻辑题的时候,准确率能提高不少。
Token 和字符的区别是啥?
这个属于基础题了。字符是我们人眼看到的一个字或字母,Token 是模型处理的最小单元。一个中文字大概就是 1 到 2 个 token,一个英文单词可能被拆成好几个。模型不认识字,只认 token ID。
LangChain 和 LangGraph 简述一下?
LangChain 更像一个链条,你把各种组件串起来,数据从头流到尾,适合那种一步步走的流程。LangGraph 就更灵活了,它是个图结构,你可以定义节点和边,让流程能分叉、能循环,更适合搞那种复杂的、状态很多的 Agent。一个线性思维,一个图思维。
Agent 的常见运行模式?
除了刚才说的 ReAct,还有那种把任务拆成计划再一步步执行的,也有多个 Agent 互相聊天辩论的。核心都是让模型能自主地去调用工具,完成一个目标。
怎么解决 Lost in the middle 问题?
这个问题挺经典。模型读长文本,往往对开头和结尾记得牢,中间的就容易忘。解法嘛,一个是把重要的信息尽量往前放,或者在检索的时候,把最相关的文档片段放在 prompt 的开头和结尾。也可以在做摘要的时候,强制它去关注中间部分。
Prompt 的基本组成结构?
一个完整的 prompt,一般就是给模型设定个角色,告诉它背景是啥,然后下达具体的指令,再给点例子,最后抛出用户的问题。就跟交代下属干活一样,背景、目标、参考、任务,齐活了。
线程池核心参数?进程、线程、协程的区别?HashMap 底层原理?
这几个开发基础题,问得我后背发凉。线程池那几个参数,核心线程数、最大线程数、存活时间、工作队列、拒绝策略,我磕磕巴巴算是说上来了。进程是资源分配的最小单位,线程是调度的最小单位,协程是用户态的轻量级线程,自己管自己切换。HashMap 的底层,数组加链表加红黑树,哈希冲突怎么办,什么时候扩容,这些概念都懂,但被问到一些细节的负载因子为什么是 0.75 时,我还是有点虚。基础不牢,地动山摇啊。
算法:除自身以外数组的乘积
最后来了道算法题。给你一个数组,返回一个新数组,新数组每个位置的值是原数组除了它自己以外所有元素的乘积。要求不能用除法,最好 O(n) 时间复杂度。我用了左右乘积列表的方法,从左到右乘一遍,再从右到左乘一遍,两边结果一乘就是答案。写是写出来了,但手有点抖,边界条件还愣了一下。
反问环节
最后我问了下面试官部门 C 端核心业务是啥,他说主要是围绕手淘的即时零售这块,很多高并发场景。我又问 AI 研发在业务里主要往哪个方向落,他提到智能导购、自动化营销素材生成,还有客服系统的优化。最后我厚着脸皮问对我面试表现有啥建议,面试官笑了笑,说项目深度可以再挖一挖,基础知识,尤其是并发编程那块,得再补补。
这场面试就像一次全方位体检,哪里强哪里弱,照得一清二楚。大模型应用开发,不是光会调个 API、搭个 LangChain 链就完了。底层的原理、工程落地的细节、传统计算机基础的扎实程度,少一样都会在某个瞬间露怯。
如果你也在准备类似的面试,希望这篇复盘能给你一点点帮助。觉得有用的话,点个赞或者转给需要的朋友吧,祝大家面试都少踩点坑。
写在最后
有读者问过我:“这些面经真的是学员复盘的吗?”
是的。每一篇都是真实面试后的复盘,信息源可追溯。
我能做的,就是把那些“面试官问了什么、学员怎么答的、为什么这么答能过”的逻辑拆解清楚,让更多人有章可循。
至于你能不能看懂、能不能内化成自己的东西,那就看你自己了。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋
📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~