今年Tiktok 的 MLE 题目范围和去年差不多也没太大改变,下面把我自己的真实面筋过程跟大家唠唠,希望能给到正在准备的同学一点方向,分享下26 ng 的 Tiktok MLE面试 心得。
Tiktok MLE面试 时间线
岗位:MLE NG (2026 General Hire)
8月初申请 -> 几天后HR reachout并约了
8月20号左右的HR call
9月10号第一轮面试:问了简历上的projects和很简单的算法问题,感觉不是LC题。两天后通知了结果并约了第二轮面试
9月23号第二轮面试:依然简历上的projects + LC binary tree DFS。两天后约了第三轮面试
10月9号第三轮面试:简单自我介绍 + LC没见过但感觉Hard
10月13号HR通知结果,约了HR call。
一周后verbal offer,然后两天后正式offer 整体体验:面试官和HR人都超好,面试流程十分流畅。历经三个月近500道LC后终于尘埃落定!
TikTok MLE面试 :一面
面试流程大概如下: 先是双方自我介绍,接着主要拷打简历,重点问了我之前在国内做的大模型算法项目,这一部分聊得还算顺。 然后是一些偏基础的八股问题,比如 Transformer、位置编码之类,整体难度不高。 接下来问到了多模态 这个阶段其实有点被动:我只有初步了解,而 JD 写的是 CV / NLP / 多模态之一即可,所以当时没有针对多模态做太深入准备,这一段明显聊得不算理想。
Coding 环节有点出乎意料。 没考 LeetCode,而是 ML Coding。 一开始让我写多模态 CLIP 的 loss function,后面面试官把题目换成了更基础的 softmax + cross entropy,两行代码就结束了。
反问环节:聊了一些电商业务和具体的工作内容。 最后我试探性地问了一句: 「如果我之后能来,需要提前补充哪些技能?」 他的回答是: NLP 方向和我之前做的比较接近,多模态可能还需要再学一学。 结束 的时候他说了一句 ”impressive interview experience”
TikTok MLE面试 : 二面
这轮主要有两个部分: 一道coding + 一个看论文讲八股
不得不说,强度很大,需要很强的知识储备。
Coding
leetcode 33 很经典的题目了: 判断哪一部分是有序的,然后二分找 target 就可以了,时间复杂度: O(logn)。
技术问题
从一个论文中截取了其模型的参数以及训练参数:
Transformer 模型: 32 layers、32 heads (64 dimension)、used rotary embedding with dim 32、context length 2048、used flash-attention to speed up
Training details: random init、fixed learning rate、weight decay 0.1、optimizer: Adam、momentum 0.9, 0.98、epsilon 1e-7、use fp16 with DeepSpeed ZeRO Stage2、Batch size 2048、train for 150b tokens
提问
- head 是用来干什么的? multi-head 是什么, 写一下相关的公式. 还有什么别的 attention method?
- rotaty embedding 是什么? 还有别的什么 embedding 方法? rotaty embedding 属于你提到的哪个? 为什么用 rotaty embedding, 好处是什么?
- 如何处理 long distance context?
- Flash-Attention 是什么?
- 为什么用 Adam, 提到的三个参数都是什么意思?
- 为什么用 fixed lr 而不用 warm-up?
- weighted decay 是什么?
- fp16 是什么, 还有别的什么精度数吗?
- DeepSpeed ZeRO Stage 2 是什么
TikTok MLE面试 : HM三面
开始自我介绍5分钟,之后问了三个BQ,比较经典的BQ题目,问你有没有做过超出要求的事?就说你主动优化用户体验的例子,比如我给项目加了个需求里没有的图片裁剪功能,或者主动做了性能优化,让面试官看到你的产品思维。 问你欣赏TT哪个功能,怎么改进?这题是展示你思考深度的时候。挑个具体功能比如Stitch,从用户、社区、商业角度分析一波,再提几个靠谱的改进建议,比如支持多片段拼接。证明你真是深度用户。 最后问Why TikTok?别只说喜欢刷视频。要把你对产品的热爱、对技术挑战的渴望和对公司文化的认同结合起来,讲一个完整的故事。
全是简单的bq,没有八股文,也没有sd,考了一道很偏的编程题:要求写二叉树中序遍历,但要用迭代器(iterator)实现,而且二叉树每个节点包含一个字符串,迭代器需要按照中序遍历的顺序,每次调用next方法返回一个字符。我竭尽全力去做,面试官却不太想让我埋头思考,花了十几分钟一边沟通一边想思路,最后写完主逻辑和迭代器的一部分,面试就结束了,但好在得到了面试官的positive feedback。
这回全过了,剩下的时间和面试官1讨论优化,也比较顺利地通过了。接着就是Q&A,面试官1很耐心地讲了讲组里做的具体业务和tech stack。
面试体验
优点:
- 反馈极快!基本第二天就有结果,不拖泥带水。
- tiktok 给钱很大方,NG总包可以给到 $200k 以上(虽然网友表示股票 vest 政策很不友好)。
后话:Tiktok 在美国科技圈的名声并不好。但是考虑到中国和美国已经是世界唯二的人工智能中心,而 ByteDance 作为国内第一档的互联网公司,我认为有很多锻炼、学习的机会,这也是我明知他们很卷也决定去面试的原因,希望能 tiktok 能加强面试官的培训,重视面试者的体验。
Tiktok 从OA到offer整个流程还是很长的,不过在Interview Aid 团队的面试辅助、辅导等支持下,顺利拿到了tiktok mle 的offer,如果你也需要辅助服务,请与Interview Aid团队联系。