2022字节跳动数仓实习面经(2、3面、hr面)

x33g5p2x  于2022-03-17 转载在 其他  
字(2.4k)|赞(0)|评价(0)|浏览(486)

字节已经给offer了,今天接着上一篇抖音电商部门的数仓实习生面经,这次面试是2、3面的总结,就放在一起吧。对往期内容感兴趣的同学可以查看如下内容👇:

下面我将对2,3面的问题进行一个总结。

1. 二面问题

  1. 自我介绍
  2. 你在滴滴实习所做的项目?如何分层,分层的作用?
  3. 你们部门的负责的业务板块有什么?
  4. 你了解数据域是什么吗?
  5. 你了解过业务过程吗?
  6. 你觉得你在滴滴所做的数仓属于哪部分业务板块?
  7. 如果数据的维度发生了变化,你应该怎么样处理才能使业务精准还原事件发生的正确维度上?
  8. 你说到了拉链表,但拉链表的回溯麻烦,还有别的方式吗?
  9. 你知道缓慢变化维是什么吗?以及如何处理缓慢变化维度?
  10. 事实表分为几种?每一种事实表的特点是什么?
  11. 了解过数据治理吗?说说你所接触过的数据治理?
  12. 如果要将你在滴滴的部分划分业务板块,数据域,业务过程,你应该如何划分。
  13. sql题:将连续2天登陆的用户的日期显示在同一行内
  14. python:二分查找
  15. 反问

1.1 二面总结

二面的知识点更多倾向于书本上的建模知识,很多数据仓库基本的概念我都没有记的很清楚,感觉被二面面试官摁在地上摩擦,太惨了,全程只能说的出来自己干了啥?却不知道深入了解所做的业务属于数仓的部分,而且对于数仓的概念没有很规范化的回答,算法都是直接秒掉了。

  • 数据建模中的知识概念不清。
  • 没能将自己的项目规整到大数据建模体系。
  • 对数据治理没有统一的描述,想到啥说啥。

2. 三面问题

  1. 自我介绍
  2. 你是自学的,还是学校有教授相关课程?
  3. 介绍一下你在滴滴的项目,说一下你是如何实施的?
  4. 你说到你的数据仓库用到了分层思想,能够简单介绍一下每层的含义吗?
  5. 你这个项目的数据源从何而来?你是如何链接到它的?
  6. 你的数据处理好后是需要送到报表或者业务的系统中去,那么你是如何输送过去的?
  7. 业务那边的oltp数据库是什么?表是你建还是他们建?
  8. 你们的项目表都很小,有没有考虑过分层不需要分那么多层?
  9. 关于bi表报那块维度和指标的设计问题,有没有想过为什么要那么设计?
  10. 说一下你对dwd和dws的理解,为什么这一块要分两层?
  11. 你的项目中维度的设计是什么样的?就拿你的泊车数仓来说?
  12. 你的这些维度来源于哪里,是手动配置,还是系统自动维护的?
  13. 你知道全量表、增量表、拉链表的定义以及他们什么场景下适合使用吗?
  14. 算法题:有一张用户关注的表t1,字段有uid1,uid2让你求出互相关注的用户,最后结果只展示一行
  15. 算法题:leetcode接雨水
  16. 思考题:有8个外形一样的小球和一个天平,有一个小球质量较大,问几次可以找出最大的小球?
  17. inner join、left join 和right join 的区别?
  18. 左表有一条数据,left join 后,会变成更多的数据吗?
  19. 你熟悉spark吗?讲一讲spark的宽窄依赖,以及什么情况会出现这种情况?
  20. flink中的checkpoint机制是怎样的?以及什么时候需要checkpoint和什么时候不需要checkpoint?
  21. flink中的wartermark水位线是怎么样的一种机制,你能和我解释一下吗?
  22. flink中没有window的概念,有的话window有几种,解释一下几种window的含义?
  23. 你在滴滴做项目的时候,有没有碰见特别难的问题?然后是如何解决掉的?
  24. 你除了会数据建模和数据开发,有了解过其他行业的知识吗?你觉得你在工作中还要学习哪些方面的知识?
  25. 反问(问部门批处理多一些还是流处理多一些)

2.1 面试总结

三面面试90分钟,算是很长的面试,从项目、技术和算法题已经一些不是我们数仓研发所做的事情都进行提问,好在我在二面之后,把自己在滴滴实习的事情都进行了数据建模的归纳(涉及企业隐私,我不能放出来),看了2遍大数据建模的书,对一些知识点做了归纳(后面我会发出博客),大幅度提高了自己对业务和建模知识的了解。算法题那块,sql只写出了一半(判断谁关注谁很容易,只展示一行没想出来),接雨水是leetcode困难题,只有想法,写了一半,没想出来。思考题先是用二分查找,对半查,面试官问还有别的方法吗?后面想想用3个3个找更快,回答出来了。

反问阶段,面试官给我说了说他在大数据这么些年,对数据的发展,从硬件到软件的看法,以及各部门的人在做什么工作,未来的发展是什么样子的,做了详细的说明。说的很细致,并且条例清晰,而且面试官说这些东西他很少和别人说。听完之后,我对数仓又有了新的理解。感谢面试官分享这些年的经验。

  • 对建模、大数据原理、编程能力和个人理解方面进行考察
  • 对个人的学习态度、学习方向等考察
  • 传授了多年在数据领域自己的理解和经验。

3.hr面

  1. 自我介绍
  2. 我看你在上一个字节面试中挂了,你又没有想过原因?
  3. 说一下你在滴滴实习过程中学到了什么?
  4. 你在上一段实习遇见的困难是什么?最后如何处理?
  5. 能否长期实习?有转正的意向吗?
  6. 你觉得你和别人相比,转正的优势是什么?
  7. 你是如何学习的,以及如何解决难题?
  8. 说一下你的优点和缺点?
  9. 什么时候能入职?
  10. 反问(我这里啥都不想问)

3.1 面试总结

hr面也是认认真真的自我介绍,hr面也是会问你做的项目,hr会问你的优点和缺点,最后反问阶段,我什么都不想问,然后hr说,你不好奇薪资待遇吗?我突然忘了这个了,应该和滴滴差不多吧?然后面试官说了个数,以及说了房补。其实我特别好奇3个面试官对我的评价是什么?都是闲聊,后面说会打电话和我沟通入职的具体细节。

4. 总结

今年好像没有了金三银四,有点卷了,但也应该多参加面试,对自己的进步的确是太大了,从面算法、大数据开发、数仓架构等等岗位面试,让我对大数据体系架构有了一定的理解,从面试中总结自己的不足,是一个很好的提升自己的手段。大家千万不要等到觉得自己100%准备好了,才能去面试,其实不是的,面试和提升是一个相互的过程。

相关文章