成长日志：安逸后的一击（2019-08-15）_小言_互联网的博客

成长日志：安逸后的一击（2019-08-15）

2021-01-29 08:58 767人阅读评论(0)

今天是个好日子，通过猎聘网上的简历去到LC公司应聘，在近80分钟时间内把自己毕业2年后，一直存在傲慢和不服气都通通反射回来，仿佛另一个平行世界的自己在面试当前世界的自己，心底嘲笑道：“就你这三脚猫功夫，哪来的勇气折腾？”，把自己读研时候的初心和当前处境硬生生地比对。

我不会怪那个面试官，因为那个面试官跟我三年前因不同选择而造就出的“我”何其相似，如果我当时选择去北上广或者别的非郑州城市，现在的我也会像他一样因为自己的广泛工作经验，丰满的加班经历，并且只能接受自己总结的知识体系而洋洋得意；

生活没有如果，我还是我，我只能是现在的我，因为选择z而成为一个当前的“我”，还是一个永不满足的“我”。现在的“我”，安于现状、不思进取、浮躁而又烦躁，两年的时间学到的东西可以压缩在一年内，我不满足自己！

感谢今天自己的勇气，感谢让我闻到的郑州尚有的一丝技术气息，这可能是我近两年真正所期待的自己能力的一次摸底考试，感谢自己一直没放弃过进步和学习，至少我看见了自己的不足和可以改善的地方，目标轻易可以实现；

接下来的自己必须兼顾工作责任和能力的提升，必须侧重于实操能力的提升，做到真正的强大，强大到别人无可企及的地步，强大到自己也无法接受自己如此明显的能力提升，强大到傲视郑州的大数据圈子；

强大的定义：

包含大数据知识体系的丰富
自我表达能力的提升
全局的掌控能力
强大的心理承受能力

丰富的大数据知识体系：不管承认与否，我目前的涉及到的知识偏于hadoop，ETL和kafka组件的运维，**关于组件的源码远离和使用了解甚少；**懂得RDBMS和sql语句，但无法说出大数据仓库的建模体系和数据治理体系，完全没有真正的接触实时需求开发，开发能力及其欠缺，包括伴随着需求的承压能力，所有接触到的东西捣鼓力度不够；

自我表达能力提升：自我表达能力的基础是自我的表达体系的形成，无论是平时的沟通还是较官方的表述及知识的总结，表达之前要提前明白对方想知道什么；

全局的掌控力：正如我现在的生活，掌控力逐渐没有，迷恋游戏，完全失去对生活、工作、心态的修复和扭转能力，掌控所有的前提是能够预料全局实物的发展方向，并顺势而为，做能够改变整个局势的关键一步；

心理承受能力：心理承受能力很差，差到不能顺利地表达自我，无论是何种局势，坚定自己是对的，深度自信的基础才能有硬核的表现；

公司一：先登记个表，关于基本信息的；

1.自我介绍下自己？

2.为什么想要离职当前公司？

3.流处理的数据都是哪一类数据，从哪里来？如何汇聚的？客户端如何埋点的？

4.每天处理数据量多大？压缩比？

5.针对kafka介绍一下它的原理和作用？

6.除了解耦和存储，kafka最主要实现了什么？kafka的分区和备份机制？leader的作用？leader挂了以后如何选举？

7.zookeeper是什么？它的原理和作用？

8.为什么使用spark而不是flink？两者相比较而言flink有哪些优势，又有哪些缺陷？

9.编程题：一个n阶的阶梯，每次可以走一步和两步，如果走上阶梯，总共几种走法？

10.思考题：如果给你一个大于100g的文本大文件，每一行是逗号分隔的字段，如何实现数据统计？

11.如果硬件资源有限，请问同样的问题如何实现数据的统计？

12.spark和Hadoop两者相比较而言的区别是什么？

13.hive和hbase使用场景的区别是什么？为什么hbase的查询更加高效？

14.对于公司了解吗？有什么问题？

15.storm和flume？

公司二的面试问题：

0.为什么想要离职当前公司？

1.画出你们公司当前的大数据技术架构图；

2.看你接触过kafka相关，介绍一下kafka工作原理；

3.如果让你设计一个消息系统，你该如何实现？kafka是如何设计的？

4.公司kafka集群规模怎么样，你都做过哪些硬件和OS层优化？

5.什么是状态管理？flink的状态管理分为哪几种和区别？flink如何做到精准一次语义？

6.kafka的分区和备份机制？

7.cdh的版本？为什么要用这个版本，对应spark版本？

8.flink的部署模式，flink session和客户端模式的区别？

9.Java中的string buffer和string bulidier及区别。什么是线程安全？Java中线程有几种方式？Java的list容器的基本概念和分类区别？Java的引用类型？Java的值传递和引用传递？队列和数组区别？

10.spark和Hadoop的区别？spark写磁盘操作何时进行？

11.什么是shuffle，shuffle的目的是什么？分布式概念的宗旨是什么？

12.hbase在现有大数据架构中的使用场景？

13.数据仓库的技术选型和设计思路？

14.数据治理的几种模式，介绍一下血缘关系模型吗？

15.是否做过基于分布式数据集的数据分析？

接下来的计划：

1、rpc编程；
2、zookeeper原理和深入学习；
3、hbase原理和深入学习；
4、spark 和flink的应用实践；
5、分布式计算和存储原理；

转载：https://blog.csdn.net/yezonggang/article/details/99675910

查看评论

小言_互联网的博客

小言_互联网的博客

个人资料

文章分类

文章存档

阅读排行

评论排行

推荐文章

成长日志：安逸后的一击（2019-08-15）

* 以上用户言论只代表其个人观点，不代表本网站的观点或立场