小言_互联网的博客

成长日志:安逸后的一击(2019-08-15)

398人阅读  评论(0)

 今天是个好日子,通过猎聘网上的简历去到LC公司应聘,在近80分钟时间内把自己毕业2年后,一直存在傲慢和不服气都通通反射回来,仿佛另一个平行世界的自己在面试当前世界的自己,心底嘲笑道:“就你这三脚猫功夫,哪来的勇气折腾?”,把自己读研时候的初心和当前处境硬生生地比对。

 我不会怪那个面试官,因为那个面试官跟我三年前因不同选择而造就出的“我”何其相似,如果我当时选择去北上广或者别的非郑州城市,现在的我也会像他一样因为自己的广泛工作经验,丰满的加班经历,并且只能接受自己总结的知识体系而洋洋得意;

 生活没有如果,我还是我,我只能是现在的我,因为选择z而成为一个当前的“我”,还是一个永不满足的“我”。现在的“我”,安于现状、不思进取、浮躁而又烦躁,两年的时间学到的东西可以压缩在一年内,我不满足自己!

 感谢今天自己的勇气,感谢让我闻到的郑州尚有的一丝技术气息,这可能是我近两年真正所期待的自己能力的一次摸底考试,感谢自己一直没放弃过进步和学习,至少我看见了自己的不足和可以改善的地方,目标轻易可以实现;

 接下来的自己必须兼顾工作责任和能力的提升,必须侧重于实操能力的提升,做到真正的强大,强大到别人无可企及的地步,强大到自己也无法接受自己如此明显的能力提升,强大到傲视郑州的大数据圈子;

 强大的定义:

  1. 包含大数据知识体系的丰富
  2. 自我表达能力的提升
  3. 全局的掌控能力
  4. 强大的心理承受能力

丰富的大数据知识体系:不管承认与否,我目前的涉及到的知识偏于hadoop,ETL和kafka组件的运维,**关于组件的源码远离和使用了解甚少;**懂得RDBMS和sql语句,但无法说出大数据仓库的建模体系和数据治理体系,完全没有真正的接触实时需求开发,开发能力及其欠缺,包括伴随着需求的承压能力,所有接触到的东西捣鼓力度不够;

自我表达能力提升:自我表达能力的基础是自我的表达体系的形成,无论是平时的沟通还是较官方的表述及知识的总结,表达之前要提前明白对方想知道什么;

全局的掌控力:正如我现在的生活,掌控力逐渐没有,迷恋游戏,完全失去对生活、工作、心态的修复和扭转能力,掌控所有的前提是能够预料全局实物的发展方向,并顺势而为,做能够改变整个局势的关键一步;

心理承受能力:心理承受能力很差,差到不能顺利地表达自我,无论是何种局势,坚定自己是对的,深度自信的基础才能有硬核的表现;

公司一:先登记个表,关于基本信息的;

1.自我介绍下自己?

2.为什么想要离职当前公司?

3.流处理的数据都是哪一类数据,从哪里来?如何汇聚的?客户端如何埋点的?

4.每天处理数据量多大?压缩比?

5.针对kafka介绍一下它的原理和作用?

6.除了解耦和存储,kafka最主要实现了什么?kafka的分区和备份机制?leader的作用?leader挂了以后如何选举?

7.zookeeper是什么?它的原理和作用?

8.为什么使用spark而不是flink?两者相比较而言flink有哪些优势,又有哪些缺陷?

9.编程题:一个n阶的阶梯,每次可以走一步和两步,如果走上阶梯,总共几种走法?

10.思考题:如果给你一个大于100g的文本大文件,每一行是逗号分隔的字段,如何实现数据统计?

11.如果硬件资源有限,请问同样的问题如何实现数据的统计?

12.spark和Hadoop两者相比较而言的区别是什么?

13.hive和hbase使用场景的区别是什么?为什么hbase的查询更加高效?

14.对于公司了解吗?有什么问题?

15.storm和flume?

公司二的面试问题:

0.为什么想要离职当前公司?

1.画出你们公司当前的大数据技术架构图;

2.看你接触过kafka相关,介绍一下kafka工作原理;

3.如果让你设计一个消息系统,你该如何实现?kafka是如何设计的?

4.公司kafka集群规模怎么样,你都做过哪些硬件和OS层优化?

5.什么是状态管理?flink的状态管理分为哪几种和区别?flink如何做到精准一次语义?

6.kafka的分区和备份机制?

7.cdh的版本?为什么要用这个版本,对应spark版本?

8.flink的部署模式,flink session和客户端模式的区别?

9.Java中的string buffer和string bulidier及区别。什么是线程安全?Java中线程有几种方式?Java的list容器的基本概念和分类区别?Java的引用类型?Java的值传递和引用传递?队列和数组区别?

10.spark和Hadoop的区别?spark写磁盘操作何时进行?

11.什么是shuffle,shuffle的目的是什么?分布式概念的宗旨是什么?

12.hbase在现有大数据架构中的使用场景?

13.数据仓库的技术选型和设计思路?

14.数据治理的几种模式,介绍一下血缘关系模型吗?

15.是否做过基于分布式数据集的数据分析?

接下来的计划:

1、rpc编程;
2、zookeeper原理和深入学习;
3、hbase原理和深入学习;
4、spark 和flink的应用实践;
5、分布式计算和存储原理;


转载:https://blog.csdn.net/yezonggang/article/details/99675910
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场