头条大数据技术岗位面试真题

 行业新闻     |      2023-02-27 08:28

AOA官方入口 - AOA体育官网(中国)

本文摘要:头条面试题学长11)技术框架部门: (1)会凭据面试者简历上的技术点举行考察。注意技术点形貌用词,不要随便用熟悉,以为特别熟的可以说熟练使用 (2)常用的大数据框架是肯定会问的,好比Hive、Spark、Kafka等。

AOA官方入口

头条面试题学长11)技术框架部门: (1)会凭据面试者简历上的技术点举行考察。注意技术点形貌用词,不要随便用熟悉,以为特别熟的可以说熟练使用 (2)常用的大数据框架是肯定会问的,好比Hive、Spark、Kafka等。常见的如Kafka精准消费问题的多种解决措施对比,Spark的Task调理规则 (3)有些面试官会直接让讲相识的框架最底层实现 (4)Java,MySQL,Redis必问,JVM,Hashmap,JUC相关,MySQL的索引及优化,Redis数据结构、集群、缓存淘汰 (5)常见的协议会考,租约协议,quarum原理,Zookeeper选举,acid,acp,base等2)项目部门: (1)一般会让你挑你最熟的一个项目讲。考察从项目配景到实现的把控 (2)重点是到场的部门,遇到的难点 (3)常见业务难题的解决和优化,层层递进,头条追求做到极致 (4)没有做过的项目、模块不要乱讲,容易被问懵逼或者被太简朴被藐视3)算法部门: (1)数据结构必考,手写代码,每一面都市考。

常见数组、链表、二叉树、跳表的题。有些部门会先笔试(电脑实际编码运行)再面试 (2)算法部门常见动态计划、概率题、二进制一类 (3)SQL题目,行列转换。分区函数,统计一连登陆天数这一类问题 (4)多刷Leetcode,题都是有套路的4)HR部门: (1)想好跳槽理由,一般注重抗压能力和稳定性 学长21)技术部门(1)WordCount的实现历程(2)MR与Spark的区别(3)Spark在Client与在集群运行的区别(3)相同的SQL在HiveSql与SparkSQL的实现中,为什么Spark比Hadoop快(4)自界说UDF(5)设计HBase表需要注意的点(6)HBase的hlog(7)数据同样存在HDFS,为什么HBase支持在线查询(8)数据从Hive中用SparkSql举行操作有遇到什么问题?类似兼容性的问题。

(9)SparkStream与Strom,Flink与什么区别(10)有三个map,一个reduce来做top10,哪种方法最优。数据量特别大。2)项目的架构(1)数据堆栈的模型设计(2)数据堆栈的数据清洗(3)业务建模、数据分析方法。

(4)数据堆栈是怎么设计的(5)数仓规范设计哪些方面(字段、维度,存储压缩、数据保留机制)(6)数仓质量怎么监控(数据质量治理系统,主键唯一、非空、数据颠簸)(7)数仓主体分哪些(根据公司业务归类:申请单、客户信息、条约信息、放款、还款、余额、逾期等)(8)数仓拉链表的原理(9)有没有遇到数据倾斜的问题(场景、解决方式)(10)数仓重点调理任务的保障方式(调理系统优先级)(11)数仓任务报错和监控(调理系统捕捉错误,电话短信见告值班人员)学长31)技术部门(1)自我先容(2)写map-reduce,两份数据,一份是设备id+用户id,一份是设备id+点击的广告+点击时间,找出每个用户id天天10条最新的广告点击记载(3)说下多线程和多历程(4)fork下令2)算法部门(1)hashmap和map,hash实现原理(hashmap基于哈希,查找O(1);map基于树,查找O(logn);hash实现接纳数组,偏移地址使得查找满足O(1),无论是在哈希还是链表法解决冲突,都需要存储key和value)学长4(1)MySQL引擎是什么,常用的是哪个innodb,知道原理吗(2)MySQL优化,怎么建索引?选择合适的字段属性。对于某些文本字段可以设成ENUM类型(MySQL中被当做数值型数据来处置惩罚)。使用毗连join取代子查询。

使用索引:innodb支持哈希索引、b+树索引、全文索引。BTree和B+Tree (3)手写sql...user_id login_date1 20200325查询出用户一连三天登录的用户 表A 字段a 值1234表B 字段b 值11235Join 输出的效果Left join 输出的效果 (4)Sqoop导入数据是增量怎么实现(5)Flume事务实现(6)Kafka消费者角度思量是拉取数据还是推送数据(7)Kafka中的数据是有序的吗(8)Kafka数据推送失败怎么处置惩罚(9)Kafka保证生产者精准一次(10)没有接受到ack才会泛起声明情况(11)Kafka数据重复怎么处置惩罚(12)Spark Streaming怎么内里实现精准一次消费(13)如果offset没有发送乐成数据会怎样(14)Hive的优化,项目中怎么优化的(我说了join的一些优化)(15)然后就问了用MR怎么实现join,手写代码(16)数据倾斜怎么处置惩罚的,(17)遇到过oom情况吗,什么原因导致的,怎么处置惩罚的(18)Hbase有哪些组件,(19)什么场景会用到Hbase(20)Hbase的读写流程,或许说一下(21)Spark,任务提交的流程,(22)Spark的两种焦点Shuffle,未优化的和优化的(23)常用的数据结构都有哪些,怎么实现一个list,怎么实现一个mapmap一般什么场景使用用过树这种结构吗,什么场景用到的(24)算法字符串中第一个泛起三次且仅泛起三次反转一个链表两个链表第一次交织的节点,(25)用Cannal监控mysql之后,Scala怎么通过SparkStreaming去消费的(26)你们这个项目spark盘算完之后存HBase怎么设计的(27)HBase你们在项目中怎么设计rowkey的。


本文关键词:头条,大,数据,技术,岗位,面试,真题,头条,面,AOA官方入口

本文来源:AOA官方入口-www.linglonglexue.com