中體駿彩大數據面試題

中體駿彩

中體駿彩大數據面試題

 

1.HDFS 客戶端首先下面哪個程序獲取數據信息()

a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker

2.HDfS中的block 默認保存幾份()

a)3份b)2份c)1份d)不確定

3.下列哪個程序通常與NameNode 在一個節點啓動()

a)SecondaryNameNode b)DataNode cTaskTracker dlobtracker

4.Client端上傳文件的時候下列哪項正確()

a)數國經過NameNode 傳遞給DataNode

b)Client端將文件切分爲Block.依次上傳

c)Client只上傳數據到一臺DataNode,然後由NameNode 負責Block 複製工作

5.下面與HDFS類似的框架是()

a)TFS b)T32

c)GFS d)EXT3

6.下列哪項通常是集羣的最主要瓶頸()

a)CPU b)網絡 c)磁盤 IO d)內存

7.關於SecondaryNameNode哪項是正確的()

a)它是NameNode的熱備

b)它對內存沒有要求

c)它的目的是幫助NameNode 合併編輯日誌,減少NameNode 啓動時間

d)SecondaryNameNode應與NameNode部署到一個節點

8.配置機架感知的下面哪項正確()

a)如果一個機架出問題,不會影響數據讀寫

b)寫入數據的時候會寫到不同機架的DataNode中

c)MapReduce會根據機架獲取離自己比較近的網絡數據

9.HBase來源於哪篇論文()

A)TheGoogle File System

B)MapReduce

C)BigTable

D)Chubby

10.HBase數據存儲底層是()

A)HDFS

B)Hadoop

C)Memory

D)MapReduce

11 HBase消息通信機制是()

A)Zookeeper

B)Chubby

C)RPC

D)Socket

12下面所選項正確描述了HBase的特性()

A)高可靠性 B)高性 C)面向列 D)可伸縮

13 LSM含義是()

A)日誌結構合併樹

B)二叉樹

C)平衡二叉樹

D)長平街二叉樹

14、下面對LSM結構描述正確的是()

A)順序存儲

B)直接寫硬盤

C)需要將數據flush到磁盤

D)是一種搜索平衡樹

15 LSM結構的數據首先存儲在()

A)硬盤上

B)內存中

C)磁盤陣列中

D)閃存中

16.HFle數據格式中的DaA)字段用於()

A)存儲實際的KeyValue數據

B)存儲數據的起點

C)指定字段的長度

D)存儲數據塊的起點

17.HFile數據格式中的KeyVaue 數據格式中Value部分是()

A)擁有複雜結構的字符串

B)字符串

C)二進制數據

D)壓縮數據

18.關於HBase二級索引的描述,哪些是正確的()

A)核心是倒排表

B)二級索引概念是對應Rowkey這個「一級」索引

C)二級索引使用平衡二叉樹

D)二級索引使用LSM結構

19.下列關於Bloom Filter 的描述正確的是()

A)是一個很長的二進制向量和一系列隨機映射函數

B)沒有誤算率

C)有一定的誤算率

D)可以在Bloom Flter中刪除元素

20.請列出hadoop的進程名稱和其功能

21.一個datanode宕機,怎麼一個流程恢復

22.用mapredce怎麼處理數據傾斜問題

23.hive內部表和外部表的區別,生產環境中爲什麼建議使用外部表

24.Spark應用執行的流程流程

大數據培訓

相關文章
相關標籤/搜索