about云开发

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 272|回复: 0

[技术题无答案] 注册免费送体验金平台

[复制链接]

101

主题

39

听众

39

收听

版主

Rank: 7Rank: 7Rank: 7

积分
1614
发表于 2018-11-7 16:03:35 | 显示全部楼层 |阅读模式
1,mapreduce的运行流程
2,hdfs读写流程
====下载文件流程
1,想namenode申请下载文件
2,返回目标文件的元数据
3,向namenode申请建立连接,读取block1(读入socketinputstream写的是fileoutputstream)
4,datanode上进行传输数据(fileputstream,socketoutputstream)
====文件上传流程
1,想namenode请求上传文件
2,namenode相应可以上传文件
3,想namenode进行RPC通信,请求上传第一个block,请求返回datanode
4,返回namenode所在的ip
5,请求建立block传输通道channel
3,日志流清洗多少个mapreduce串联
4,hive的比较,比如join   group by
5,hbase的操作api
6,hbase和mysql的区别(非关系型数据库 和  非关系型数据库的区别)
7,spark的workcount执行流程
8,线程的实现方式
9,就收数据为啥用kafka
10,线程和进程的区别从操作系统层面说
11,排序算法有哪些
12,jvm收集器有哪些
13,内存是怎么分配的
##############################################################################################
1.关系型数据库能够集群为啥还要用非关系型数据库呢,如mysql和hbase
2.数据采集为什么不直接采集到hdfs而是采集到kafka里面?
##############################################################################################

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条

QQ|小黑屋|about云开发-学问论坛|社区 ( 京ICP备12023829号

GMT+8, 2018-11-15 04:22 , Processed in 0.340078 second(s), 32 queries , Gzip On.

Powered by Discuz! X3.2 Licensed

快速回复 返回顶部 返回列表