前言
到目前为止,我们已经对HDFS、MapReduce和YARN有了一定的认识,能够使用HDFS客户端与HDFS集群进行交互,例如上传、下载、追加文件,并且了解了HDFS中NameNode、DataNode的基本作用;也能够编写一些常见的MapReduce程序,提交到YARN上运行,并根据实际情况进行一些调优。可以这样说,我们已经达到了基本能够熟练使用框架的阶段了,但是这远远不够。要掌握一个框架,不仅仅是会用,还需要了解其底层的运行原理。在接下来的一些文章中,我们将会从底层对HDFS框架进行深入学习,掌握其底层运行机制,并在必要时进行源码剖析。