什么是小文件问题? HDFS上如果小文件很多,每个小文件都会在NameNode中占用150字节的内存空间 而在MR中每个小文件都会占一个block,每个block都会产生数据分片对应一个Map任务,导致Map任务特别多,消耗了很多启动Map