前言 最近对SparkSql的执行流程有更全面的了解,故写下本文以备后用。 首先一图流: 资料转载自: https://www.iteblog.com/archives/2561.html https://www.iteblog.com/archives/2562.html https://www.iteblog.com/archives/2563…
一、为什么要用数据仓库?mysql不好吗?mysql和hive的区别 1、mysql、hadoop和hive mysql是关系型数据库,与之对应的是其实应该是HDFS,数据仓库。 hadoop是分布式计算的开源框架,包含HDFS,hive,Hbase。 hive是基于hadoop的一个数据仓库工具,本质是工具。提供SQL查询功能,HiveSQL会转…