SparkSQL 基本可以取代 hive 了?
互联网时代,数据源变得越来越丰富,出现了大量非结构化数据,互联网的在线特性也将业务需求推向了实时化。实时推荐系统、搜索系统、交互式用户行为分析系统成为各大互联网企业的重点技术项目。而Spark 作为同时支持大数据和人工智能的统一分析平台,成为目前实时流计算的不二选择,甚至有社区的大佬直言:感觉 SparkSQL 基本可以取代 hive 了!近些年,Spark 更是这些大厂面试时筛选人才的重要考核点。但由于Spark技术栈相对复杂,它的功能既强大又丰富,因此掌握起来尤其困难。很多初入大数据开发这一方向的人,一...