网站Logo 有一本小书
首页
全部
瞬间
友链
足迹
关于
登录
Hive Sql操作

Hive Sql操作

hive数据库的DDL 本地模式开启 set hive.exec.mode.local.auto=true; //开启本地mr //设置local mr的最大输入数据量,当输入数据量小于这个值时采用local mr的方式,默认为134217728,即128M set hive.exec.mod

2025-04-09
15
0
Hive Sql操作

scala 处理Spark数据

package JT import org.apache.spark.sql.{SaveMode, SparkSession} import org.apache.spark.sql.functions.lit import org.joda.time.LocalDate object jing

2025-04-09
17
0
scala 处理Spark数据
scala 处理Spark数据
spark基础概念

spark基础概念

spark特点: 1.速度快 2.简单易用,支持的api多 3.各个模块基于sparkcore通用 4.运行模式多 (standalone,yarn,mesos,local) saprk快是数据结果从磁盘转到内存,如果需要下一次计算就从内存取就行了 spark基于JVM的,python是解释性语言需

2025-04-09
20
0
spark基础概念

利用scala清洗hive数据

// 清洗数据 创建sparksession val spark = SparkSession .builder() .appName("数据清洗服务") .master("local[*]") .config("hive.metastore

2025-04-08
8
0
利用scala清洗hive数据
利用scala清洗hive数据