快上网专注成都网站设计 成都网站制作 成都网站建设
成都网站建设公司服务热线:028-86922220

网站建设知识

十年网站开发经验 + 多家企业客户 + 靠谱的建站团队

量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决

spark-1.6.1安装编译&&sparksql操作hive

maven:3.3.9 

成都创新互联公司专业为企业提供化隆网站建设、化隆做网站、化隆网站设计、化隆网站制作等企业网站建设、网页设计与制作、化隆企业网站模板建站服务,十余年化隆做网站经验,不只是建网站,更提供有价值的思路和整体网络服务。

jdk:java version "1.8.0_51"

spark:spark-1.6.1.tgz

scala:2.11.7

如果scala版本是2.11.x,执行如下脚本

./dev/change-scala-version.sh 2.11

spark默认情况下用scala的2.10.5编译

编译命令如下:

mvn -Pyarn -Phadoop-2.6 -Dhadoop.version=2.6.0 -Phive -Phive-thriftserver -Dscala-2.11 -DskipTests clean package

红色部分为spark-sql链接hive的所需要的依赖,以及指定的scala的版本

注意:hive-site.xml文件需要放到$SPARK_HOME/conf目录下,否则找不到表

运用spark-sql访问hive

package com.infra.codelab.spark.hive
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
object HiveTest {
  val conf = new SparkConf()
  val sc = new SparkContext(conf)
  def main(args: Array[String]): Unit = {
    val sqlContext = new org.apache.spark.sql.hive.HiveContext(sc)
    sqlContext.sql("SELECT line FROM filecontent ").collect().foreach(println)
  }
}

提交任务:

spark-submit --class com.infra.codelab.spark.hive.HiveTest  --master spark://localhost:7077 /home/xiaobin/test/spark/wordcount-0.0.1-SNAPSHOT.jar

spark-sql:

export SPARK_CLASSPATH=$SPARK_CLASSPATH:/home/xiaobin/soft/apache-hive-0.14.0-bin/lib/MySQL-connector-java-5.1.35.jar
spark-sql --master spark://xiaobin:7077
spark-sql> select count(*) from filecontent;
483                                                          
Time taken: 3.628 seconds, Fetched 1 row(s)


新闻名称:spark-1.6.1安装编译&&sparksql操作hive
本文路径:http://6mz.cn/article/pjgpgg.html

其他资讯