Shark Hive Spark Hadoop2 进行整合的测试。

首页 > Shark Hive Spark Hadoop2 进行整合的测试。

Shark Hive Spark Hadoop2 进行整合的测试。

本文目的是测试将shark和hadoop2进行整合。

本来打算使用Shark 最新版0.9.0 ，但是官方好像还没有针对与Hadoop2的正式下载地址。（这个要说明一下，官方只提供了源码，并没有找到编译好的0.9.0 for hadoop2 ，也许需要自己编译一个，没有证实）

shark0.9.0 的需要：

Scala 2.10.3
Spark 0.9.0
(Optional) Tachyon 0.4.0
AMPLab’s Hive 0.11

请注意版本要求。

于是查找Shark以前的版本是否有针对与Hadoop2的。发现官方提供了Shark0.7 for Hadoop2的下载，而且是编译好的。

需要：

Spark version to 0.7.3
hive-0.9.0
scala-0.9.3

下载下来，配置shark,hive,spark. 运行spark，hadoop2。最后就可以运行测试了。（这些步骤可以参考这个http://www.cnblogs.com/nb591/p/3644388.html）

运行create table 操作时，报以下错误。

ERROR shark.SharkDriver: FAILED: Hive Internal Error: java.util.NoSuchElementException(null)

java.util.NoSuchElementException

at java.util.HashMap$HashIterator.nextEntry(HashMap.java:796)

at java.util.HashMap$ValueIterator.next(HashMap.java:822)

at org.apache.hadoop.hive.ql.parse.SemanticAnalyzer.genPlan(SemanticAnalyzer.java:6760)

at shark.parse.SharkSemanticAnalyzer.analyzeInternal(SharkSemanticAnalyzer.scala:150)

at org.apache.hadoop.hive.ql.parse.BaseSemanticAnalyzer.analyze(BaseSemanticAnalyzer.java:244)

at shark.SharkDriver.compile(SharkDriver.scala:197)

at org.apache.hadoop.hive.ql.Driver.compile(Driver.java:336)

at org.apache.hadoop.hive.ql.Driver.run(Driver.java:895)

at shark.SharkCliDriver.processCmd(SharkCliDriver.scala:288)

at org.apache.hadoop.hive.cli.CliDriver.processLine(CliDriver.java:406)

at org.apache.hadoop.hive.cli.CliDriver.processLine(CliDriver.java:341)

at shark.SharkCliDriver$.main(SharkCliDriver.scala:203)

at shark.SharkCliDriver.main(SharkCliDriver.scala)

接下来进行了各种尝试来解决，问题依然存在。

最后在shark的讨论组里找到了答案，官方解释是他们发布的tar有问题，晕倒。

https://groups.google.com/forum/#!msg/shark-users/3J6wtFfBx5Q/x1gZdp4nLiUJ

于是尝试使用其他版本，经过测试，使用shark-0.8.1-bin-cdh4，hive-0.9.0-bin，hadoop-2.0.0-cdh4.3.0，spark-0.8.1进行整合，可以正常使用(尝试spark-0.7.3，至进行了简单的操作，也没问题)。

------Done----

知识源于网络 转载请注明出处http://www.cnblogs.com/nb591/p/3642672.html

转载于:https://www.cnblogs.com/nb591/p/3642672.html

更多相关：

linux 启动nacos报错_nacos在Linux上的搭建启动报错

该楼层疑似违规已被系统折叠隐藏此楼查看此楼使用的是MySQL8+，nacos是1.2.1的，在网上翻了很多资料，查了很多博客，也尝试了很多，在nacos文件夹下创建plugins/mysql文件夹并放入MySQL的jar包、在nacos的application.properties的文件中添加MySQL高版本的驱动配置等等等等，但是...
SpringBoot上传文件大小限制

SpringBoot默认上传文件大小不能超过1MB，超过之后会报以下异常： org.apache.tomcat.util.http.fileupload.FileUploadBase$FileSizeLimitExceededException: The field file exceeds its maximum permitte...
spark1.4加载mysql数据创建Dataframe及join操作连接方法问题

首先我们使用新的API方法连接mysql加载数据创建DF import org.apache.spark.sql.DataFrame import org.apache.spark.{SparkContext, SparkConf} import org.apache.spark.sql.{SaveMode, DataFrame...
mybatis-错误记录java.lang.ExceptionInInitializerError

　　今天刚学习mybatis，遇到了一个错误，纠结了半天的时间，所以将发现的问题和解决得方法写一下。　　错误信息如下： java.lang.ExceptionInInitializerErrorat com.ibatis.po.TestSysArea.testInsert(TestSysArea.java:31)at sun.r...
如何理解numpy.nan_to_num

nan 是not a number ,inf是无穷大 numpy.nan_to_num(x): 使用0代替数组x中的nan元素，使用有限的数字代替inf元素...
CUDA Samples目录

简介 Simple Reference 基础CUDA示例，适用于初学者，反映了运用CUDA和CUDA runtime APIs的一些基本概念.Utilities Reference 演示如何查询设备能力和衡量GPU/CPU 带宽的实例程序。Graphics Reference 图形化示例展现的是 CUDA, OpenGL,...
Linux下使用diff和patch制作及打补丁(已经实践可行！)

在做开发的过程中难免需要给内核及下载的一些源码打补丁，所以我们先学习下Linux下使用如如何使用diff制作补丁以及如何使用patch打补丁。...
在CentOS 6.3 64bit上安装Apache Trafficserver 4.2.3挂载SAS硬盘和SSD

我在调研ATS 4.2.3挂载SSD的过程中，遇到很多坑，特此详细记录我摸索的主要过程，以便大家以后避免之。基本思路可以完全照搬参考文献[2][3] 下面的安装假定是以root用户身份进行的，Linux服务器已经安装好系统，磁盘已经做好分区。首先需要认识我们的Linux服务器的硬件配置和软件情况硬件配置： DELL...
C++中stl使用过程中的一些tips

该博文整理一些在使用stl编程过程中遇到的小经验： 1.在多线程环境下面打印调试，如何使用cout及时刷新到屏幕上? 在C中我们经常这样使用： printf("Hello World "); fflush(stdout); 如果使用stl，我们可以这样使用： cout << "Hello World" << endl <...