hive自带的函数有哪些-常见问题-PHP中文网

hive自带的函数有哪些

(*-*)浩

发布： 2019-12-21 10:55:05

原创

3775人浏览过

hive自带的函数有哪些

Hive的内置函数

定义： （推荐学习：phpstorm）

UDF(User-Defined-Function)，用户自定义函数对数据进行处理。
UDTF(User-Defined Table-Generating Functions) 用来解决 输入一行输出多行(On-to-many maping) 的需求。
UDAF(User Defined Aggregation Function)用户自定义聚合函数，操作多个数据行，产生一个数据行。

登录后复制

用法：

1、UDF函数可以直接应用于select语句，对查询结构做格式化处理后，再输出内容。

2、编写UDF函数的时候需要注意一下几点：

a）自定义UDF需要继承org.apache.hadoop.hive.ql.UDF。

b）需要实现evaluate函。

c）evaluate函数支持重载。

hive的本地模式：

大多数的Hadoop job是需要hadoop提供的完整的可扩展性来处理大数据的。

WiseHome家政预约小程序

家政服务平台系统包含家用电器安装清洗、搬家、家电维修、管道疏通、月嫂保姆、育儿陪护、上门开锁等多种服务项目，用户可以直接通过家政小程序咨询，在线预约服务类型，同时还设置有知识科普，给用户科普一些清洁保养小技巧，让用户能够足不出户就可以直接预约服务，方便又快捷。本项目使用微信小程序平台进行开发。使用腾讯专门的小程序云开发技术，云资源包含云函数，数据库，带宽，存储空间，定时器等，资源配额价格低廉，无需

查看详情

不过，有时hive的输入数据量是非常小的。在这种情况下，为查询出发执行任务的时间消耗可能会比实际job的执行时间要多的多。

对于大多数这种情况，hive可以通过本地模式在单台机器上处理所有的任务。对于小数据集，执行时间会明显被缩短。

如此一来，对数据量比较小的操作，就可以在本地执行，这样要比提交任务到集群执行效率要快很多。

配置如下参数，可以开启Hive的本地模式：

hive> set hive.exec.mode.local.auto=true;(默认为false)

登录后复制

当一个job满足如下条件才能真正使用本地模式：

job的输入数据大小必须小于参数：hive.exec.mode.local.auto.inputbytes.max(默认128MB)

job的map数必须小于参数：hive.exec.mode.local.auto.tasks.max(默认4)

job的reduce数必须为0或者1

以上就是hive自带的函数有哪些的详细内容，更多请关注php中文网其它相关文章！

大家都在看：

圆通快递官方入口不需要登录在线查询入口快速查询 5G和6G的连接密度有什么区别 6G每平方公里能连接多少设备邮编号码查询app有哪些_邮编号码查询推荐app及使用体验 cad多段线和直线的区别比较CAD中多段线与直线的不同之处快递优选如何查优选物流_快递优选专属物流渠道查询与配送时效