浅谈Apache Pig中Eval函数列表函数及描述是什么
Admin 2022-09-29 群英技术资讯 385 次浏览
Apache Pig提供了各种内置函数,即 eval,load,store,math,string,bag 和 tuple 函数。
下面给出了Apache Pig提供的 eval 函数列表。
S.N. | 函数 & 描述 |
---|---|
1 | AVG() 计算包内数值的平均值。 |
2 | BagToString() 将包的元素连接成字符串。在连接时,我们可以在这些值之间放置分隔符(可选)。 |
3 | CONCAT() 连接两个或多个相同类型的表达式。 |
4 | COUNT() 获取包中元素的数量,同时计算包中元组的数量。 |
5 | COUNT_STAR() 它类似于 COUNT() 函数。 它用于获取包中的元素数量。 |
6 | DIFF() 比较元组中的两个包(字段)。 |
7 | IsEmpty() 检查包或映射是否为空。 |
8 | MAX() 计算单列包中的列(数值或字符)的最大值。 |
9 | MIN() 要获取单列包中特定列的最小(最低)值(数字或字符)。 |
10 | PluckTuple() 使用Pig Latin的 PluckTuple() 函数,可以定义字符串Prefix,并过滤以给定prefix开头的关系中的列。 |
11 | SIZE() 基于任何Pig数据类型计算元素的数量。 |
12 | SUBTRACT() 两个包相减, 它需要两个包作为输入,并返回包含第一个包中不在第二个包中的元组的包。 |
13 | SUM() 要获取单列包中某列的数值总和。 |
14 | TOKENIZE() 要在单个元组中拆分字符串(其中包含一组字),并返回包含拆分操作的输出的包。 |
关于“浅谈Apache Pig中Eval函数列表函数及描述是什么”的内容今天就到这,感谢各位的阅读,大家可以动手实际看看,对大家加深理解更有帮助哦。如果想了解更多相关内容的文章,关注我们,群英网络小编每天都会为大家更新不同的知识。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
MapReduce - 读取数据?通过InputFormat决定读取的数据的类型,然后拆分成一个个InputSplit,每个InputSplit对应一个Map处理,RecordReader读取InputSplit的内容给Map。InputFormat决定读取数据的格式,可以是文件或数据库等
用于使用Pig分析Hadoop中的数据的语言称为 Pig Latin ,是一种高级数据处理语言,它提供了一组丰富的数据类型和操作符来对数据执行各种操作。要执行特定任务时,程序员使用Pig,需要用Pig Latin语言编写Pig脚本,并使用任何执行机制
除了内置函数之外,Apache Pig还为 User Defined Function(UDF:用户定义函数)提供广泛的支持。使用这些UDF,可以定义我们自己的函数并使用它们。UDF支持六种编程语言,即Java,Jython,Python,JavaScript,Ruby和Groovy。
负责全局的资源管理和任务调度,把整个集群当成计算资源池,只关注分配,不管应用,且不负责容错 ;以前资源是每个节点分成一个个的Map slot和Reduce slot,现在是一个个Container,每个Container可以根据需要运行
Hadoop可运行于一般的商用服务器上,具有高容错、高可靠性、高扩展性等特点特别适合写一次,读多次的场景适合大规模数据、流式数据(写一次,读多次)、商用硬件(一般硬件);
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008