Linux文本处理三剑客：awk（内置函数详解笔记）

2024-07-18 06:21| 来源: 网络整理| 查看: 265

Linux系统中，AWK 是一个非常强大的文本处理工具，它的内置函数使得对文本数据进行处理更加高效和便捷。

本文将介绍 AWK 内置函数的几种主要类型：

算数函数字符串函数时间函数位操作函数其他常用函数

我们将使用一个示例文本文件来演示这些函数的用法，并提供详细的注释说明，继续分享。

基础学习，可以回头查看：Linux文本处理三剑客：awk（结构化命令）

1.算数函数函数名功能参数示例输出atan2(y,x)返回正切值 y/x 的角度值，角度以弧度为单位y, xatan2(10, -10) * 180 / PI135cos(expr)返回 expr 的余弦值，输入参数以弧度为单位exprcos(60 * PI / 180.0)0.5exp(expr)返回自然数 e 的 expr 次幂exprexp(5)148.413159int(expr)返回数值 expr 的整数部分exprint(5.12345)5log(expr)计算 expr 自然对数exprlog(5.5)1.704748rand返回一个大于等于 0 小于 1 的随机数-rand()0.237788sin(expr)返回角度 expr 的正弦值，角度以弧度为单位exprsin(30 * PI / 180)0.5sqrt(expr)计算 expr 的平方根exprsqrt(1024.0)32srand([expr])使用种子值生成随机数exprsrand(10)1417959587

注释:

以上表格仅列出了 AWK 提供的内置算术函数。算术函数的参数必须是数值。算术函数的返回值是数值。 # 反正切函数 awk 'BEGIN { PI = 3.14159265 x = -10 y = 10 result = atan2 (y,x) * 180 / PI; printf "对于 (x=%f, y=%f)，反正切值为 %f 度\n", x, y, result }' # 余弦函数 awk 'BEGIN { PI = 3.14159265 param = 60 result = cos(param * PI / 180.0); printf "%f 度的余弦值为 %f\n", param, result }' # 自然指数函数 awk 'BEGIN { param = 5 result = exp(param); printf "%f 的自然指数值为 %f\n", param, result }' # 取整函数 awk 'BEGIN { param = 5.12345 result = int(param) print "Truncated value =", result }' # 自然对数函数 awk 'BEGIN { param = 5.5 result = log (param) printf "log(%f) = %f\n", param, result }' # 随机数函数 awk 'BEGIN { print "Random num1 =" , rand() print "Random num2 =" , rand() print "Random num3 =" , rand() }' #正弦函数 awk 'BEGIN { PI = 3.14159265 param = 30.0 result = sin(param * PI /180) printf "The sine of %f degrees is %f.\n", param, result }' # 平方根函数 awk 'BEGIN { param = 1024.0 result = sqrt(param) printf "sqrt(%f) = %f\n", param, result }' # 设置随机数种子 awk 'BEGIN { param = 10 printf "srand() = %d\n", srand() printf "srand(%d) = %d\n", param, srand(param) }'

2.字符串函数函数名功能参数示例输出asort(arr, [d [, how]])使用 GAWK 值比较的一般规则排序 arr 中的内容arr, d, howasort(arr)-asorti(arr, [d [, how]])对数组的索引排序arr, d, howasorti(arr)-gsub(regexp, replacement [, target])全局替换子串regexp, replacement, targetgsub("World", "Jerry", str)Hello, Jerryindex(str, sub)检测子串是否存在str, subindex(str, subs)5length(str)返回字符串长度strlength(str)16match(str, regex)搜索与正则表达式匹配的子串str, regexmatch(str, subs)5split(str, arr, regex)分割字符串str, arr, regexsplit(str, arr, ",")One, Two, Three, Foursprintf(format, expr-list)按指定格式构造字符串format, expr-listsprintf("%s", "Hello, World !!!")Hello, World !!!strtonum(str)将字符串转换为数值strstrtonum("123")123sub(regex, sub, string)执行一次子串替换regex, sub, stringsub("World", "Jerry", str)Hello, Jerrysubstr(str, start, l)返回子串str, start, lsubstr(str, 1, 5)Hellotolower(str)将所有大写字母转换为小写字母strtolower(str)hello, world !!!toupper(str)将所有小写字母转换为大写字母strtoupper(str)HELLO, WORLD !!!

注释:

以上表格仅列出了 AWK 提供的内置字符串函数。字符串函数的参数可以是字符串或变量。字符串函数的返回值是字符串。 # 按字母顺序排列数组元素 $ awk 'BEGIN { arr[0] = "Three" arr[1] = "One" arr[2] = "Two" print "排序前数组元素：" for (i in arr) { print arr[i] } asort(arr) print "排序后数组元素：" for (i in arr) { print arr[i] } }' # 按索引顺序排列数组元素 awk 'BEGIN { arr["Two"] = 1 arr["One"] = 2 arr["Three"] = 3 asorti(arr) print "排序后数组索引：" for (i in arr) { print arr[i] } }' # 替换字符串 awk 'BEGIN { str = "Hello, World" print "替换前字符串 = " str gsub("World", "Jerry", str) print "替换后字符串 = " str }' # 查找子串的位置 awk 'BEGIN { str = "One Two Three" subs = "Two" ret = index(str, subs) printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret }' # 获取字符串长度 awk 'BEGIN { str = "Hello, World !!!" print "长度 = ", length(str) }' # 使用正则表达式匹配子串 awk 'BEGIN { str = "One Two Three" subs = "Two" ret = match(str, subs) printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret }' # 将字符串分割为数组 awk 'BEGIN { str = "One,Two,Three,Four" split(str, arr, ",") print "数组包含以下元素：" for (i in arr) { print arr[i] } }' # 使用 sprintf() 格式化字符串 awk 'BEGIN { str = sprintf("%s", "Hello, World !!!") print str }' # 将字符串转换为数字 awk 'BEGIN { print "Decimal num = " strtonum("123") print "Octal num = " strtonum("0123") print "Hexadecimal num = " strtonum("0x123") }' # 使用 sub() 替换字符串 awk 'BEGIN { str = "Hello, World" print "替换前字符串 = " str sub("World", "Jerry", str) print "替换后字符串 = " str }' # 获取子字符串 awk 'BEGIN { str = "Hello, World !!!" subs = substr(str, 1, 5) print "Substring = " subs }' # 小写转换 awk 'BEGIN { str = "HELLO, WORLD !!!" print "Lowercase string = " tolower(str) }' # 大写转换 awk 'BEGIN { str = "hello, world !!!" print "Uppercase string = " toupper(str) }'

3.时间函数函数名功能参数示例输出systime返回从 Epoch 以来到当前时间的秒数-systime()1418574432mktime(datespec)将字符串转换为时间戳datespecmktime("2014 12 14 30 20 10")1418604610strftime([format [, timestamp[, utc-flag]]])格式化时间戳format, timestamp, utc-flagstrftime("Time = %m/%d/%Y %H:%M:%S", systime())Time = 12/14/2014 22:08:42

注释:

以上表格仅列出了 AWK 提供的内置时间函数。时间戳是一个数值，表示从 Epoch 以来经过的秒数。Epoch 是 Unix 时间的起点，为 1970 年 1 月 1 日 00:00:00 UTC。 # 获取当前时间戳 awk 'BEGIN { print "Number of seconds since the Epoch = " systime() }' # 将字符串转换为时间戳 awk 'BEGIN { print "Number of seconds since the Epoch = " mktime("2014 12 14 30 20 10") }' # 格式化时间戳 awk 'BEGIN { print strftime("Time = %m/%d/%Y %H:%M:%S", systime()) }' # 打印当前星期几 awk 'BEGIN { print strftime("%A") }'

4.位操作函数函数名功能参数示例输出and执行位与操作num1, num2and(10, 6)2compl按位求补num1compl(10)9.0072E+15lshift左移位操作num1, shiftlshift(10, 1)20rshift向右移位操作num1, shiftrshift(10, 1)5or按位或操作num1, num2or(10, 6)14xor按位异或操作num1, num2xor(10, 6)12

注释:

以上表格仅列出了 AWK 提供的内置位操作函数。位操作函数的参数必须是整数。位操作函数的返回值是整数。 # 位与操作 awk 'BEGIN { num1 = 10 num2 = 6 printf "(%d AND %d) = %d\n", num1, num2, and(num1, num2) }' # 按位求补 awk 'BEGIN { num1 = 10 printf "compl(%d) = %d\n", num1, compl(num1) }' # 左移位操作 awk 'BEGIN { num1 = 10 printf "lshift(%d) by 1 = %d\n", num1, lshift(num1, 1) }' # 向右移位操作。 awk 'BEGIN { num1 = 10 printf "rshift(%d) by 1 = %d\n", num1, rshift(num1, 1) }' # 按位或操作。 awk 'BEGIN { num1 = 10 num2 = 6 printf "(%d OR %d) = %d\n", num1, num2, or(num1, num2) }' # 按位异或操作 [jerry]$ awk 'BEGIN { num1 = 10 num2 = 6 printf "(%d XOR %d) = %d\n", num1, num2, xor(num1, num2) }'

5.其他常用函数函数名功能参数示例输出close(expr)关闭管道的文件exprclose(cmd, "to")-delete从数组中删除元素数组索引delete arr[0]-exit([expr])终止脚本执行exprexit 10-fflush([output-expr])刷新打开文件或管道的缓冲区output-exprfflush()-getline读入下一行-getline < file-next停止处理当前记录，进入下一条记录的处理过程-if ($0 ~/Shyam/) next-nextfile停止处理当前文件，从下一个文件第一个记录开始处理-if ($0 ~ /file1:str2/) nextfile-return([expr])从用户自定义的函数中返回值exprreturn result-system(cmd)执行特定的命令cmdsystem("date")0

注释:

以上表格仅列出了 AWK 提供的其它内置函数。每个函数的具体使用方法请参考 AWK 官方文档。 # 关闭管道 awk 'BEGIN { cmd = "tr [a-z] [A-Z]" print "hello, world !!!" |& cmd close(cmd, "to") cmd |& getline out print out; close(cmd); }' # 从数组中删除元素 awk 'BEGIN { arr[0] = "One" arr[1] = "Two" arr[2] = "Three" arr[3] = "Four" print "删除前:" for (i in arr) { print arr[i] } delete arr[0] delete arr[1] print "删除后:" for (i in arr) { print arr[i] } }' # 终止脚本执行 awk 'BEGIN { print "Hello, World !!!" exit 10 print "AWK never executes this statement." }' # 刷新打开文件或管道的缓冲区 fflush([output-expr]) # 读入下一行 awk '{getline; print $0}' file.txt # 执行特定的命令然后返回其退出状态。返回值为 0 表示命令执行成功；非 0 表示命令执行失败。 awk 'BEGIN { ret = system("date"); print "Return value = " ret }'

如果您觉得有些用处，熟练操作这些代码后，相信你会有一些收获。

欢迎在评论区留言，关注。谢谢您的阅读！

敬请关注！

往期学习笔记：

Windows系统开启Linux子系统（Ubuntu）

Linux常用命令（目录操作命令）

Linux常用命令：文件的创建、复制、移动、查找和删除命令

Linux常用命令：文本文件的查看与编辑

Linux常用命令：文本文件的拼接与分割

Linux常用命令：文件的权限管理

Linux常用命令：文件的下载、压缩与解压

Linux常用命令：常见的操作符

Linux常用命令：系统操作命令

Linux文本处理三剑客：grep

Linux文本处理三剑客：sed

Linux文本处理三剑客：awk

Linux文本处理三剑客：awk（常用匹配模式）

Linux文本处理三剑客：awk（结构化命令）

Linux文本处理三剑客：awk（对具体文本的示例代码）

【本文地址】

公司简介

联系我们

今日新闻

推荐新闻

专题文章