编写快速安全 Bash 脚本的建议

昨天我和一些朋友聊起Bash,我意识到:即使我已经使用Bash十多年了,现在还有一些基础的杂项,我理解的并不是很清晰。 像往常一样,我认为我应该写一个博文。

我们会包含:

  • 一些bash基础知识(“你怎么写一个for循环”)

  • 杂项事宜(“总是引用你的bash变量”)

  • bash脚本安全提示(“总是使用set -u”)

如果你编写shell脚本,并且你没有阅读这篇文章中其他任何内容,你应该知道有一个shell脚本校验工具(linter),叫做 shellcheck 。使用它来使您的shell脚本更好!

我们会像讨论编程语言一样讨论bash,因为,怎么说呢,它就是。 这篇文章的目标不是bash编程详解。我不会在bash中做复杂的编程,也真的不计划学习如何去做。 但是,经过今天的思考之后,我认为明确整理下bash编程语言的一些基础知识是有用的。bash编程语言与我使用过的其他编程语言有着很大的不同。

我真的曾认为我已经知道这些东西了,但是通过写这篇文章我依旧学到了一些东西,也许你也会有所收获。

变量赋值

在bash中变量赋值按照下面的方式:

VARIABLE=2

并且你可以使用$VARIABLE(变量名)来引用变量。需要注意的是不要在=运算符的两边放置空格符,比如VARIABLE= 2、VARIABLE = 2、或者VARIABLE =2,这并不是语法错误,但是将会做完全不需要的事情(比如试图运行一个名字为2的程序,并将环境变量VARIABLE设置为空字符串)。

Bash变量并不要求全部大写,但是通常是大写的。

大多数你所使用的bash变量都是字符串。在bash中也有一些数组变量,但我并不是完全理解它们。

使用${}引用变量

有时某些变量,内容为file.txt,并且我想这样使用它:

mv $MYVAR $MYVAR__bak # wrong!

这段代码是无法工作的!它会去查找 MYVAR__bak变量,但这并不是一个真实存在的变量。

为了避免类似问题,你需要知道的仅仅是 ${MYVAR}和$MYVAR是一回事。所以你可以这样运行指令:

mv $MYVAR ${MYVAR}__bak # right!

全局变量,局部变量和环境变量

Bash有3种变量。我一般先想到(可能也是最常用)的是 环境变量

Linux上的每个进程实际上都有环境变量(您可以运行env查看当前设置的变量),但在Bash中,它们更易于访问。要查看名为MYVAR的环境变量,可以运行

echo "$MYVAR"

要设置环境变量,您需要使用export关键字:

export MYVAR=2

设置环境变量时,所有子进程将看到该环境变量。所以如果你运行export MYVAR=2; python test.py,python程序将MYVAR设置为2。

第二种变量是 全局变量 。同样像上面那样赋值。

MYVAR=2

在其他编程语言中他们表现得像全局变量。

还有 局部变量 ,它们的作用域只能存在于bash函数中。 我基本上从来没有使用过这样的函数(不像我写的其他编程语言),我从来没有使用过局部变量。

for循环

以下是我在bash中编写循环的方法。 此循环将从1打印到10。

for i in `seq 1 10` # you can use {1..10} instead of `seq 1 10` 
do     
 echo "$i"
done

如果你想用一行代码写这个循环,可以这样写:

for i in `seq 1 10`; do echo $i; done

我觉得这是不可能记住的(你要怎么记住在 seq 1 10 之后有一个分号,但是在 do 之后却没有了),所以我不会去记它。

你也可以写while循环,但我从来没有这样写过。

有个很酷的事情是你可以遍历另一个命令的输出。seq 1 10 将数字从1到10(每行一个)打印,这个for循环只是提取该输出并遍历它。我就经常用这种方法。

您也可以使用反引号或$()来插入命令的输出。

OUTPUT=`command`
# or 
OUTPUT=$(command)

if 语句

在 bash 中的 If 语句是相当让人讨厌去记它。你必须放在这些方括号中,而在方括号之间必须有空格,否则它不起作用。[[ 和 [ 方括号(双/单) 都工作。 这里我们真正进入 bash 的奇怪领域:[ 是一个程序(/usr/bin/[)但 [[ 是 bash 语法。[[ 更好。

if [[ "vulture" = "panda" ]]; then
 echo expression evaluated as true
else
 echo expression evaluated as false
fi

此外,您可以检查“此文件存在”,“此目录存在”等内容。例如,您可以检查文件 /tmp/awesome.txt 是否存在,如下:

If [[ -e /tmp/awesome.txt ]]; then
  echo "awesome"
fi

这通常是有用的,但我必须每次查找语法。

如果您想尝试用命令行,可以使用 test 命令,例如 test -e /tmp/awesome.txt 。 它成功会返回0,否则返回错误。

最后一件事是为什么[[比[好:如果你使用[[,那么你可以使用<做比较,它不会变成文件重定向。

$ [ 3 < 4 ] && echo "true"
bash: 4: No such file or directory
$ [[ 3 < 4 ]] && echo "true"
true

还有一个额外的最后一件关于 if 的事:我今天学到是不需要通过[[或者[去使用 if 语句:任何有效的命令都会工作。 所以你可以这样做

if grep peanuts food-list.txt
then
echo "allergy allert!"
fi

函数不是那么难

在 bash 中定义和调用函数(特别是没有参数)是非常容易的。

my_function () {
 echo "This is a function"; 
}
my_function #调用函数

总是引用你的变量

另一个 bash 技巧:绝不使用一个没有引用的变量。 看看这个看似合理的 shell 脚本:

X="i am awesome"
Y="i are awesome"
if [ $X = $Y ]; then
 echo awesome
fi

如果你尝试运行这个脚本,你会得到不可理喻的错误消息 script.sh: line 3: [: too many arguments. 什么?

Bash 解释这个 if 语句为 if [ i am awesome == i are awesome],这是6个字符串 (i, am, awesome, i, are, awesome) 无意义的 if 语句。 正确的写法是

X="i am awesome"
Y="i are awesome"
if [ "$X" = "$Y" ]; then #我放置引号因为我知道bash会背叛我,如果我不放的话
 echo awesome
fi

有些情况下,只要使用 $ X 而不是 “$ X” 就可以,但是您可以知道何时可以,何时不行吗? 我肯定不能。 总是引用你的 bash 变量,你会更快乐的。

返回代码, &&, 和 `||

每个 Unix 程序都有一个“返回代码”,它是一个从0到127的整数。0表示成功,其他都意味着失败。 这在 bash 中是有作用的,因为:有时我从命令行运行一个程序,并希望仅在第一个程序成功的情况下运行第二个程序。

你可以用 && 实现!

例如:create_user && make_home_directory。 这将运行 create_user ,检查返回代码,然后仅在返回代码为0时运行 make_home_directory。

这与 create_user; make_home_directory 不同,无论 create_user 的返回代码是什么,都将运行 make_home_directory。

你也可以使用create_user || make_home_directory,只有create_user运行失败才运行make_home_directory 。 这在技术领域中非常巧妙。

后台进程

我不会在此谈及太多关于 job 控制的内容,但是:你可以像下面这样启动后台进程

long_running_command &

如果你后来后悔将进程放到后台,并希望把它带调回前台,你可以用 fg 来做到这一点。 如果不止一个进程,您可以使用 jobs 查看所有后台进程。由于某种原因,fg 需要一个 “job ID”(这就是 jobs 打印输出的)而不是一个 PID。 谁知道 Bash 为什么这样子呢。

另外,如果你在后台运行太多的进程,内置等待命令将等到它们都返回。

说到后悔 - 如果你不小心在错误的终端启动一个进程,Nelson Elhage 有一个很棒的项目叫做 reptyr ,可以保存你的进程并将其移到屏幕会话或者某些其他东西中。

我来评几句
登录后评论

已发表评论数()

相关站点

热门文章