Bash Shell编程入门

Shell是什么?

shell本身是一个命令解释器,介于操作系统的内核(kernel)态和用户态之间,可以执行系统调用及系统命令等,让用户以此来与操作系统实现互动。同时,它也用来指一种计算机程序语言(类似于C、Python等)。一个shell程序一般被称为一个脚本。

Shell语言的流派

目前,shell主要有两大流派:

  • sh:
    • burne shell (sh)
    • burne again shell (bash)
  • csh:
    • c shell (csh)
    • tc shell (tcsh)
    • korn shell (ksh)

目前,大部分Linux系统预设的shell都是bash。

Ubuntu16.04提供的shell环境(登录成功后默认使用bash):

slot@slot-ubt:~$ cat /etc/shells 
# /etc/shells: valid login shells
/bin/sh
/bin/dash
/bin/bash
/bin/rbash
slot@slot-ubt:~$ 

Mac OS提供的shell环境:

$ cat /etc/shells
# List of acceptable shells for chpass(1).
# Ftpd will not allow users to connect who are not using
# one of these shells.
>
/bin/bash
/bin/csh
/bin/ksh
/bin/sh
/bin/tcsh
/bin/zsh  # zsh系本文作者自己安装 

一个极简的bash demo: hello_world.sh

    #!/bin/bash
    
    # Here is comment 
    echo "Hello World!"

执行
方法1: 直接使用bash解释器来解释执行:

    bash hello_world.sh

或者:

    sh hello_world.sh

方法2: 先将文件属性改为可执行状态:

    chmod +x hello_world.sh

或者:

    chmod 777 hello_world.sh  

再直接执行:

    ./hello_world.sh

输出

    Hello World!

解释

    #!用来指定执行该脚本的解释器,后面的/bin/bash表明指定/bin目录下的bash程序来解释执行该脚本文件。
    #开头的是注释行(#!除外),shell中只有单行注释。  
    echo "Hello World!" 即用echo命令输出字符串"Hello World!"到终端显示器。

补充知识: 文件的属性
通过ls -l命令可以查看文件的属性,例如查看新建文件test.sh的属性:

slot@slot-ubt:~$ touch test.sh
slot@slot-ubt:~$ ls -l test.sh 
-rw-rw-r-- 1 slot slot 0 12月 21 15:40 test.sh

可以看到,一般新建文件的默认属性是-rw-rw-r--,即644,不具有可执行属性x,可使用chmod命令来改变文件属性(修改默认属性则使用umask命令),例如将文件test.sh的属性改为可读可写可执行(rwx: 4 + 2 + 1 = 7):

slot@slot-ubt:~$ chmod 777 test.sh 
slot@slot-ubt:~$ ls -l test.sh 
-rwxrwxrwx 1 slot slot 0 12月 21 15:40 test.sh

Bash中的变量

变量的定义与赋值

不像C、Java等静态语言需要先声明然后才能使用,而是和Python等动态语言类似,Bash变量在使用时直接定义,例如:

my_bash_var="this is my bash var"

注意:

  • 两边不能有空格!否则就是语法错误了。
  • Bash变量命名只能使用字母,下划线和数字,并且不能以数字开头。

变量的引用

使用已定义的变量时,只要在变量名前面加$符号即可:

echo $my_bash_var

或者使用${var_name}的形式,{}是可选的,主要是帮助解释器更好地识别变量的边界(推荐):

echo ${my_bash_var}

注意''""的区别:

  • '' :单引号里的任何字符都会原样输出,单引号中对变量引用是无效的,且单引号中不能出现单引号(对单引号使用转义符也不行);
  • "":双引号里可以引用变量,可以出现转义字符。

实例:

a="hello"
echo 'a is : $a'
echo "a is : $a"

Output:

a is : $a
a is : hello

只读变量

使用 readonly 命令可以将变量限定为只读变量,这与 C 语言中的 const 常量类型的情况相同.

a_var="hello"
readonly a_var
a_var="world"  # Output: bash: read-only variable: a_var

删除变量

使用 unset 命令可以删除变量,但是不能删除只读变量。
变量被删除后不能再次使用。

my_var="haha"
unset my_var
echo ${my_var} # 变量my_var已被删除,没有任何输出

变量的类型

诸如C、Java、Python等这些高级语言中的变量是有类型的,例如数字类型(整型、浮点型等)、字符串类型、布尔类型,面向对象语言中还有引用类型等。但是,在Bash中,并不对变量区分类型

本质上来说,Bash变量都是字符串。但是依赖于上下文,Bash也允许比较操作和算术操作。决定这些的关键因素是变量中的值是否只有数字,只有当变量是纯数字时,该变量才是“数字类型的”,否则就是字符串类型的。

另外,注意Bash中的数字默认的是十进制,八进制需要以0开头,十六进制以0x开头。

纯数字变量是“数字变量”:

a=1234
let "a+=1"
echo ${a}  # Output: 1235

数字+字符串:字符串变量,字符串变量不能进行数学运算

b=${a/12/BB} # 将12替换为BB
echo ${b}    # Output: BB35

let "b+=1"
echo ${b}    # Output:1

将变量中的非数字字符替换为数字,得到数字变量

c=BB34
echo ${c}     # Output: BB34

d=${c/BB/12}  # 将BB替换为12
echo ${d}     # Output: 1234

let "d+=1"
echo ${d}     # Output: 1235

空变量+数字:数字变量

# 变量e定义为空值
e=""
echo ${e}  # Output: 没有任何输出

let "e+=1" # 空值 + 1
echo ${e}  # Output: 1

未定义的变量+数字:数字变量

# 变量f未定义
echo "f = $f"   # Output: f =

let "f+=1" 
echo "f = ${f}" # Output: f = 1

变量的作用域

  • 局部变量(local variables):这种变量只有在变量所在的代码块或者函数中才可见,需要使用local声明;
  • 全局变量:Bash中用户自定义的普通变量默认是全局变量,可以在本文件中的其它位置引用;
  • 环境变量(environmental variables):所有的程序(包括shell启动的程序)都能访问环境变量。
    如果一个shell脚本设置了环境变量,需要用 export 命令来通知脚本的环境。

更多关于环境变量的知识可以参考以下文章:

Bash中的运算符

Bash支持的运算符有:

  • 数学运算符
  • 关系运算符
  • 布尔运算符
  • 逻辑运算符
  • 字符串运算符
  • 文件测试运算符

数学运算符

数学运算符说明
+加法
减法
*乘法
/除法
%取余
=赋值
==相等测试,相等则返回true
!=不相等测试,不相等则返回true

注意: 乘号*前边必须加反斜杠 \ 才能实现乘法运算

关系运算符

关系运算符只支持数字,不支持字符串,除非字符串的值是数字

关系运算符说明
-eq(equal) 检测两个数是否相等,相等则返回 true
-ne(not equal)检测两个数是否相等,不相等则返回 true
-gt(greater than)检测左边的数是否大于右边的,如果是,则返回 true
-lt(lower than) 检测左边的数是否小于右边的,如果是,则返回 true
-ge(greater equal)检测左边的数是否大于等于右边的,如果是,则返回 true
-le(lower equal) 检测左边的数是否小于等于右边的,如果是,则返回 true

布尔运算符

布尔运算符说明
-a与运算,两个表达式都为 true 才返回 true
-o或运算,有一个表达式为 true 则返回 true
!非运算,表达式为 true 则返回 false,否则返回 true

逻辑运算符

逻辑运算符说明
&&逻辑与
II逻辑或

字符串运算符

字符串运算符说明举例 (a=”abc” b=”def”)
=检测两个字符串是否相等,相等返回 true[ $a = $b ] 返回 false
!=检测两个字符串是否相等,不相等返回 true[ $a != $b ] 返回 true
-z检测字符串长度是否为0,为0返回 true[ -z $a ] 返回 false
-n检测字符串长度是否为0,不为0返回 true[ -n $a ] 返回 true
str_name检测字符串是否为空,不为空返回 true[ $a ] 返回 true

文件测试运算符

文件测试运算符用于检测 Unix 文件的各种属性

文件测试运算符说明
-b file检测文件是否是块设备文件,如果是,则返回 true
-c file检测文件是否是字符设备文件,如果是,则返回 true
-d file检测文件是否是目录,如果是,则返回 true
-f file检测文件是否是普通文件(既不是目录,也不是设备文件),如果是,则返回 true
-g file检测文件是否设置了 SGID 位,如果是,则返回 true
-k file检测文件是否设置了粘着位(Sticky Bit),如果是,则返回 true
-p fill检测文件是否是命名管道,如果是,则返回 true
-u file检测文件是否设置了 SUID 位,如果是,则返回 true
-r file检测文件是否可读,如果是,则返回 true
-w file检测文件是否可写,如果是,则返回 true
-x file检测文件是否可执行,如果是,则返回 true
-s file检测文件是否为空(文件大小是否大于0),不为空返回 true
-e file检测文件(包括目录)是否存在,如果是,则返回 true

Bash的控制流

条件语句

if语句

  • if
if [ condition ]
then
    command
fi
  • if-else
if [ condition ]
then
    command
else
    command
fi
  • if-elif-else
if [ condition1 ]
then
    command1
elif [ condition2 ]
    command2
else
    commandN
fi

注意:
勿忘最后的fiif的反向拼写)!

case语句

case "${var}" in
    "$condition1" )
        command1
    ;;

    "$condition2" )
        command2
    ;;

    * )  # 这里相当于C中case语句的default 
esac

注意:

  • 对变量使用""并不是强制的,因为不会发生单词分离;
  • 每句测试行,都以右小括号)结尾;
  • 每个条件块都以两个分号;;结尾(作用类似C中的break);
  • case 块的结束以 esac(case 的反向拼写)结尾.

循环语句

for语句

for var in item1 item2 ... itemN
do
    command1
    command2
    ...
    commandN
done

注意:
在循环的每次执行中,var将顺序的存取 list (i.e. item1 … itemN)中列出的变量。

C风格的for循环:

for (( EXP1; EXP2; EXP3 ))
do
    command1
    command2
    command3
done

注意: (())中对变量的引用可以不加$

while语句

while [ condition ]
do
    command
done

C风格的while循环:

while (( condition ))
do
    command
done

注意: (())中对变量的引用同样可以不加$

until语句

until [ condition-is-true ]
do
    command
done

注意:
util结构在循环的顶部判断条件,并且如果条件一直为 false 那就一直循环下去,直到条件为真才结束循环(与 while 相反)。

Bash支持的编程模型

Bash只支持过程式的编程模型,不支持面向对象和函数式等高级编程模型,更不支持对高级设计模式的实现。所以,如果要实现比较复杂的功能,还是使用Perl、Python或者Ruby等高级语言吧。

Bash的传参机制

shell通过位置参数(positional parameters)来给脚本文件传递参数,就是从命令行中传进来的参数,$0, $1, $2, $3… 其中:

  • $0 是该脚本文件的名字
  • $1 是第一个参数, $2 是第 2 个参数…

注意:

  • $9 以后就需要大括号了,如 ${10}, ${11}, ${12}…

另外,还有几个特殊字符用来处理参数:

参数处理说明
$#传递到脚本的参数个数
$*以一个单字符串显示所有向脚本传递的参数。
$@与$*相同,但是使用时加引号,并在引号中返回每个参数。
$$脚本运行的当前进程ID号
$!后台运行的最后一个进程的ID号
$-显示Shell使用的当前选项,与set命令功能相同
$?显示最后命令的退出状态。0表示没有错误,其他任何值表明有错误。

$*$@ 区别:

  • 相同点:都表示引用所有的位置参数;
  • 不同点:只有在双引号中体现出来。假设在脚本运行时写了三个参数 1、2、3,,则 ” * ” 等价于 “1 2 3″(传递了一个参数),而 “@” 等价于 “1” “2” “3”(传递了三个参数)。

Bash函数

函数的定义

function func_name()
{
    # 函数体
}

注意:

  • 关键字function是可选的;
  • 函数定义必须在第一次调用前完成,shell没有像 C 中的函数“声明”;
  • 在一个函数内嵌套另一个函数也是可以的,但是不常用.

函数的参数传递

函数以位置来引用传递过来的参数(就好像他们是位置参数一样), 例如$1, $2, …

函数的调用

函数被调用或被触发, 只需要简单地用函数名来调用,有参数的话将参数依次置于函数名之后。

无参函数的调用

function func1()
{
    echo "Hello World!"
    echo "This is func1"
}

# Calling func1
func1

输出:

Hello World!
This is func1

有参函数的调用

function func2()
{
    echo "This is func2"
    
    a=$1
    b=$2
    echo "a is : $a"
    echo "b is : $b"
}

# Calling func2,and pass two parameters
func2 "aaa" "bbb"

输出:

This is func2
a is : aaa
b is : bbb

函数中参数的作用域

在函数调用之前,所有在函数内声明且没有明确声明为 local 的变量都可在函数体外可见(默认为全局变量)。

如果变量用local 来声明,那么它只能在该变量声明的代码块中可见。这个代码块就是局部”范围”。在一个函数内,局部变量意味着只能在函数代码块内它才有意义。

  1 #!/bin/bash
  2
  3 func()
  4 {
  5     global_var="I am global_var difined in function func."
  6     echo $global_var
  7
  8     local loc_var="I am local_var defined in function func"
  9     echo $loc_var
 10 }
 11
 12 func
 13 echo
 14 echo $global_var
 15 echo $loc_var
 16
 17 exit

输出:

I am global_var difined in function func.
I am local_var defined in function func

I am global_var difined in function func.


Bash数组

Bash 只支持一维数组,用圆括号()来表示,数组元素之间用”空格”符号来分割(不同于C、C++、Java等语言中用逗号分割)。

数组的定义与初始化

初始化时不需要指定数组的大小。和其它大部分语言一样,bash数组元素的下标从0开始。

初始化方式1:直接初始化

arr_name=(value1 value2 ... valueN) 

初始化方式2: 用下标初始化

arr_name[0]=value1
arr_name[1]=value2
arr_name[223]=value3 # 不连续初始化

注意:

  • 数组成员不必一定要连续,空缺元素是允许的;
  • 数组的一部分成员允许不被初始化, 没有被初始化的元素将打印空(NULL)值;

访问数组元素

访问数组元素的一般格式:

${arr_name[index]}

遍历数组

使用*@ 可以获取数组中的所有元素
实例:

my_arr=(A B C "ddd")

# 遍历数组格式1
echo "my_arr: ${my_arr[*]}

# 遍历数组格式2
echo "my_arr: ${my_arr[@]}

输出:

my_arr: A B C ddd
my_arr: A B C ddd

获取数组长度

获取数组长度(即数组中的元素个数),和遍历数组语法很相似,只是在数组名前加了#符号,格式:

${#arr_name[*]}

或者

${#my_arr[@]}

实例:

# 获取数组my_arr的长度(元素个数)
echo "my_arr length: ${#my_arr[*]}

# 获取数组my_arr的长度,
echo "my_arr length: ${#my_arr[@]}

输出:

my_arr length: 4
my_arr length: 4

Bash字符串操作

在Bash中,字符串可以用单引号,也可以用双引号,也可以不用引号。单双引号的区别如前文所述。
定义字符串实例:

str1=hello
str2='hello'
str3="hello"

echo $str1
echo $str2
echo $str3

输出:

hello
hello
hello

获取字符串长度

格式:

${#string_name}

实例:

my_str="hello world"
echo "my_str length: ${#my_str}

输出:

my_str length: 11

字符串拼接

和Java Python等语言类似,bash允许直接将字符串拼接在一起以获得新的字符串。
实例:

str1="hello"
str2="world"

str3=${str1}" "${str2}
echo ${str3}

输出:

hello world

提取子串

表达式含义
${string:position}在string中, 从位置position开始提取子串
${string:position:length}在string中, 从位置position开始提取长度为length的子串

实例1:从位置1开始提取子串

str="hello world"

sub_str=${str:1}
echo "sub_str: ${sub_str}"

输出:

sub_str: ello world

实例2:从位置1开始提取长度为3的子串

str="hello world"

sub_str=${str:1:3}
echo "sub_str: ${sub_str}"

输出:

sub_str: ell

删除子串

表达式含义
${string#substring}从string的开头, 删除最短匹配substring的子串
${string##substring}从string的开头, 删除最长匹配substring的子串
${string%substring}从string的结尾, 删除最短匹配substring的子串
${string%%substring}从string的结尾, 删除最长匹配substring的子串

记忆:

  • #表示从头匹配,%表示从尾匹配
  • 一个符号(#或者%)表示最短匹配,两个符号(##或者%%)表示最长匹配

注意:substring可以是正则表达式。

实例:

str="abcabcdefabcabc"

# 从str的开头,删除最短匹配的以a开头c结尾的子串
# 将删除最左端的abc
# 输出:abcdefabcabc
echo "${str#a*c}"  

# 从str的开头,删除最长匹配以a开头b结尾的子串
# 将删除abcabcdefabcab
# 输出:c
echo "${str##a*b}" 

# 从str的结尾,删除最短匹配以a开头c结尾的子串
# 将删除最右端的abc
# 输出:abcabcdefabc
echo "${str%a*c}"  

# 从str的结尾,删除最长匹配以a开头c结尾的子串
# 将删除整个字符串
# 输出:空
echo "${str%%a*b}" 

替换子串

表达式含义
${string/substring/replacement}使用$replacement 来代替第一个匹配的$substring
${string//substring/replacement}使用$replacement 代替所有匹配的$substring
${string/#substring/replacement}如果$string的前缀匹配$substring, 那么就用$replacement来代替匹配到的$substring
${string/%substring/replacement}如果$string的后缀匹配$substring, 那么就用$replacement来代替匹配到的$substring

实例:

str="abcdefabc"

# 用hello替换第一个abc
echo ${str/"abc"/"hello"}    # 输出:hellodefabc

# 用hello替换第一个abc
echo ${str//"abc"/"hello"}   # 输出:hellodefhello

# 前缀匹配替换
echo ${str/#"abc"/"world"}   # 输出:worlddefabc

# 后缀匹配替换
echo ${str/%"abc"/"world"}   # 输出:abcdefworld

References

Advanced Bash-Scripting Guide
这本书内容翔实,实例丰富,既可做精钻细研的教材,又可作为手册时时查阅,真是居家旅行必备良品;-)

另外,感兴趣的同学也可翻阅《Linux Shell Scripting Cookbook》(中文译名《Linux Shell脚本攻略》),里面介绍了很多Shell编程的奇技淫巧,甚是有用有趣。

推荐一个可以在线使用Linux环境的地方,如果需要Linux实验环境又不想搭虚拟机的话可以试试这里:实验楼

实验楼

    原文作者:echoworlding
    原文地址: https://www.jianshu.com/p/e1c8e5bfa45e
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞