提取文本中的信息

目前有一个需求需要完成,实现一个 Bash 脚本/home/shiyanlou/getimage.sh,从给定一个 Markdown 文档中提取所有的图片链接。

可义从下面的链接地址下载测试文档:

$ cd /home/shiyanlou$ wgethttp://labfile.oss.aliyuncs.com/contesth1/shiyanlou_lab1.md

实验文档中包含图片的行一般格式为:

![实验操作界面](https://dn-anything-about-doc.qbox.me/document-uid13labid292timestamp1467702955677.png/wm)

我们需要提取的链接地址为:

https://dn-anything-about-doc.qbox.me/document-uid13labid292timestamp1467702955677.png

脚本执行过程及输出范例如下:

$ cd /home/shiyanlou$ ./getimage.sh shiyanlou_lab1.md

https://dn-anything-about-doc.qbox.me/document-uid13labid292timestamp1467722221121.png

https://dn-anything-about-doc.qbox.me/document-uid13labid292timestamp1467231123451.png

https://dn-anything-about-doc.qbox.me/document-uid13labid292timestamp1467702955677.png…

cat getimage.sh

#!/bin/bash

grep ‘^\!’ $1 | awk -F “(” ‘{print $2}’| sed ‘s/\/wm)//g’| sed ‘s/)//g’

    原文作者:网络攻城狮
    原文地址: https://www.jianshu.com/p/72e10140685e
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞