我有一个包含以下行的文本文件:
Ca4 0.500001 0.000000 0.000000
C4 0.750001 0.500000 0.000000
O10 0.750001 0.243180 0.000000
O8 0.652432 0.628410 -0.779621
O12 0.847569 0.628410 0.779621
Ca3 0.120090 0.500000 -3.035668
C3 0.370090 0.000000 -3.035668
O9 0.370090 -0.256820 -3.035668
O7 0.272522 0.128410 -3.815289
O11 0.467659 0.128410 -2.256048
Ca1 0.000000 0.000000 0.000000
C2 0.250000 0.500000 0.000000
O4 0.250000 0.756820 0.000000
O6 0.152432 0.371590 -0.779621
O2 0.347569 0.371590 0.779621
Ca2 0.620091 0.500000 -3.035668
C1 0.870091 0.000000 -3.035668
O3 0.870091 0.256820 -3.035668
O5 0.772522 -0.128410 -3.815289
O1 0.967660 -0.128410 -2.256048
我想要做的只是简单地命令行,使“Ca”(字符串)行首先出现,其余行保持原样.
我试过用
grep "Ca" file | sort
但它只在屏幕上打印包含“Ca”的行
有什么建议?
最佳答案 你几乎要做两个过滤器.您可以排序,避免必须使用tee显式打开文件两次:
< file tee >(grep ^Ca > ca) | grep -v ^Ca > noca
cat ca noca > newfile
如果要在内部对Ca部分进行排序:
< file tee >(grep ^Ca | sort > ca) | grep -v ^Ca > noca
cat ca noca > newfile
如果你不打开文件两次非常重要,你可以使用awk:
awk '/^Ca/{ print }
!/^Ca/{ na[NR]=$0; }
END{ for(ln in na) print na[ln]; }' file
但是这种方法可以使用大量内存,因为它会保留非Ca部分,直到处理结束.