我如何为特定字符串排序文本文件？

2023年5月8日 189次阅读

我有一个包含以下行的文本文件：

 Ca4  0.500001 0.000000 0.000000
 C4   0.750001 0.500000 0.000000
 O10  0.750001 0.243180 0.000000
 O8   0.652432 0.628410 -0.779621
 O12  0.847569 0.628410 0.779621
 Ca3  0.120090 0.500000 -3.035668
 C3   0.370090 0.000000 -3.035668
 O9   0.370090 -0.256820 -3.035668
 O7   0.272522 0.128410 -3.815289
 O11  0.467659 0.128410 -2.256048
 Ca1  0.000000 0.000000 0.000000
 C2   0.250000 0.500000 0.000000
 O4   0.250000 0.756820 0.000000
 O6   0.152432 0.371590 -0.779621
 O2   0.347569 0.371590 0.779621
 Ca2  0.620091 0.500000 -3.035668
 C1   0.870091 0.000000 -3.035668
 O3   0.870091 0.256820 -3.035668
 O5   0.772522 -0.128410 -3.815289
 O1   0.967660 -0.128410 -2.256048

我想要做的只是简单地命令行,使“Ca”(字符串)行首先出现,其余行保持原样.

我试过用

 grep "Ca" file | sort

但它只在屏幕上打印包含“Ca”的行

有什么建议？

最佳答案你几乎要做两个过滤器.您可以排序,避免必须使用tee显式打开文件两次：

< file tee >(grep ^Ca > ca) | grep -v ^Ca > noca
cat ca noca > newfile

如果要在内部对Ca部分进行排序：

< file tee >(grep ^Ca | sort > ca) | grep -v ^Ca > noca
cat ca noca > newfile

如果你不打开文件两次非常重要,你可以使用awk：

awk '/^Ca/{ print }
     !/^Ca/{ na[NR]=$0; }
     END{ for(ln in na) print na[ln]; }' file

但是这种方法可以使用大量内存,因为它会保留非Ca部分,直到处理结束.