linux – unix – 分析文件中有多少个字符出现的记录

是否有一个内置命令来执行此操作,或者有任何人对运行它的脚本有任何好运?

我想知道有多少记录(由特定的EOL定义,如“^%!”)有多少次出现的特定字符. (按出现次数降序排序)

例如,使用此示例文件:

jdk,|ljn^%!dk,|sn,|fgc^%!
ydfsvuyx^%!67ds5,|bvujhy,|s6d75
djh,|sudh^%!nhjf,|^%!fdiu^%!

建议输入:将EOL和文件名分隔符作为参数.

bash/perl some_script_name ",|" "^%!" samplefile

期望的输出:

occs    count
3        1
2        1
1        2
0        2

这是因为第1记录有一个分隔符,第2记录有2,第3记录有0,第4记录有3,第5记录有1,第6记录有0.

如果您可以使分隔符和EOL参数接受十六进制输入(即2C7C)或正常字符输入(即|),则可以使用奖励.

最佳答案 这就是perl的生活:

#!perl -w
use 5.12.0;

my ($delim, $eol, $file) = @ARGV;

open my $fh, "<$file" or die "error opening $file $!";
$/ = $eol; # input record separator

my %counts;
while (<$fh>) {
    my $matches = () = $_ =~ /(\Q$delim\E)/g; # "goatse" operator
    $counts{$matches}++;
}

say "occs\tcount";
foreach my $num (reverse sort keys %counts) {
    say "$num\t$counts{$num}";
}

(如果你没有5.12,删除“使用5.12”行并用print替换say)

点赞