在利用matlab整理数据的过程中,发现自己的一些容易犯错的问题,以及和马师兄交流之后,得到的一些经验,指导,如何能够更加高效地完成诸如此类的工作,遂记录在此,用以警醒亦与分享。P.S 补充0504给敏杰师弟写的代码总结(滑稽笑)。
1、命名规则
在文件名和代码名中尽量不要使用“-”中横线,可以使用下划线来作为文件名标识。“-”一般在代码等程序语言中通常会作为运算符号,或者是其他具有功能的符号,例如-acsii,标识转化为acsii码形式存储。
2、集合操作
避免重复操作出错,提取文件名后统一操作,命令:dir 搜索目录下的文件名。对于多个文件的操作时应该注意使用循环来进行语句的简化(for while语句都是适合的),否则容易在重复操作中出错。
3、搜索代码故障位置
额外写一个基本的点来提醒自己,a(:,4),表示取整的第四列,a(1:3,4),表示取第四列的1至3行,a([1 3],4),表示取第四列的1,3行。
对于代码的故障位置(一般为多行或者多列了),一般的方法是对具有顺序作用的行列进行遍历,提取故障点的特征来进行区分,比如,时间缺失了一段,可以采取下位减去上位,观察时间差大小变化,设置阈值来找出故障点。
4、搜索特定的行列位置
对于有些时候,我们只需要数据文件中的一些特定位置的数据,那么需要知道特定位置的特征,一般是可以通过看数据文件的形式来得到具体的行列数,这时可以通过读行语句来进行遍历得到所需的行列。
例子:
clc;clear all;
filename=dir(‘*.txt’); %%提取文件名
k=length(filename); %%得到文件数目
line=11; %%目标行数
for i=1:k;
fidin=fopen(filename(i).name,’r’);
fidout=fopen(‘fout.txt’,’at+’);
nline=0;
while(nline~=line);
tline=fgetl(fidin); % 从文件读行
nline=nline+1;
end
fprintf(fidout,’%s\n’,tline);
i=i+1;
fclose(fidin);
fclose(fidout);
end
如果需要得到多行,则可以在while条件语句进行修改,或者在嵌套一个for语句在外面,此时需要遍历判断每一个需要的line。如果仅仅是不要前面的注释的话,可以直接使用textread语句,用head直接跳过前几行。
这里还需要注意一个问题是再写入文件的时候,循环后面覆盖前面的问题,这个试了网上说得很多方法都没有很好的解决,最后找到是再fopen语句中追加一个‘at+’,之后能够是的写入文件进行续写。
5、统一修改txt文件的语句
如果需要修改txt文件中的数据,比如只要数字部分的要求,可以使用textread命令来进行筛选。
[num]=textread(‘fout.txt’,’%*s %*s %*s %f’,k);
textread命令的一般格式就是,textread(filename,format,number),这样可以把txt文件中前三个字符串略去,只保留最后的浮点数数据。textread命令还可以在后面加上筛选语句’delimiter’,略去分隔符等。
解释一下这里的%s是string字符串的意思,%f是浮点数,包括还有%d是双精度等等,如果需要的话救世%s,如果不需要就加上%*s,表示不要这个数据。textread的功能还很多,需要的时候再进一步学习,这里推荐一个txt数据处理的总结:www.ilovematlab.cn/thread-872-1-1.html,相关知识可以在这里看。