之前用 python 给 nuswide 提取了 VGG19 特征,因为文件太大,超过 .mat 限制,存成 .h5,见 [1]。现在一个 matlab 程序要读,可以用 h5disp
查看 .h5 文件内容的结构(各个 datasets),然后用 h5read
读。
注意两点:
- 文件名、dataset 的类型要是 char 而不能是 string,否则报错。可以用
c = char(s)
将 string 转成 char - 好像被自动转置了一次?我当初存的时候应该是 n × d n\times d n×d 的,但读出来的时候变成 d × n d\times n d×n 了(不知道是 h5py[1] 在存的时候自己转了,还是 matlab 读的时候自己转的)
Code
% "双"引号 是 string,会报错
% F = "datasets/nuswide-tc10/images.nuswide.vgg19.4096d.h5";
% '单'引号 是 char(数组),可以
F = 'datasets/nuswide-tc10/images.nuswide.vgg19.4096d.h5';
% 打印文件内结构
h5disp(F);
% 读
images = h5read(F, '/images'); % dataset name 也要用**单**引号 char
fprintf("images:"), disp(size(images)); % (4096, 269648)
- 输出
HDF5 images.nuswide.vgg19.4096d.h5
Group '/'
Dataset 'images'
Size: 4096x269648
MaxSize: 4096x269648
Datatype: H5T_IEEE_F32LE (single)
ChunkSize: []
Filters: none
FillValue: 0.000000
images: 4096 269648