linux anaconda中mkl库的一个坑

问题

anaconda3中默认链接了一个自己的mkl库。代码中使用到mkl时,会报以下错误:

INTEL MKL ERROR: ~/anaconda3/envs/py27/bin/../lib/libmkl_avx2.so: undefined symbol: mkl_sparse_optimize_bsr_trsm_i8.
Intel MKL FATAL ERROR: Cannot load libmkl_avx2.so or libmkl_def.so.

解决方法

从现象看是找不到符号表。检查envs/py27/lib/目录,可以看到libmkl*开头的lib有好多。至少libmkl_avx2.so 和 libmkl_def.so都在。排除缺少库的问题。

nm -D 查看libmkl开头的库,可以看到mkl_sparse_optimize_bsr_trsm_i8这个symbol出现了很多次,带实现的也有,找不到符号怎么看都不应当。

去anaconda官方文档看了下。有提到mkl模式默认安装的,如果出问题建议安装nomkl这个包,然后卸载所有mkl,mkl-service两个包。这个方法实际是用另一个同样功能的库取代mkl。部分应用场景能解决问题,然后我的问题用该方法不能解决。

find libmkl试了下,发现在anaconda3/lib/目录下也有mkl相关的lib,而且多了一个libmkl-core.so的so,查了下,这个是mkl官方的包。对比了env下的mkl和这个mkl包的区别,发现很多包都是不一样大小的,想到以前做嵌入式开发时遇到的包中的符号表被删除的现象,决定使用这个官方包试试。

设置LB_PRELOAD环境变量,使用以下两个包替换默认的env下的包,问题解决。

export LD_PRELOAD=~/anaconda3/lib/libmkl_core.so:~/anaconda3/lib/libmkl_sequential.so
    原文作者:bluedream
    原文地址: https://segmentfault.com/a/1190000019516715
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞