今天捣鼓了一天,将实验室电脑重装了,并将研究自然语言处理所需要用到的库都配置好了。其中坑倒是没遇到多少,只是因为本人是Linux新手,还是记录一下作个备忘吧。(应该不会有人看到的,如果有大神路过求轻喷~)
实验室电脑为i7 4790 八核CPU,Intel集显。显卡对于深度学习来说明显不足,因此只安装tensorflow CPU版的了,至于要用GPU的时候再远程到其他好的电脑吧~
首先来最基本的查看硬件信息命令~
$ lscpu //查看CPU信息
$ cat /proc/cpuinfo //查看CPU每个核的具体信息
$ lspci |grep -i ‘VGA’ //查看显卡信息
对我来说,只关注CPU和GPU信息就足够我判断是不是适合深度学习了,所以只列举了以上三条。
接下来是重装机器。实验室电脑本身是ubuntu16.04LTS和win7双系统。因为想逼自己熟悉Linux,所以决定只装ubuntu单系统。需要用到winPE(分区用)、ubuntu镜像和ultraiso(刻录用),网上都有,比较简单,这里不记录了。当然这里要记得进BIOS修改下启动优先项。
我安装的是ubuntu17.04,选择“其他选项”进行安装,这里有个好处是可以自行决定分区及目录挂载。安装过程参考了自定义安装linux/Ubuntu版本操作系统/自定义磁盘分区 – gent__chen的博客 – CSDN博客,另外还百度了一下各种目录的作用。一般来说,只需要:
- 一个根目录用于放系统(10-15G即可,我自己选择了50G)
- 一个交换分区用于虚拟内存(一般为物理内存的两倍,我选择了16G)
- 一个/home目录分区用于存储自己的资料(剩下的空间)。
- (可选)如果要安装双系统的话则还需要额外划分一个/boot分区用于系统启动,一般100M即可。
安装完后就可以愉快地进入ubuntu系统啦~
接下来是安装teamviewer(远程)、pycharm(ubuntu16.04以后自带python3.5,所以不用重复下啦)、tensorflow、tensorlayer、scikit-learn、gensim、nltk、jupyter、keras等一系列的东西。安装时遇到.deb、.tar.gz、.whl(最近安装VMware时遇到了.bundle文件,也加在这里一起吧)等各种各样的文件安装包,对新手来说有点头疼,所幸有搜索引擎。那么稍微总结下自己找到的方法吧:
.deb软件包安装方法:
$ sudo dpkg -i filename.deb
.tar.gz软件包安装方法:
$ sudo tar -zxvf filename.tar.gz (目录名,不提供默认解压到当前文件夹)
$ cd 解压后路径
$ ./pycharm.sh(以pycharm为例,这里需要看安装的说明文件)
.whl软件包安装方法:
// $ sudo apt-get install python3-pip python3-dev build-essential(若安装了pip则无需此步)
// 这里网上还要对pip进行更新什么的,可能因为是17.04版作了优化,我是执行完上一行代码后就是最新的了
$ pip3 install filename.whl
这里安装完后,import tensorlayer时出现了错误:
ImportError: No module named '_tkinter', please install the python3-tk package
复制到google上一搜,发现好像大家都有这个问题,原因好像是因为python3将Tkinter重命名为了tkinter(嗯,我也不知道该说什么。。。),这时候只需要
$ sudo apt-get install python3-tk
就解决啦!
.bundle安装
$ sudo chmod +x *.bundle(赋予执行权限)
$ sudo ./*.bundle
另外,安装teamviewer时,因为从官网上下的是64位的,安装时会出现缺少依赖库的错误。通过以下方法解决:
$ sudo dpkg --add-architecture i386 //添加32位架构支持
$ sudo apt-get update
$ sudo apt-get -f install
$ sudo dpkg -i teamviewerXXXXX.deb
最后,ubuntu17.04安装nltk_data时有了不同:
>>> import nltk
>>> nltk.download()
执行后会出现选项让你选。这时候只需选择d(download),然后按几个enter键之后,又会出现选项:l(list)或者是x(cancel)。这时候不用管给的选项,直接键入all就好了,它就会自动下载全部的corpus和models啦~最后再选择l(list)看一下是不是全部安装完即可。
软硬件的支持到这里就差不多啦,接下来还是得看论文想idea发文章。。。