Manual

Manual概述权限存储命令行网络连接Fortran C C++ 相关Python machine learning 相关Mathematica 相关其他公共账号的公用服务公用的 jupyter notebook server公用的 mathematica remote kernel

 

概述

权限

普通用户没有 sudo 权限,需要 sudo 权限的工作和任务请联系管理员。

存储

公共区域使用 /home/share 文件夹,所有大文件建议这里存储,此处文件所有用户均可读写。无视里边自带文件,自建自己用户名的文件夹存储即可。其中 /home/share/utilities 可能存放一些大家会公用的小程序,脚本等。

存储占用较小的内容和程序编译等可直接在 /home/<user>中存储和进行,该文件夹位于 ssd 上,读写较快。

不要在工作站唯一地存储任何有价值的内容,该工作站没有备份,内容有丢失和被误删的可能。

注意工作站存储空间十分有限,由于其内存很大,代码设计缺陷和疏忽很容易会导致无意存储大量数据,请一定避免此类情况。

命令行

强烈建议用户修改和设置复杂登陆密码,并且通过 ssh 公钥认证的方式免密登陆。具体 ssh 端口号和工作站 ip 地址,请咨询管理员。

常见命令行工具,如 mosh,tmux,htop,ranger,curl,tldr,z 等都已安装好,可直接使用。

网络连接

如没有外网链接(ping baidu.com 无反应),可以通过 /home/share/utilities/Tunet-2015c 来输入校园网账号密码登陆校园网。

Fortran C C++ 相关

如需 sudo 权限安装某些库,或安装一些底层基础支持库,或安装库体积较大,依赖较复杂,请直接联系管理员协助安装和配置。

gcc,gfortran 和 openmpi 开源方案的编译器都已配置好,make, cmakegit 等开发工具均已安装,可直接编译运行 fortran 和 c 的程序。boost 和 openblas,lapack,arpack,superlu 以及 mkl 等线性代数基本库已全局安装,可直接调用动态库的方式使用。同时已安装了 armadillo 作为线性代数的 C++ wrapper,编译时添加 -lamdadillo 即可使用。或者也可直接使用 Eigen3 库进行线性代数相关的操作,该库编译时无须任何指定。

另外 intel 系列编译器也已安装,此时的 mpi 版本建议使用 mpiicc 命令,因为默认 mpicxx 绑定在 g++ 上,两种编译器(GNU, Intel)请勿在同一项目混用,可能造成项目编译失败。建议始终使用 intel 系列的编译器,包括 icc, ifort,mpiicc 等。

Python machine learning 相关

建议使用和系统配置的 Python 版本是 Python3.6。此外也有 python 指向的 Python2.7 版本,不过仅作为运行 python2 脚本,如 ./configure 等使用。

带有 gpu 支持的 tensorflow,pytorch 和 keras 已经配置完成,numpy, scipy, sklearn,matplotlib 等基础库也已预配置好,此外 numba,cython 等简洁的加速工具都已安装。以上均可在 python3 中开箱即用,其他未安装库可通过 pip3 实现用户隔离的安装。

您可使用自己账户的 pip3 任意安装新的 package 使用,强烈建议使用 tuna 的软件源提高网速,节省流量,也即 pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package

若希望在自己账户建立对外的 jupyter notebook server,则需要额外手动安装 pip3 install jupyter。之后在自己可读写的目录内,jupyter notebook。若不成功,可尝试添加环境变量至 ~/.bashrcexport PATH=$PATH:~/.local/bin。或者建议使用公用账户的 jupyter notebook 服务,无须配置,可直接通过浏览器访问使用,使用方法见下面章节。参考资料

进阶:如果需要更高效的 python,可以通过 /opt/intel/intelpython3/bin/python3 或者直接 intelpython3 来调用 intel 优化过的 python 进行计算,其自带了连接 mkl 的 numpy 等基础库。

Mathematica 相关

Mathematica 安装版本是 11.0。

调用 math 可直接进入交互式的 mathematica 界面,其他相关的 mathematica 命令调用都可以直接使用。但每个用户需 math 独立激活 mathematica 软件。如需要使用且不知道具体激活方式,请联系管理员。

另一方面,可以配置 remote kernel 使用工作站的 mathematica 作为后端,交互更加灵活,配置方式请联系管理员(只需在本地前端配置,工作站上已配置完毕)。推荐直接公用账号的后端来使用 remote kernel,这样不需激活和设置本用户的 mathematica,可直接使用,见下面的公用服务。

其他公共账号的公用服务

一般性的 python 和 mathematica 计算需求,可以完全不需要使用配置账户和通过 ssh 登陆工作站,直接利用以下开箱即用的服务即可。因此强烈建议用户尽量将工作通过以下的公用服务来完成。

公用的 jupyter notebook server

对应的存储位置是 /home/share/jn/<user>,可直接通过浏览器访问使用,登陆密码和端口号请咨询管理员。注意: 由于这一环境使用的是公有账号,请勿利用 !pip3 的方式随意安装和升级 package。需要安装 package 时请联系管理员。或者可以在自己账户中 pip3 install 之后,通过 sys.path.append() 的方式使得公用 jupyter 可以引入自己的 site-package 路径,从而使用安装任意 python package。

更进一步地,这一公有服务原则上禁止使用 ! 开始的命令调用命令行。注意支持该 jupyter 服务的 python 是 intel 特别优化过的 python,包括 numpy scipy sklearn 等库都连接到 mkl 因此可以获得更高的速度。

公用的 mathematica remote kernel

直接配置本地 mathematica 的 remote kernel,则可利用自己的 mathematica 交互并通过工作站计算,使用体验和本地 mathematica 毫无区别,具体前端配置方式咨询管理员。参考资料。具体地,前端设置命令 Advanced Options 如下,具体参数可咨询管理员。