Shortcuts

UGC 命令

haiworkspace

Usage:

haiworkspace COMMAND <argument>... [OPTIONS]

haiworkspace diff

比较本地workspace和萤火二号目录diff,默认比较文件md5

如耗时较长,可通过’–no_checksum’参数禁用md5计算,只通过文件size比较,该方法不可靠

Usage:

haiworkspace diff [OPTIONS]

Options:

  • -n, --no_checksum

    是否对文件禁用checksum比对,默认值为False

  • -i, --no_hfignore

    是否忽略.hfignore规则,默认值为False

  • -l, --list_timeout <list_timeout>

    遍历集群工作区的超时时间,单位(s)

    默认值: 300

haiworkspace download

下载萤火二号目录中指定文件到本地, 远端目录请通过diff获取,如 checkpoint/model.pt

Usage:

haiworkspace download <remote_path> [OPTIONS]

Options:

  • --force

    是否强制覆盖本地目录,默认值为False

  • -n, --no_checksum

    是否对文件禁用checksum比对,默认值为False

  • -i, --no_hfignore

    是否忽略.hfignore规则,默认值为False

  • -l, --list_timeout <list_timeout>

    遍历集群工作区的超时时间,单位(s)

    默认值: 300

  • -s, --sync_timeout <sync_timeout>

    等待同步任务提交成功的超时时间, 单位(s)

    默认值: 1800

  • -o, --cloud_connect_timeout <cloud_connect_timeout>

    从云端下载分片到本地的连接超时时间, 单位(s)

    默认值: 120

  • -t, --token_expires <token_expires>

    从云端下载到本地的sts token有效时间, 单位(s)

    默认值: 1800

  • -p, --part_mb_size <part_mb_size>

    从云端下载到本地的分片大小, 单位(MB)

    默认值: 100

  • --proxy <proxy>

    从云端下载到本地时使用的代理url

Arguments

  • remote_path

    远端文件路径,远端目录请通过diff获取,如 checkpoint/model.pt,默认: checkpoint

haiworkspace init

初始化本地工作区

Usage:

haiworkspace init <workspace_name> [OPTIONS]

Options:

  • -p, --provider <provider>

    使用的云端存储服务类别

    默认值: oss

Arguments

  • workspace_name

    工作区的名字

haiworkspace list

列举所有萤火二号workspace,加粗表示为当前运行目录所在workspace

Usage:

haiworkspace list [OPTIONS]

haiworkspace pull

下载萤火二号目录到本地workspace

Usage:

haiworkspace pull [OPTIONS]

Options:

  • --force

    是否强制覆盖本地目录,默认值为False

  • -n, --no_checksum

    是否对文件禁用checksum比对,默认值为False

  • -i, --no_hfignore

    是否忽略.hfignore规则,默认值为False

  • -l, --list_timeout <list_timeout>

    遍历集群工作区的超时时间, 单位(s)

    默认值: 300

  • -s, --sync_timeout <sync_timeout>

    等待同步任务提交成功的超时时间, 单位(s)

    默认值: 1800

  • -o, --cloud_connect_timeout <cloud_connect_timeout>

    从云端下载分片到本地的连接超时时间, 单位(s)

    默认值: 120

  • -t, --token_expires <token_expires>

    从云端下载到本地的sts token有效时间, 单位(s)

    默认值: 1800

  • -p, --part_mb_size <part_mb_size>

    从云端下载到本地的分片大小, 单位(MB)

    默认值: 100

  • --proxy <proxy>

    从云端下载到本地时使用的代理url

haiworkspace push

推送本地workspace到萤火二号

Usage:

haiworkspace push [OPTIONS]

Options:

  • --force

    是否强制推送并覆盖远端目录, 默认值为False

  • -n, --no_checksum

    是否对文件禁用checksum比对, 默认值为False

  • -i, --no_hfignore

    是否忽略.hfignore规则,默认值为False

  • -z, --no_zip

    是否禁用workspace打包上传, 默认值为False

  • -d, --no_diff

    是否禁用差量上传, 如是, 本地和远端不一致文件将被强制覆盖, 默认值为False

  • -l, --list_timeout <list_timeout>

    遍历集群工作区的超时时间, 单位(s)

    默认值: 300

  • -s, --sync_timeout <sync_timeout>

    等待同步任务提交成功的超时时间, 单位(s)

    默认值: 1800

  • -o, --cloud_connect_timeout <cloud_connect_timeout>

    从本地上传分片到云端的连接超时时间, 单位(s)

    默认值: 120

  • -t, --token_expires <token_expires>

    从本地上传到云端的sts token有效时间, 单位(s)

    默认值: 1800

  • -p, --part_mb_size <part_mb_size>

    从本地上传到云端的分片大小, 单位(MB)

    默认值: 100

  • --proxy <proxy>

    从本地上传到云端时使用的代理url

haiworkspace remove

删除集群工作区

示例: “hfai workspace remove demo -f checkpoint/ -f output/train.log”

Usage:

haiworkspace remove <workspace_name> [OPTIONS]

Options:

  • -f, --files <files>

    保留工作区,仅删除指定的集群侧文件/文件目录列表,不支持通配符; 如不指定则为删除整个工作区

  • --yes

    Confirm the action without prompting.

Arguments

  • workspace_name

    工作区的名字

haienv

Usage:

haienv COMMAND <argument>... [OPTIONS]
             默认haienv路径为HOME,可以通过设置环境变量HAIENV_PATH来指定haienv路径(萤火平台下已设置该环境变量)

haienv config

创建、查询、删除虚拟环境

Usage:

haienv config COMMAND <argument>... [OPTIONS]

config append

追加haienv的某项参数

eg. haienv clear -n my_env -k extra-search-dir -v /tmp/123

Usage:

haienv config append [OPTIONS]

Options:

  • -n, --haienv_name <haienv_name>

    required。haienv_name

  • -k, --key <key>

    required。选择追加的参数,目前只能指定extra-search-dir, extra-search-bin-dir, extra-environment中的一种

  • -v, --value <value>

    required。追加的参数值

config clear

清除haienv的某项参数

eg. haienv clear -n my_env -k extra-search-dir

Usage:

haienv config clear [OPTIONS]

Options:

  • -n, --haienv_name <haienv_name>

    required。haienv_name

  • -k, --key <key>

    required。选择清除的参数,目前只能指定extra-search-dir, extra-search-bin-dir, extra-environment中的一种

config show

展示指定haienv的各项参数

Usage:

haienv config show [OPTIONS]

Options:

  • -n, --haienv_name <haienv_name>

    required。haienv_name

  • -u, --user <user>

    指定用户,默认走当前用户

haienv create

使用conda创建新的虚拟环境,注意必须有conda并配置好相应代理(如有需要)

eg. haienv create my_env –no_extend –py 3.6 –extra-search-dir /tmp/123 –extra-search-dir /tmp/456 –extra-environment TEMP=temp

Usage:

haienv create [OPTIONS] haienv_name

Options:

  • --no_extend

    扩展当前python环境(默认为扩展),注意扩展当前环境极有可能出现版本兼容问题

  • -p, --py <py>

    选择python版本,默认为当前python版本

  • --extra-search-dir <extra_search_dir>

    指定在进入该虚拟环境时额外的pythonpath

  • --extra-search-bin-dir <extra_search_bin_dir>

    指定在进入该虚拟环境时额外的path

  • --extra-environment <extra_environment>

    指定在进入该虚拟环境时额外的环境变量

Arguments

haienv list

列举所有虚拟环境

Usage:

haienv list [OPTIONS]

Options:

  • -u, --user <user>

    指定用户,默认为所有用户

  • -a, --all

    列出所有环境

  • -o <output_format>

    输出格式,可以选择json

haienv remove

删除虚拟环境

Usage:

haienv remove [OPTIONS] haienv_name

Arguments

hfai images

用户自定义镜像的管理接口

Usage:

hfai images COMMAND <argument>... [OPTIONS]

hfai images delete

删除萤火二号上的镜像,以释放空间 注意: 1、 该镜像的命名并不会被回收 2、 用户也可以删除自己组内的其他用户的镜像

Usage:

hfai images delete <image> [OPTIONS]

Arguments

  • image

    完整的镜像名,[registry]/image:<tag>

hfai images list

列举用户组在萤火二号上的镜像列表,以及镜像在萤火二号上的状态

Usage:

hfai images list [OPTIONS]

Options:

  • -a, --all

    是否显示所有镜像(含删除的)

    默认值: False

hfai images load

加载镜像 tar 包到萤火二号上,tar包应该在萤火二号上共享目录下的,外部用户需要先把 tar 包上传上来操作

Usage:

hfai images load <image_tar> [OPTIONS]

Arguments

  • image_tar

    用户要加载进萤火的镜像 TAR 包。在用户本地调用为 workspace 中的路径,在萤火上调用则为其共享存储中的路径