# 批量导入文件

# Bitkinex

说明

优先推荐使用Bitkinex

优点:支持断点续传,实时显示上传进度,可查看上传日志

前提:历史数据目录不深、文件名不长的情况下,可以使用这种方式。

因为是webdav同步,会受到windows文件名最大255字符的限制,从而导致同步失败。

失败过多的情况下,有可能造成工具卡死。此时可以关闭后重新打开工具,多次尝试同步操作,但文件名超过限制的文件依旧无法同步。

  1. 下载BitKinex,建议下载3.2.3版本

  2. 双击安装BitKinex

  3. 打开BitKinex,右键点击 Http/WebDAV > New > Http//WebDAV,给连接起一个名字,然后右键 Properties

  1. 在弹出框中输入服务器IP+端口、用户名、密码,点击确定

  1. 点击左侧的 Site Map,点击右侧第一条数据,将数据改为:/alfresco/webdav/ ,点击 Update 保存

  1. 双击新连接的名字,即可打开数据传输页面,左侧显示的是服务器数据,右侧显示的是本地数据。左侧依次点击 Sites > {站点ID} > documentLibrary > … ,右侧选择要同步的文件夹,点击中间的绿色向左箭头按钮,即可开始上传数据

# alfresco-bulk-import addon

说明

使用同步插件进行数据导入

前提:系统上需要先安装此插件

优点:可应对大数据量且文件名过长的情况

缺点:需要将数据先传到服务器上

可能出现的问题

由于需要将数据先传到服务器上,从而可能会导致字符编码不一致的问题:

该问题出现在特定的Linux CentOS7版本上(云服务器暂未发现有此问题),字符编码虽然为en_US.UTF-8,但对于windows通过winscp上传的中文名文件夹和文件,命令ls显示为乱码,解决方案如下:

1、首先保证windows是win10版本及以上,win7暂不支持修改字符编码

2、修改windows字符编码到UTF-8:设置》时间和语言》日期、时间和区域格式设置》其他日期、时间和区域设置》区域》更改日期、时间或数字格式》管理》更改系统区域设置》勾选“Beta版:使用Unicode UTF-8提供全球语言支持

  1. 连接服务器,将数据上传到服务器目录下

  2. 浏览器打开alfresco-bulk-import addon页面:http://10.30.50.201:8181/alfresco/s/bulk/import ,输入系统管理员用户名、密码登录,请注意将URL替换为实际的地址

  1. 导入配置
  • Source directory:服务器上的数据路径,例如:/opt/data
  • Target space: 数据导入目标系统文件夹的ID,查看方式如下:
    1. 浏览器访问:http://10.30.50.201:8181/alfresco/s/admin/admin-nodebrowser,请注意将URL替换为实际的地址
    2. 点击 根列表 按钮
    3. 在下方的 子级 中,依次点击 app:company_home > st:sites > cm:{站点ID} > cm:documentLibrary > … 定位到目标系统文件夹,复制其引用ID
    4. 将复制的引用ID填写到 Target space 处
      • Replace:是否覆盖已有同名文件,不勾选,将不会上传系统中已有的文件
      • Dry run:勾选后将只测试,不会进行真正的上传,请勿勾选此选项
  1. 点击按钮 Initiate Bulk Import 按钮,开始导入
更新时间: 2024年7月27日星期六上午11点26分