# 批量导入文件
# Bitkinex
说明
优先推荐使用Bitkinex
优点:支持断点续传,实时显示上传进度,可查看上传日志
前提:历史数据目录不深、文件名不长的情况下,可以使用这种方式。
因为是webdav同步,会受到windows文件名最大255字符的限制,从而导致同步失败。
失败过多的情况下,有可能造成工具卡死。此时可以关闭后重新打开工具,多次尝试同步操作,但文件名超过限制的文件依旧无法同步。
下载BitKinex,建议下载3.2.3版本
双击安装BitKinex
打开BitKinex,右键点击 Http/WebDAV > New > Http//WebDAV,给连接起一个名字,然后右键 Properties
- 在弹出框中输入服务器IP+端口、用户名、密码,点击确定
- 点击左侧的 Site Map,点击右侧第一条数据,将数据改为:/alfresco/webdav/ ,点击 Update 保存
- 双击新连接的名字,即可打开数据传输页面,左侧显示的是服务器数据,右侧显示的是本地数据。左侧依次点击 Sites > {站点ID} > documentLibrary > … ,右侧选择要同步的文件夹,点击中间的绿色向左箭头按钮,即可开始上传数据
# alfresco-bulk-import addon
说明
使用同步插件进行数据导入
前提:系统上需要先安装此插件
优点:可应对大数据量且文件名过长的情况
缺点:需要将数据先传到服务器上
可能出现的问题
由于需要将数据先传到服务器上,从而可能会导致字符编码不一致的问题:
该问题出现在特定的Linux CentOS7版本上(云服务器暂未发现有此问题),字符编码虽然为en_US.UTF-8,但对于windows通过winscp上传的中文名文件夹和文件,命令ls显示为乱码,解决方案如下:
1、首先保证windows是win10版本及以上,win7暂不支持修改字符编码
2、修改windows字符编码到UTF-8:设置》时间和语言》日期、时间和区域格式设置》其他日期、时间和区域设置》区域》更改日期、时间或数字格式》管理》更改系统区域设置》勾选“Beta版:使用Unicode UTF-8提供全球语言支持
连接服务器,将数据上传到服务器目录下
浏览器打开alfresco-bulk-import addon页面:http://10.30.50.201:8181/alfresco/s/bulk/import ,输入系统管理员用户名、密码登录,请注意将URL替换为实际的地址
- 导入配置
- Source directory:服务器上的数据路径,例如:/opt/data
- Target space: 数据导入目标系统文件夹的ID,查看方式如下:
- 浏览器访问:http://10.30.50.201:8181/alfresco/s/admin/admin-nodebrowser,请注意将URL替换为实际的地址
- 点击 根列表 按钮
- 在下方的 子级 中,依次点击 app:company_home > st:sites > cm:{站点ID} > cm:documentLibrary > … 定位到目标系统文件夹,复制其引用ID
- 将复制的引用ID填写到 Target space 处
- Replace:是否覆盖已有同名文件,不勾选,将不会上传系统中已有的文件
- Dry run:勾选后将只测试,不会进行真正的上传,请勿勾选此选项
- 点击按钮 Initiate Bulk Import 按钮,开始导入