什么!翻译论文还要消耗token? 关于如何提升marker转英文文档速度,并使用skill批量翻译论文

如何在windows系统中安装Marker并翻译PDF论文https://blog.csdn.net/2301_76571424?spm=1000.2115.3001.5343承接上文,这个转换速度确实是让我破防了一下

痛定思痛还是再次进去这个环境决定要提升下他的运行速度

再次进入环境需要执行的操作有:

1.需先激活marker环境

conda activate marker

2.然后设置镜像

$env:HF_ENDPOINT = "https://hf-mirror.com"

3.确认进入marker环境后执行

(执行单独一个文档的)

marker_single "C:\你的PDF文件路径\example.pdf" --output_dir "C:\输出文件夹路径"

(批量转换)

marker "E:\AI\Input" --output_dir "E:\AI\Output" --output_format markdown --disable_image_extraction

参数作用
marker批量转换命令(不是marker_single
--output_format markdown只输出 markdown 格式
--disable_image_extraction不提取图片
--output_dir输出目录

在设置了只输出 markdown 格式、不提取图片后速度会明显上升

主要改进如下

一、由CPU改为GPU

1.确认显卡和CUDA

nvidia-smi

确认输出包含:

GPU 型号(如 RTX 4060  )

CUDA 版本

GPU 利用率

2.安装 GPU 版 PyTorch