当前位置:首页>资源汇总>干货分享>MinerU,开源的高质量数据提取工具,支持网页/多格式电子书提取

MinerU,开源的高质量数据提取工具,支持网页/多格式电子书提取

MinerU 是一款由上海人工智能实验室 OpenDataLab 团队开发的开源高质量数据提取工具,专注于从复杂 PDF 文档、网页和电子书中高效提取内容。它能够将包含图片、公式和表格的多模态 PDF 转化为 Markdown 格式(如 markdown、json),且具备高精度解析工具链,支持多种输入模型,支持自动识别乱码、转换公式为 LaTex、保留文档结构,支持176种语言的准确识别,适用于学术、财务、法律等领域,兼容 Windows/Linux/Mac 平台。

网站地址

重要声明

本站资源均来自网络分享,仅用于站内学习或测试研究使用。如有侵犯您的权益请私信留言,我们会第一时间审核。未经原版权作者许可,禁止用于任何商业途径,请在下载二十四小时内删除!


如果遇到需要升级才可获取的素材,建议升级对应的权限。 全站 90% 以上的素材“均有备份”。 本站资源均以主流网盘分享,以 7z、rar、分卷等常见的格式压缩,为防止有人压缩软件不支持 7z 格式,7z 解压,建议下载 7-zip,zip、rar 解压,建议下载 WinRAR 手机下载解压教程详见 帮助中心 。

干货分享

SnapTik,提供在线的视频下载器,支持 4K/8K 视频下载

2024-08-22 15:30

干货分享

简搜题,提供专业的搜题找答案网站

2024-08-23 03:30

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
站内搜索