pdf - 有没有一种方法可以自动化/编写脚本(例如 perl)标记的 pdf 文件以查看它是否符合

我们有一些生成 PDF 的工具。我们想要自动化一些测试以确保生成的 PDF 被标记 (PDF/UA) 并且标记有效。

有很多交互式跳棋(acrobat、PDF Accessibility Checker (PAC) 等)。他们根据 matterhorn protocol 在 PDF 中生成通过/未通过事件的报告.我想自动生成这些类似的报告。

我最近发现了一个 perl 模块,PDF::API2 ,这可能很有希望,但大约 15 年前我只用 perl 编写了一些简单的测试。有没有人使用该模块进行标记的 pdf 检查,或者您是否使用不同的脚本语言完成了这项工作?

最佳答案

Adobe Acrobat 中使用的技术(在其 Preflight 组件中)是由 callas software 开发的(注意:我与这家公司有密切关系)。 callas 还开发了名为 pdfaPilot 的相同技术,它有手动版本,也有命令行和 SDK 版本,可完全自动化该过程。

但是!

正如 Max Wyss 在他对您的问题的评论中所述,PDF/UA 检查分为两部分。一些规范的规则可以通过软件自动测试,但很多不能。

举个例子,可以通过编程方式验证 PDF 文档中的所有文本是否都标记有一种语言。检查这些语言标签是否真的是另一回事。

pdfaPilot Desktop 实际上允许您自动检查可能的内容,然后允许您将 PDF/UA 文件转换为视觉标记的 HTML,这使得验证文本的含义和结构是否正确变得更加容易。

换句话说,是的,这样的技术是存在的,但它永远不会 100% 完成。

关于pdf - 有没有一种方法可以自动化/编写脚本(例如 perl)标记的 pdf 文件以查看它是否符合 pdf/ua 标准?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33443011/

相关文章:

python - 使用来自用户的 url 的服务器端 urllib2.urlopen 的安全注意事项

xaml - 在 UWP 应用程序中覆盖来自 Generic.xaml 的资源

python - 在 OpenGL 中的 3D 模型后面绘制背景视频

python - 如何在 PLY 中做一个 IF 语句?

java - Java 中字符串的反序列化

jakarta-ee - Mybatis:log4j:WARN 找不到记录器的附加程序 (org.a

python - flask 迁移 : Alembic converting choices int

c# - 运行已编译的 C# 程序 (.exe) 的要求

python - 我可以告诉 PyInstaller 打包我的整个源代码树吗?

javascript - MDL upgradeElement/upgradeDom 不工作