Jump to content

阅读/网络/PDF機能

本頁使用了標題或全文手工轉換
From mediawiki.org
This page is a translated version of the page Reading/Web/PDF Functionality and the translation is 98% complete.
Outdated translations are marked like this.

2019年7月15日PDF渲染功能的更新

我們已推出新版的PDF渲染器。我們正在審視使用者回饋,但目前尚未發現重大問題。我們可能會採納部分建議,但需說明此非持續開發的專案。換言之,新渲染器經部署驗證後,現已進入維護階段。本頁討論區雖不會被廢棄,但因團隊成員皆有其他要務在身,可能需要較長的回應時間。

關於圖書的製作,我們已將此事交由志願開發者與PediaPress負責。我們樂意就相關問題與他們聯繫,但目前並無參與技術實現層面的計畫。

2019年6月4日PDF渲染功能的更新

我們已對所有專案都部署了適用於單一條目PDF的新渲染器。 我們希望此舉能解決與Electron渲染器相關的問題,該渲染器經常無法如預期般生成PDF文件。 如果有任何關於新的渲染器的問題或者相關錯誤與議題,請隨時與我們聯繫。

2019年3月18日PDF渲染功能的更新

我們即將部署全新渲染器Proton,目前僅剩少量任務構成的阻礙(詳見phab:T181084中的任務圖表)。 一旦決定了部署的日期,我们會发佈另一个更新。 此渲染器将替换电子渲染器作为单页PDF的默认PDF渲染器。

2018年8月17日图书功能更新

PediaPress的样书

这份PDF更新且更全面的示例展示了新的书本渲染效果。 相较于在维基年会上发布的第一版本布局已经有了很大变化。 感谢大家的反馈。 导出功能仍有一些明显的问题:页面断裂,消息框,表格以及数学公式都还可以有很大的改进空间。 这份PDF 专注于国际化脚本和数学公式的样本文件 中就有几处需要解决的问题。 数序公式现在是使用MathML来渲染的,改为使用LaTeX后效果应该会显著提升。

2018年8月8日图书功能更新

我们一直在与PediaPress合作制作和设计新书。他们为我们提供了当前输出的样本,这与最终版本非常相似。我们与PediaPress团队讨论了他们目前正在解决的改进点。如果您对这些样品有任何反馈或其他意见,请在讨论页告诉我们。

2018年4月图书功能更新

图书機能將通过PediaPress回歸。 在我们详细研究了新的生成器之后,我们发现原有图书生成器的核心功能(如页码和目录)在新的生成器上很难执行。 此外,我们的串接代码也有嚴重的问题。 因此,我們不得不尋找替代方案,以恢復維基媒體專案中的PDF图书功能。 我们找到了PediaPress,它是維基百科图书功能的最初赞助者,希望知道他们是否愿意接手将图书生成为PDF的任务。 他們同意了,然後我們目前正在研究细节和制定计划。 他们将会先从基于原来用于创建PDF的旧技术的暫時解决方案开始著手。 这些方案可能会有一些视觉内容(如地图)方面的缺点,但卻意味著是一個較快速的解决方案。 接下来他们计划基于最初解决方案的反馈推出一个新的将HTML转换为PDF的生成器。

2018年1月更新

我们正在准备图书功能的性能测试。在2月初我们会得到更多信息。

2017年九月更新

我们目前的PDF渲染服务,离线内容生成器(OCG)已無法再維護了。 说白了,就是它崩潰了。 维基媒体基金会的阅读团队已著手替換該系統數個月了。 OCG依然在过时的代码上运行,这今后可能导致安全漏洞及其他严重问题。 在过去3个月内,我们針對新渲染模式在PDF创建页面上放了横幅请求反馈。 新的渲染器将以OCG为基础改进其性能——它将能够打印表格和信息框,并将包含朝向最佳易读性努力的样式设计。 我们收集到了很多新模式的积极反馈,并且正著手为新的PDF生成器进行必要更新。

后续補遺:PDF图书渲染功能将关闭一段时间

天不從人願,舊版生成器(OCG)上的重大问题迫使我们在继续对其进行必要的更新之前,就要将它从生成选项中移除。 这讓我們猝不及防。 待我們移除OCG之時,單篇文章的渲染功能將會完成。 然而,在我们评估和完成必要的工作之時,图书PDF的渲染功能将会暂停。 我们最初选择用Electron渲染服务做為替换,但它不支持较大的PDF文件、且在尝试生成有多篇文章的图书时也失败了。 我们会继续尝试找到新的符合我们要求又能够處理文件大小的图书渲染系统。 这實非我们所願, 我們始終無意暫時移除图书的PDF機能。

時間軸:

  • 发佈完整功能的单页渲染器(可打印到PDF)——2017年10月1日
  • 暂停图书PDF渲染功能——2017年10月1日
  • 彻底停用OCG渲染器——2017年10月1日
  • 发佈完整功能的图书渲染器——2018年1月(基于研究结果计划发布的备选渲染系统)

機能:

当前的和即将到来的功能的完整系列,請参见下列

除了更新此页面之外,还将在PDF创建页面的横幅中,技术新闻和一些维基媒体邮件列表中进行传达。

介紹

我們目前的PDF渲染服務,離線內容產生器,已無法再維護了。 说白了,就是它崩潰了。 它原本由第三方建立架構,而目前仍在運行老舊的程式代碼,而這在今後可能導致安全漏洞及其他大規模問題。 如果我們仍然保有PDF機能,遺憾的講,我們將不得不替換它,否則可能會面臨突然被迫關閉該功能的窘境。

此外,它不支持来自社区的大量呈现请求,主要是呈现表格的能力。 我们选择了一项新服务电子渲染服务作为合适的替代品。 我们的下一步是使用电子渲染服务复制OCG提供的功能。 下面,我们将描述我们已经确定的必要功能的主要部分。 我们想邀请谈谈所提供的清单中遗漏的内容或多余内容。 我们还想强调我们未来的PDF渲染计划,以收集初步的反馈。

已知問題

用戶基礎

下表显示了在超过6小时的时间段中使用“下载为PDF”服务的流量示例。 流量按操作系统(OS)、浏览器和浏览器主要版本(例如Windows 7,Chrome v61.*)进行细分。 请注意,我们的大部分流量似乎来自基于Windows的计算机。

OS 浏览器 浏览器主流版本 请求百分比 
其他 其他 - 14.38
Windows 7 Chrome 61 12.42
Windows 10 Chrome 61 8.83
Windows 7 IE 11 7.33
Windows 7 Firefox 56 6.59
Windows 10 Firefox 56 3.82
Windows 10 Edge 15 3.24
Windows 8.1 Chrome 61 3.07
Windows XP Chrome 49 2.2
Windows 10 Chrome 59 1.53
Windows 10 IE 11 1.51
Windows 8.1 Firefox 56 1.31
Windows XP Firefox 52 1.22
Windows 8 Chrome 61 1.15
Windows 8.1 IE 11 1.15
Mac OS X Safari 11 0.9
Windows 7 Firefox 53 0.89
Windows 7 Firefox 52 0.78
Ubuntu Firefox 56 0.78
Windows XP IE 6 0.7
Windows 7 Chrome 55 0.68
Windows 7 Firefox 55 0.62
Mac OS X Chrome 61 0.62
Android UC Browser 11 0.6
Windows 10 Edge 14 0.59
Windows 7 Opera 48 0.53
Android Chrome Mobile 61 0.49
Windows 10 Opera 48 0.44
Windows 7 Chrome 60 0.4
Windows Vista Chrome 49 0.39
Windows 7 Yandex Browser 17 0.37
Windows 10 Firefox 55 0.37
Mac OS X Safari 10 0.36
Windows 10 Chrome 50 0.34
Android Android 4 0.33
Mac OS X Firefox 56 0.33
Windows 10 Chrome 60 0.32
Windows 8.1 Chrome 43 0.3
Android Amazon Silk 60 0.29
Windows 7 Sogou Explorer 1 0.27
Windows 8 IE 10 0.26
Windows 7 IE 8 0.26
Windows 7 IE 9 0.25
Windows 8 Opera 12 0.25
Linux Firefox 52 0.25
Mac OS X Firefox 53 0.24
Windows 7 Firefox 45 0.24
Windows 10 Firefox 57 0.24
Windows 7 Firefox 38 0.22
Windows 10 Firefox 47 0.21

当前功能要求

以下是单篇文章PDF和书籍的PDF呈现的当前要求列表。与当前实现不同的要求以粗体显示。

历史

  • 从维基百科页面呈现PDF文章和书籍由名为OCG的服务处理。 當通过书籍创建者呈现“书籍”时,它使用Collection 扩展中嵌入的OCGOCG有多个问题,尤其是有表格的情況
  • 确定了OCG的多个问题,包括社区对OCG无法呈现表格的投诉。
  • 在德语社区技术愿望清单上,表格的渲染排名第9。
  • 德国分会开始研究PDF中的解决方案,并介绍了Electron。他们计划与OCG一起运行,而不是替换它。
  • 在维基媒体德国公司致力于电子服务的同时,维基媒体基金会OCG服务的负责维护者得出的结论是,必须更换OCG。
  • WMF阅读小组接管PDF长期维护的责任,开始计划在所有项目中实施表格渲染。
  • 阅读团队发起社区咨询,收集有关Electron的反馈。
  • 阅读基础设施和Web团队开始确定将OCG功能移植到Electron服务所需的工作范围。

咨询后更新

根据咨询反馈提出的PDF和打印样式

我们于2017年6月初就PDF呈现器的当前实施情况展开了咨询。在审核了咨询回复后,我们发表了以下意见:

  • 大量用户更喜欢双列格式的单列格式
  • 喜欢双列格式的用户强调他们的偏好基于双列的样式和外观。在单列选项中打印PDF时,一些用户还表达了对字体大小和浪费纸张的担忧
  • 发出以下功能要求:
    • 功能超链接
    • 日期和网址,'此网页从[网址]下载[日期]'
    • 可自定义的布局,标题,TOC的CSS
    • 2列格式的选项
    • 包含/排除图像版本
    • 可修改的利润率
    • 按部分打印,允许您删除引用、不需要的段落、索引等
    • 允许可配置的文本大小

根据反馈,我们将以下内容纳入我们的新打印样式:

  • 超链接
  • 条目信息
  • 较小的字体和书籍样式

上述请求的其余部分将推迟到PDF渲染器的第二次迭代,我们计划在其中构建一个允许自定义可用选项的设置模式。

提案

下面是界定PDF渲染所需的功能的范围的提案:

以下是PDF呈现所需功能范围的建议:

  • 使用侧栏中的“下载为PDF”链接将单个文章呈现为PDF
  • 使用Book Creator工具将多篇文章呈现为PDF
  • 所有文章都将包含文字和图片的归属地
  • 渲染的所有PDF都可以打印表格
    • 用户将能够自定义其PDF格式(可选)

当前与今后实现方式间的不同

OCG 新服務 備註
渲染單個條目
使用圖書創建器渲染多個條目
包含多個條目的目錄
渲染表格 No
署名 开放问题:新服务中的署名位置
样式 Latex 新样式
数栏布局 No
默认双栏布局 试验中 将根据反馈和定量和/或定性测试选择默认的一列或两列布局
輸出格式 PDF與純文字 僅限PDF

设计

新的PDF样式将被设计用于提高可读性。基于社区反馈和定性或定量测试,可以为书籍创建者和/或单个PDF构建对2列布局的支持。

开发和部署路线图

以下是开发和部署路线图的概述,它可能会改变。

  1. 2017年4~5月:
    1. Reading团队为上述功能构建后端支持
    2. 在扩展或缩小提议的功能方面,咨询社区
    3. 为造型进行定性测试
  2. 2017年6~7月:
    1. 实施了新的风格
    2. 首次迭代与OCG一起在所有项目上启动,并对性能进行了比较
    3. 基于协商和确定的边缘情况的迭代
  3. 2017年8~9月:
    1. 必要时进行其他更改
  4. 2017年10月
    1. 在没有OCG的情况下在所有项目上启动了第二次迭

单篇文章

  • 通过选择“下载为PDF”链接,将创建单篇文章的PDF
  • 选择“下载为PDF”后,将生成PDF文件。要下载该文件,用户将选择“下载文件链接”
  • 每个PDF文件将包含以下内容:
    • 条目标题和文字
    • 資訊框 (如果有)
    • 表格 (如果有)
    • 单列布局
    • 頁碼
    • 所有文章图片和标题
    • 链接到文章链接的页面(蓝色链接和外部链接)
    • 文本和图像源、贡献者、和许可证

Phabricator 追蹤系統

所有與 PDF 相關的變更,包括停用 OCG、替換 Electron PDF 渲染器,以及書籍或收藏集擴充功能的任何更新,皆在Phabricator專案Proton下進行追蹤。 專案頁面將顯示所有與PDF相關的任務之近期更新。

书籍

2017年10月推出的功能

注意:目前現有的書籍創建者工作流程將不會進行任何變更。

  • 用户将通过选择“创建书籍”来启动图书创建者
  • 这将导航到当前的图书创建页面
  • 要下载图书,用户将从图书页面选择“下载”链接
  • 用户只能下载PDF格式的图书
  • 书籍将包含单篇文章格式的所有元素以及:
    • 圖書標題頁面
    • 书中每篇文章的参考文献将在本文末尾出现
    • 每个条目将出现在新页面上
    • 文本和图像源,贡献者和许可证的单个部分,包含所有文章的收集贡献

2017年11月至12月期间推出的功能

  • 书籍将包含带有页码的目录
    • 从目录中选择一个部分将导航用户到书中的相应部分

将更新书籍样式以提高可读性

替代

还有另一种将MediaWiki导出到LaTeX,PDF,ODT和EPUB的方法:

https://mediawiki2latex.wmcloud.org/

服务器上的计算资源是有限的。

如果您运行Ubuntu Linux并希望更快地获得结果,则可以安装m2l-pyqtmediawiki2latex