慧度科技-数字报电子期刊解决方案

数字报电子期刊解决方案

报纸扫描标引加工平台是一套科技含量极高的软件系统，由扫描生产流程子系统和报纸发布子系统组成，该系统的基本原理是通过扫描设备，将纸介质的报纸扫描成数字图像，再经过图像处理、版面分析、文字识别、文字校对、版面重构、标引加工、文档精细加工等一系列步骤，最终形成可以方便应用的精美的电子文档，在此基础上，对这些电子文档进行数字化发布，形成可以供全网使用的数字资源。

方案咨询

方案架构

报纸、期刊、图书出版物数字化流程

扫描和修图

按照日期、版面清点数量，确认其完整性、可识别性、可扫描性。选择纸质出版物中保存质量最佳的版本，以保证扫描质量的最优化。在核对过程中同时记录版面的残、缺、漏、损页，通过记入交接登记表单，详细记录出版物的缺损情况。并及时将版面的残、缺、漏、损等情况及时与出版单位汇报，以便进行资料补充。
清点核对

根据出版物不同版面大小，适配专业扫描设备进行扫描。对扫描的电子图像进行纠偏、去污、去黑边等处理。根据图像质量和资料质量，针对性地进行字迹锐化、去除图像杂点、去除图像局部脏点等处理工作。
OCR文字识别和校对

OCR识别技术是自动识别图片上汉字、数字、字母等信息的计算机应用技术。对于纸张完好，印刷精良的报刊，保证识别最佳效果；对于早期报纸，出于印刷技术和保存环境的原因，识别率降低，进行多次校对以保证数据最终输出质量。对于个别特殊文字，需要通过人工造字修字处理，确保文章的完整性。
PDF还原、输出

输出的PDF让其图像层和文字层的文字定位准确，保证反显区域与文字区域相差1/3字符以内。软件可以通过对字、行、块来调整。
文章标引

将完成识别校对的数字化文字内容按照不同字段进行标引（如标题、作者、时间、版名、版次等）。对图片、广告、插图时，单独制作成JPG图片，统一按照出版日期进行命名。
NLP智能标引和XML输出

通过智能著录标签技术，进一步提升数据品质，细化数据粒度。对于人工处理好的半成品数据，通过NLP智能标引技术，对每篇文章的文章摘要、报道对象、人物、来源、地点、体裁等著录项目进行自动提取标引。文章关联信息和文章客观信息著录项目（红色标签）与智能语义分析著录项目（蓝色标签），极大丰富了文章的新闻属性粒度，通过结构化提升了数据品质，为数据基础应用夯实了基础。

将报名—日期—版面—文章等信息进行关联，形成标签丰富、著录完整、结构合理、格式合规的XML数据文件，进行保存和备份，准备输出至数据库。
自然语义数据智能著录技术

将XML文件、PDF版面文件导入到数据库中，并且建立对应关联。数据库自动对入库数据文件质量实施自检，对信息缺失、重复信息等问题文件进行报警，不允许入库。

数据品质要求符合以下几项：

1.报纸扫描采用彩色格式、分辨率400–600 DPI，原始资料质量欠佳时，通过提高扫描分辨率保证图像清晰；

2.图像的偏斜角度小于5度；

3.版面和数字化内容关联准确率100 % ；

4.文字及符号错误率低于万分之一；

我们的优势

多终端发布

支持网站、APP、微信、小程序、IPAD、大屏等终端发布。
界面定制

系统内置多套优质模板，支持页面模板按需定制。
功能丰富

系统集成在线阅读、快速检索、热区处理、版面切换、查看往期和网友互动等丰富功能模块。
架构先进

摒弃传统的先排版做标记再导入的方法，文字、图片可由后台上传发布管理，用户易于操作，制作简单可以轻松发布电子报刊。
专业专注

20年专注于数字报软件开发：99cms数字报刊发布系统是一款行业内领先的多媒体数字报刊管理系统。
独立系统

手机报刊与网站数字报刊内容即使同步、以独立期刊形式发布于手机端的软件系统；支持创建多份报纸；支持期号、版面管理，简单易用；以版面热区方式管理文章。编辑无需重新制作可以直接生成报纸版面展示形态的手机端产品。
老报老期刊数字化及管理发布

提供了从报纸扫描、数据清洗、OCR识别，PDF反解、质检入库到数字化发布的一整套完整的报纸数字化解决方案。
自有反解软件

反解引擎将报刊PDF素材反解生成XML数据文件后上传到服务器端管理程序，再生成多媒体数字报刊在线发布和浏览。

使用场景

报社电子报纸
出版社电子书籍
图书馆书籍
智能数据资源库

99CMS 数字杂志系统

系统参照杂志的功能，按照新平台的应用开放协议进行重新开发，按照模块的方式进行接入，预留二次定制开发的空间。由于目前主要是提供图片浏览的模式，所以可以基于杂志应用进行改造即可。这样除了将 app 前端的展示进行风格统一，也可以在 99CMS 后台进行杂志的封面管理、每一页的杂志管理，系统可以自动生成缩略图，满足不同终端的需求。

99CMS 数字杂志系统

1．馆藏数字化，即图书馆利用信息存贮技术把各种媒体信息加工成计算机可识别的数字化信息资源,形成电子文献,实现知识信息载体的革命性变革。
2．传递网络化,即利用网络技术和通讯技术环境,数字图书馆可以为用户提供高速跨库连接的信息存取服务,实现更大范围的知识信息交流和获取。
3．资源共享化,信息技术和网络技术打破了地域界限,使图书馆的联合在网上实现,各信息服务系统相互融合,用户能随时随地与任何系统相交互,促进信息资源的合理流动,实现广泛的信息交流和资源共享。