附录 A:词汇表

Spring Batch 词汇表

随着时间的推移,业务交易的积累。

批处理应用程序样式

用于将批处理本身指定为一种应用程序样式的术语,类似于在线、Web 或 SOA。它具有输入、验证、将信息转换为业务模型、业务处理和输出的标准元素。此外,它需要在宏观层面进行监控。

批量处理

在一段时间内(如一小时、一天、一周、一个月或一年)积累的一批许多业务事务的处理。它是以重复和可预测的方式将一个过程或一组过程应用于许多数据实体或对象,没有手动元素或单独的手动元素用于错误处理。

批处理窗口

批处理作业必须完成的时间范围。这可能会受到其他联机系统、需要执行的其他相关作业或特定于批处理环境的其他因素的限制。

主要的批处理任务或工作单元。它基于提交间隔设置和其他因素初始化业务逻辑并控制事务环境。

小任务

由应用程序开发人员创建的用于处理 Step 的业务逻辑的组件。

批处理作业类型

作业类型描述了特定类型处理的作业应用。公共领域是界面处理(通常是平面文件)、表单处理(用于在线 PDF 生成或打印格式)和报告处理。

驾驶查询

驾驶查询识别工作要做的工作集。然后,该工作将该工作分解为单独的工作单元。例如,驾驶查询可能是识别具有“待传输”状态的所有金融交易并将它们发送到合作伙伴系统。驾驶查询返回一组要处理的记录 ID。然后每个记录 ID 成为一个工作单元。驱动查询可能涉及连接(如果选择标准跨越两个或多个表),也可能与单个表一起使用。

物品

一项表示要处理的最少量的完整数据。用最简单的术语来说,这可能是文件中的一行、数据库表中的一行或 XML 文件中的特定元素。

逻辑工作单元 (LUW)

批处理作业遍历驱动查询(或其他输入源,例如文件)以执行作业必须完成的一组工作。执行的每个工作迭代都是一个工作单元。

提交间隔

在单个事务中处理的一组 LUW。

分区

将作业拆分为多个线程,其中每个线程负责要处理的整体数据的子集。执行线程可能在同一个 JVM 中,也可能跨越支持工作负载平衡的集群环境中的 JVM。

暂存表

在处理临时数据时保存临时数据的表。

可重启

可以再次执行并假定与最初运行时相同的身份的作业。换句话说,它具有相同的作业实例 ID。

可重新运行

可重新启动并根据先前运行的记录处理管理自己的状态的作业。可重新运行的步骤的一个示例是基于驾驶查询的步骤。如果可以形成驱动查询,以便在重新启动作业时限制处理的行,那么它是可重新运行的。这由应用程序逻辑管理。通常,会在where语句中添加一个条件,以限制由驱动查询返回的行,其逻辑类似于“and processesFlag!= true”。

重复

批处理的最基本单元之一,它通过调用一部分代码的可重复性来定义,直到它完成并且没有错误。通常,只要有输入,批处理过程就可以重复。

重试

使用最常与处理事务输出异常相关联的重试语义简化操作的执行。重试与重复略有不同,重试不是不断调用代码块,而是有状态的,并不断使用相同的输入调用相同的代码块,直到它成功或超过某种类型的重试限制。只有当操作的后续调用可能成功时,它通常才有用,因为环境中的某些东西已经改进。

恢复

恢复操作以能够继续重复过程的方式处理异常。

跳过

跳过是一种恢复策略,通常用于文件输入源,作为忽略未通过验证的错误输入记录的策略。


1. see XML Configuration