(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111672670.4
(22)申请日 2021.12.31
(71)申请人 河海大学
地址 210024 江苏省南京市 鼓楼区西康路1
号
(72)发明人 陆宇翔 许国艳
(74)专利代理 机构 南京苏高专利商标事务所
(普通合伙) 32204
代理人 张弛
(51)Int.Cl.
G06F 9/48(2006.01)
G06F 9/50(2006.01)
G06F 9/54(2006.01)
G06F 9/455(2006.01)
(54)发明名称
一种基于干扰等级和通信代价的批调度系
统及方法
(57)摘要
本发明公开了一种基于干扰等级和通信代
价的批调度系统及方法, 包括批调度模块和GPU
调度优化模块, 批调度模块对podgroup中pod进
行调度, 并判断podgroup是否有足够的pod调度
成功, 若满足要求则为这些pod绑定到对应节点;
否则该podgroup中的所有pod回滚, 等待重新调
度; GPU调度优化模块计算podgroup中所有任务
在GPU上的平均性能降级以及干扰等级; 通过GP U
之间的模型同步代价和更新模型数据计算通信
代价; 将干扰等级和通信代价加权和作为适应度
并使用混合蛙跳算法不断更新调度策略得到最
终的调度策略。 本发明通过插件化方式实现批调
度, 避免了引入其他调度器时造成的缓存一致性
问题; 结合干扰等级和通信代价, 使用混合蛙跳
算法来找 寻全局最优解, 可以有效提高分布式训
练任务的效率。
权利要求书5页 说明书13页 附图5页
CN 114253693 A
2022.03.29
CN 114253693 A
1.一种基于干扰等级和通信代价的批调度系统, 其特征在于, 包括批调度模块和GPU调
度优化模块,
批调度模块, 用以对调度队列中的pod进行排序, 使得同组pod位于调度队列的同一区
域; 从调度队列队头取出一个pod, 根据用户为pod申请的资源, 从节点列表中选出所有满足
资源需求的节点, 并按照打分策略对所有满足资源需求的节 点进行打分, 得到最高分节点;
对最高分节 点进行预调度处理, 预占用节 点资源; 判断podgr oup中是否有足够的pod调度成
功, 若满足要求, 则为这些pod绑定到对应节点; 若不满足要求, 则该podgroup中的所有pod
回滚, 等待重新调度; 其中, 批调度以podgroup为单位, po d是由一个或多个共享网络、 CPU、
GPU等资源的容器组成的容器组;
GPU调度优化模块, 用以对GPU资源进行细粒度调度; 从podgroup中选择一个任务, 其 中
pod为任务, 且一个pod为一个任务; 将选择的一个任务与GPU上正在运行的n个任务分别进
行向量表 示得到n+1个任务向量; 将n +1个任务向量输入多层感知机, 得到所选任务在GPU 上
的平均性能降级; 重新选择podgr oup中的任务, 重复上述操作, 直到得到podgr oup中所有任
务在GPU上的平均性能降级后, 计算 得到干扰 等级; 定义GPU之间的模型同步代价为mscij; 根
据GPU之间的连接方式构建GPU拓扑树并根据GPU拓扑树权值计算mscij; 定义更新模型数据
为mudsij, 使用同步代价和更新模型数据计 算得到通信代价, 并将通信代价加权后求和得到
通信代价加权和; 将干扰等级和通信代价加权和作为适应度, 再使用混合蛙跳算法不断更
新调度策略, 得到最终的调度策略。
2.根据权利要求1所述的基于干扰等级和通信代价的批调度系统, 其特征在于: 在批调
度模块中,
根据pod所属podgroup的优先级进行排序, 若优先级相同再根据podgroup的初始化时
间戳进行排序; 对于未指定podgroup的pod, 调度器将该pod划分到默认的podgroup中;
根据pod需要 的资源, 对集群的所有节点进行过滤, 选出满足资源需求的节点; 根据打
分策略为节点打分, 选出打分最高的节点, 对最高分节点进行预调度处理, 预占用节点资
源;
判断podgroup中是否有足够的pod调度成功, 若在podgroup中设置的过期时间前满足
要求, 则为这些pod绑定到对应节点; 若在该时间内未满足要求, 则将该podgroup中的所有
pod回滚, 释放预占用的资源, 等待重新调度; 其中, 过期时间根据任务需求设置 。
3.根据权利要求1所述的基于干扰等级和通信代价的批调度系统, 其特征在于: 在GPU
调度优化模块中, 干扰等级的计算过程 为:
定义干扰感知的多层感知机:
α1=φ1(T1,T2,...,Tn+1)
其中, W1……WL‑1为权重矩阵, L是多层感知机层数;
为权重矩阵的转置;权 利 要 求 书 1/5 页
2
CN 114253693 A
2b1……bL为偏置向量; g2……gL为Relu激活函数; h为输出层权重; hT为输出层权重的转置;
α1……αL‑1为多层感知机中间层的输入; φ1……φL为多层感知机中间层的输出, T1……Tn+1
为任务向量; σ 为映射方法;
为性能降级向量的预测值;
在多层感知机的训练过程中, 通过梯度 下降算法更新权重矩阵W, 来最小化性能降级向
量的预测值
与性能降级向量的目标值zt之间的均方损失, 并使用正则化防止过拟合, 损失
函数L为:
其中, λ为 正则化权 重; wt为训练样例权 重; m为任务向量维数;
将n+1个任务向量
输入多层感知机, 得到性能降级向量的预测值
该性能降级向量
的预测值
有n+1个元素, 分别对应n+1个任务的性能降级, 再通过如下公式计算得到平均
性能降级S Di:
根据分布式训练所有子任务的平均性能降级, 并根据如下计算公式得到干扰等级I
(M):
其中, m为podgroup中的任务数量。
4.根据权利要求1所述的基于干扰等级和通信代价的批调度系统, 其特征在于: 在GPU
调度优化模块中, 通信代价的计算过程 为:
定义GPUi与GPUj之间的模型同步代价 为mscij, 定义更新模型 数据为mudsij;
获取GPU之间的连接关系并根据该连接关系建立GPU拓扑树, 根据GPU拓扑树权值计算
模型同步代价m scij;
根据模型同步代价m scij和更新模型 数据mudsij计算得到通信代价C(M), 计算公式为:
其中, n为GPU个数, i和j为GPU对应的 的编号。
5.根据权利要求1所述的基于干扰等级和通信代价的批调度系统, 其特征在于: 在GPU
调度优化模块中, 使用混合蛙 跳算法不断更新调度策略的过程 为:
定义目标公式为: α I(M)+β C(M); 其中α, β 为权值;
根据任务需求设置收敛值z和最大迭代次数g, 其中 g的默认值 为16;
设置青蛙数量与待调度任务数量相同; 通过目标公式计算每只青蛙的适应值, 并将每
只青蛙按照适应值从高到低进行排序得到排序后的种群;
将排序后的种群划分为m个模因组, 把每个模因组中适应值最好的青蛙标记为Fb, 把排
序后的种群中适应值 最好的青蛙标记为Fg;
通过将模因组中的每个青蛙向该模因组中适应值最好的青蛙进行跳动, 来进行局部更权 利 要 求 书 2/5 页
3
CN 114253693 A
3
专利 一种基于干扰等级和通信代价的批调度系统及方法
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:59:25上传分享