一种基于区块链的去中心化联邦学习数据共享方法
摘要文本
本发明公开了一种基于区块链的去中心化联邦学习数据共享方法,属于数据共享技术领域,要解决的技术问题为如何基于区块链和联邦学习克服数据共享中的隐私泄露、单点故障以及中毒攻击。包括如下步骤:每个数据拥有者对本地数据集进行数据摘要计算;基于数据共享请求中指定数据摘要的向量表示、根据向量相似度从区块链中选取节点作为联邦学习训练者,基于联邦学习请求者和联邦学习训练者构建共享小组;联邦学习请求者通过区块链将初始模型广播至各联邦学习训练者,共享小组内每个节点进行迭代模型训练直至得到最终的全局模型。。关注公众号马 克 数 据 网
申请人信息
- 申请人:齐鲁工业大学(山东省科学院)
- 申请人地址:250000 山东省济南市长清区大学路3501号齐鲁工业大学
- 发明人: 齐鲁工业大学(山东省科学院)
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于区块链的去中心化联邦学习数据共享方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410015208.4 |
| 申请日 | 2024/1/5 |
| 公告号 | CN117521151A |
| 公开日 | 2024/2/6 |
| IPC主分类号 | G06F21/62 |
| 权利人 | 齐鲁工业大学(山东省科学院) |
| 发明人 | 禹继国; 卢之琰; 王桂娟; 董安明; 韩玉冰; 黄耀 |
| 地址 | 山东省济南市西部新城大学科技园 |
专利主权项内容
1.一种基于区块链的去中心化联邦学习数据共享方法,其特征在于,应用于区块链、联邦学习框架、星际文件系统以及数据共享参与者之间,所述方法包括如下步骤:数据处理:每个数据拥有者对本地数据集进行数据摘要计算,得到包括数据类型、数据格式和数据量的数据摘要;区块链注册:每个数据拥有者作为节点、基于其节点ID和数据摘要注册至区块链;共享小组构建:作为联邦学习请求者的节点向区块链发起数据共享请求,基于数据共享请求中指定数据摘要的向量表示、根据向量相似度从区块链中选取节点作为联邦学习训练者,基于联邦学习请求者和联邦学习训练者构建共享小组,共享小组内每个节点向其它节点发送小组注册信息,小组注册信息包括节点的公钥和数据摘要;数据共享:联邦学习请求者通过区块链将初始模型广播至各联邦学习训练者,共享小组内每个节点进行迭代模型训练直至得到最终的全局模型,其中,在每轮模型训练时,基于共识机制将共享小组内所有节点划分为委员会节点和非委员会节点,并根据节点在当前轮次输出训练后本地模型的质量、选取一个委员会节点为委员会主节点,委员会主节点对所有节点当前轮次的本地模型梯度进行聚合,得到当前轮次的全局模型梯度,本地模型梯度中添加有差分隐私噪声,委员会节点基于全局模型的质量对当前轮次全局模型进行验证审批后,委员会主节点将签名后全局模型以及全局模型质量广播至共享小组内其它所有节点、并发送至星际文件系统。