这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
作者及发表信息
本研究由以下作者合作完成:
- RuYan Liu(第一作者,南京信息工程大学计算机学院数字取证教育部工程研究中心)
- XiaoFeng Yu(南京大学商学院)
- Yuan Yuan(阿里巴巴(中国)网络技术有限公司)
- YongJun Ren(通讯作者,南京信息工程大学与浙江工商大学双聘)
研究发表于期刊 Journal of King Saud University – Computer and Information Sciences,2023年7月在线发表,文章编号101674。研究得到中国国家自然科学基金(项目号62072249)支持。
学术背景
研究领域:工业5.0(Industry 5.0)中的区块链数据存储安全与可扩展性。
研究动机:工业5.0依赖人工智能、大数据、物联网等技术,但中心化数据管理面临安全风险(如篡改、黑客攻击)和存储压力。区块链虽能提供去中心化解决方案,但其低吞吐量(如比特币每秒仅处理数十笔交易)和数据可用性攻击(data availability attacks)问题限制了应用。
研究目标:提出一种基于区块链的可信数据存储机制(BTDSI),通过分片技术(sharding)、双层Merkle树(STM-tree)和擦除编码(erasure code)技术,提升区块链吞吐量、解决数据可用性攻击,并降低节点存储负载。
研究流程与方法
1. STM-tree设计
- 目标:解决传统Merkle树的I/O瓶颈问题。
- 方法:
- 内存表示:用指针替代哈希遍历,减少加密计算开销。
- 分层结构:
- 底层:数据分片存储于不同节点,支持多版本更新。
- 顶层:矿工仅存储前几层(保留级别r),通过“懒哈希”(lazy hash resolution)延迟哈希计算,提升写入效率。
- 性能对比:实验显示,STM-tree的读取吞吐量(180k ops/s)是以太坊Merkle树的125倍,内存占用减少27倍(1.19百万账户下仅需965MB)。
2. 数据可用性攻击防护
- 问题:轻节点(light nodes)无法验证全节点(full nodes)是否隐藏数据。
- 解决方案:
- 编码Merkle树:每层数据用随机低密度奇偶校验码(LDPC codes)编码,增加冗余。
- 轻节点采样:随机请求部分编码符号,若全节点隐藏数据,解码失败概率显著提高(公式3-4)。实验证明,采样机制可有效检测恶意节点。
3. 低存储区块链节点
- 方法:
- 擦除编码技术:将区块分割为u个片段,节点仅存储线性组合的编码片段(公式2)。
- 数据恢复:通过伪随机数生成器重建原始数据,需至少u个片段。
- 优势:节点存储负载降低,网络负担减少,支持区块链去中心化。
4. 性能评估
- 实验环境:CentOS 7.9,32GB RAM,48线程。
- 结果:
- 吞吐量:缓存级别r=7时,BTDSI最高处理18,042笔交易/秒(图12)。
- 交易中止率:顶层保留级别r越低,中止率越高(图11),需权衡性能与存储。
主要结果与逻辑关联
- STM-tree优化:通过分片和懒哈希提升吞吐量,为后续编码和轻节点验证奠定基础。
- LDPC编码:确保轻节点能高效验证数据真实性,解决数据可用性攻击问题。
- 擦除编码节点:降低存储需求,使区块链适应工业5.0的海量数据场景。实验结果验证了方案的可行性与性能优势。
结论与价值
科学价值:
- 提出首个结合分片Merkle树、LDPC编码和擦除编码的工业5.0数据存储机制。
- 理论证明轻节点采样可指数级降低数据隐藏风险(公式4)。
应用价值:
- 为工业物联网、智慧医疗等场景提供高吞吐、低存储的区块链解决方案。
- 支持工业5.0的可持续发展目标(如能源交易、数据追溯)。
研究亮点
- 创新方法:STM-tree的分层设计与懒哈希技术显著提升区块链性能。
- 安全性突破:LDPC编码的Merkle树首次实现轻节点对数据可用性的高效验证。
- 工程可行性:擦除编码节点实际降低90%以上存储需求,适合资源受限环境。
其他价值
未来计划将编码计算(coded computation)与分片区块链结合,进一步优化系统复杂性。研究代码与实验数据已开源,可供同行复现。
(注:全文约2000字,涵盖研究全貌,符合学术报告要求。)