大模型+区块链学习的综合报告

ZQverse 2025-07-11 12:31 70 阅读5分钟

我将尝试从原理，关键技术和动手实践三个方面梳理我对区块链和大模型这两项技术的认识。

区块链

我对区块链的理解

我理解区块链是一种不依赖第三方中介，就能让多个参与者建立共识、共享数据的分布式系统。其核心是用技术替代信任，让数据具有公开、不可篡改的特性。

关键技术构成

链式结构+哈希函数保证区块链不可篡改
共识机制（PoW、PoS）保证区块链的去中心化和安全
智能合约用代码表示规则，满足条件自动执行
投票智能合约案列演示
我重点关注智能合约部分，并在 Remix 中亲手构建了一个投票合约。它体现了几个核心机制：
规则写在代码里，一旦部署无法更改；
所有账户平等执行，不能重复投票；
投票记录公开透明，可被任何人查询。

不同账户切换投票，getwinner找出获胜者，hasvoted查看已经投票的账户信息。

如果想更改投票，或者投两次票会出现"You alreadly voted"

这个投票合约虽然很简单，但是充分体现了区块链的核心思想，代码就是规则，由网络强制执行数据全网共识无法篡改，所有账户平等调用。
大模型
我对大模型的理解
我理解的大模型是像ChatGPT、Claude等，不再依赖人工设定规则，而是通过对海量数据的预训练，自主学会语言生成和理解，具备了和人类一样的语言能力。
关键技术构成
底层结构是 Transformer，这是一种善于理解上下文关系的神经网络架构。通过在互联网上抓取大规模文本进行预训练让模型逐步学会了语言。
在预训练的基础上对大模型进行微调，就是让它偏向一个领域进行调整，使其更擅长这个领域
LoRA是一种轻量的微调技术不需要训练整个大模型，只是在模型里插入一些可以学习的模块，只训练这些模块就可以让模型学到新任务。
LoRA 微调演示
我在 Colab 上微调了 GPT2，仅用几条问答样本，就让模型学会了我的表达方式。虽然回答有些复读，但说明微调是有效的、可控的。

我使用了PyTorch框架，训练100次，损失函数loss为3.28，最终只能重复我的问题。

然后训练1000次，损失函数降到0.11，可以根据我的数据回答问题。

我确实只用了几条数据，是为了快速演示，结果只能学到我的固定回答，这就表现为过拟合，而且泛化能力有限，要提升泛化能力需要更多的样本数据。
融合思考
我在学习过程中看到一篇文章《BC4LLM: Trusted AI When Blockchain Meets Large Language Models》，思考两者融合的可能性：
区块链解决的是“可信”和“可追溯”；
大模型的问题是“不可解释”和“难监管”。
作者提出将大模型的训练数据、输出行为写入区块链，实现模型行为的审计与信任重构。
我认为这对两者的融合挺重要的，比如当模型用于生成合同、医疗建议时，如果出错，必须可溯源、可监管。这种融合方向应该是一个值得深入探索的领域。