从零构建一个全新的、与现有所有AI架构无关的类脑认知系统。不预设任何功能模块,模拟大脑皮层的Pr-Al分子梯度轴,让网络在与环境和任务的交互中自发分化出不同功能区域。
| 创新 | 说明 | 人脑对应 |
|---|---|---|
| 层级预测编码 | 4层网络,每层独立预测,预测误差驱动学习 | 皮层分层结构(V1→V2→V4→IT) |
| Pr-Al功能分化 | Layer1-2倾向即时预测(Pr),Layer3-4倾向全局模式(Al) | 双梯度轴理论(Science 2026) |
| 冲突驱动的IZ循环 | Pr与Al预测不一致时自动触发反思循环 | 前扣带皮层冲突监测+前额叶介入 |
| 五大类脑机制 | 赫布可塑性、多巴胺奖励、好奇心、睡眠固化、侧向抑制 | 全部有神经科学依据 |
| 零借鉴设计 | 无Transformer、无SSM、无RNN、无CNN | 完全独立的架构路径 |
输入 Token (B, T) → Layer 1 (512, Pr倾向) → 预测 t+1 token
↓ 预测误差
Layer 2 (512) → 预测 3步后语义
↓ 预测误差
Layer 3 (512) → 预测 5-8步后语义
↓ 预测误差
Layer 4 (512, Al倾向) → 预测全局一致性
│
冲突检测: |L1 - L4| > 阈值?
是 → IZ循环反思 (3步自激)
│
四层表征拼接 → 最终预测
| 模型 | 参数 | 测试PPL | 说明 |
|---|---|---|---|
| Pr-Al (我们) | 93M | 3.2 | 10 epoch, 128 token |
| GPT-2 Small | 124M | 2.5 | 同等条件训练 |
- 参数比GPT-2少25%,在没有任何超参数搜索的情况下达到GPT-2的78%水平
- 同时具备GPT-2完全不具备的五大类脑机制
`nPrAlmodel/
├── protocortex.py # 核心架构:4层预测世界模型
├── neurons.py # 神经元层(含轴向码Pr-Al分化)
├── neurons_hierarchical.py # 层级预测编码神经元
├── connections.py # 动态连接图(赫布生长)
├── al_memory.py # 联想记忆模块(Al通路)
├── protocortex_config.py # 全局配置
├── dual_source.py # 双源编码器
├── reservoir_cuda.cpp # CUDA C++ 加速内核
├── data/
│ ├── trajectory_generator.py # Lissajous轨迹生成器
│ └── dataset.py # 数据集封装
├── baselines/
│ ├── baseline_lstm.py # LSTM基线
│ ├── baseline_transformer.py # Transformer基线
│ ├── baseline_gpt2_fair.py # GPT-2公平对比
│ └── baseline_mamba.py # SSM基线
├── anomaly_sequence_task.py # 异常序列检测任务
├── sequence_reasoning_task.py # 数学序列推理任务
├── train_full.py # 完整训练脚本
├── train_10pct.py # 10%数据快速训练
├── compare_sota.py # SOTA对比脚本
├── eval_real.py # 标准基准评估
├── requirements.txt # Python依赖
└── README.md
`n
---
- Python 3.10+
- PyTorch 2.1+ (CUDA 12.1)
- RTX 4070 Super (12GB) 或同等GPU
- 32GB 内存
- Windows / Linux
git clone https://github.com/你的用户名/PrAlmodel.git
cd PrAlmodel
conda create -n pral python=3.10 -y
conda activate pral
pip install -r requirements.txtpython train_10pct.py
python train_full.py
python eval_real.py
python gpt2_baseline.py
python compare_sota.py
Lissajous轨迹预测 — 验证Pr-Al梯度轴的基本可行性
Copy任务记忆 — 测试长程记忆能力
异常序列检测 — 冲突信号异常检测 AUC=0.99
语言建模初步 — PPL 47.2→7.0
事件驱动稀疏激活 — 速度提升2x
层级预测编码 — 四层独立预测,每层独立目标
五大类脑机制集成 — 赫布、多巴胺、好奇心、睡眠、侧向抑制
SOTA对比 — wikitext-103 PPL=3.2,接近GPT-2 Small
扩大epoch数(10→100),进一步提升PPL
超参数搜索(学习率、层数、神经元数)
IZ循环参与梯度训练
上下文长度扩展(128→512)
多模态输入(视觉、音频编码器接入L1/L2)
扩展到更大规模(93M→300M→1B+)
与世界模型结合(预测物理/社会规律)
LAMBADA/HellaSwag推理基准测试
Brain-wide mapping reveals dual-gradient architecture of primate cortex. Science, April 17, 2026.
Rao & Ballard (1999). Predictive coding in the visual cortex.
Friston (2005). A theory of cortical responses.
Hassabis et al. (2017). Neuroscience-inspired artificial intelligence.
Hinton (2022). The forward-forward algorithm.
StarlitPupils
MIT License
⭐ 如果对你有帮助,欢迎 Star!
📧 作者现承接计算机视觉项目(工业缺陷检测/视频分析/模型优化部署),联系邮箱:1526123439@qq.com