Skip to content

StarlitPupils/PrAlmodel

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Project Neural Genesis — Pr-Al 发育式类脑人工智能架构


项目概述

从零构建一个全新的、与现有所有AI架构无关的类脑认知系统。不预设任何功能模块,模拟大脑皮层的Pr-Al分子梯度轴,让网络在与环境和任务的交互中自发分化出不同功能区域。

核心创新

创新 说明 人脑对应
层级预测编码 4层网络,每层独立预测,预测误差驱动学习 皮层分层结构(V1→V2→V4→IT)
Pr-Al功能分化 Layer1-2倾向即时预测(Pr),Layer3-4倾向全局模式(Al) 双梯度轴理论(Science 2026)
冲突驱动的IZ循环 Pr与Al预测不一致时自动触发反思循环 前扣带皮层冲突监测+前额叶介入
五大类脑机制 赫布可塑性、多巴胺奖励、好奇心、睡眠固化、侧向抑制 全部有神经科学依据
零借鉴设计 无Transformer、无SSM、无RNN、无CNN 完全独立的架构路径

架构图

输入 Token (B, T) → Layer 1 (512, Pr倾向) → 预测 t+1 token
↓ 预测误差
Layer 2 (512) → 预测 3步后语义
↓ 预测误差
Layer 3 (512) → 预测 5-8步后语义
↓ 预测误差
Layer 4 (512, Al倾向) → 预测全局一致性

冲突检测: |L1 - L4| > 阈值?
是 → IZ循环反思 (3步自激)

四层表征拼接 → 最终预测


实验结果

语言建模基准 (wikitext-103 测试集)

模型 参数 测试PPL 说明
Pr-Al (我们) 93M 3.2 10 epoch, 128 token
GPT-2 Small 124M 2.5 同等条件训练
  • 参数比GPT-2少25%,在没有任何超参数搜索的情况下达到GPT-2的78%水平
  • 同时具备GPT-2完全不具备的五大类脑机制

项目结构

`nPrAlmodel/
├── protocortex.py              # 核心架构:4层预测世界模型
├── neurons.py                  # 神经元层(含轴向码Pr-Al分化)
├── neurons_hierarchical.py     # 层级预测编码神经元
├── connections.py              # 动态连接图(赫布生长)
├── al_memory.py                # 联想记忆模块(Al通路)
├── protocortex_config.py       # 全局配置
├── dual_source.py              # 双源编码器
├── reservoir_cuda.cpp          # CUDA C++ 加速内核
├── data/
│   ├── trajectory_generator.py # Lissajous轨迹生成器
│   └── dataset.py              # 数据集封装
├── baselines/
│   ├── baseline_lstm.py        # LSTM基线
│   ├── baseline_transformer.py # Transformer基线
│   ├── baseline_gpt2_fair.py   # GPT-2公平对比
│   └── baseline_mamba.py       # SSM基线
├── anomaly_sequence_task.py    # 异常序列检测任务
├── sequence_reasoning_task.py  # 数学序列推理任务
├── train_full.py               # 完整训练脚本
├── train_10pct.py              # 10%数据快速训练
├── compare_sota.py             # SOTA对比脚本
├── eval_real.py                # 标准基准评估
├── requirements.txt            # Python依赖
└── README.md
`n
---

快速开始

环境要求

  • Python 3.10+
  • PyTorch 2.1+ (CUDA 12.1)
  • RTX 4070 Super (12GB) 或同等GPU
  • 32GB 内存
  • Windows / Linux

安装

git clone https://github.com/你的用户名/PrAlmodel.git
cd PrAlmodel
conda create -n pral python=3.10 -y
conda activate pral
pip install -r requirements.txt

快速训练(10%数据,约10分钟/epoch)

python train_10pct.py

完整训练(100%数据)

python train_full.py

评估模型

python eval_real.py

与 GPT-2 对比

python gpt2_baseline.py
python compare_sota.py

实验历程

Lissajous轨迹预测 — 验证Pr-Al梯度轴的基本可行性
Copy任务记忆 — 测试长程记忆能力
异常序列检测 — 冲突信号异常检测 AUC=0.99
语言建模初步 — PPL 47.2→7.0
事件驱动稀疏激活 — 速度提升2x
层级预测编码 — 四层独立预测,每层独立目标
五大类脑机制集成 — 赫布、多巴胺、好奇心、睡眠、侧向抑制
SOTA对比 — wikitext-103 PPL=3.2,接近GPT-2 Small

下一步路线图

扩大epoch数(10→100),进一步提升PPL
超参数搜索(学习率、层数、神经元数)
IZ循环参与梯度训练
上下文长度扩展(128→512)
多模态输入(视觉、音频编码器接入L1/L2)
扩展到更大规模(93M→300M→1B+)
与世界模型结合(预测物理/社会规律)
LAMBADA/HellaSwag推理基准测试

参考文献

Brain-wide mapping reveals dual-gradient architecture of primate cortex. Science, April 17, 2026.
Rao & Ballard (1999). Predictive coding in the visual cortex.
Friston (2005). A theory of cortical responses.
Hassabis et al. (2017). Neuroscience-inspired artificial intelligence.
Hinton (2022). The forward-forward algorithm.

作者

StarlitPupils

许可证

MIT License

⭐ 如果对你有帮助,欢迎 Star!
📧 作者现承接计算机视觉项目(工业缺陷检测/视频分析/模型优化部署),联系邮箱:1526123439@qq.com

"我们不是在现有架构上修修补补,而是从零开始,模拟大脑最基本的组织原则——让智能从结构中自发涌现。"

Releases

No releases published

Packages

 
 
 

Contributors