研究顯示AI模型中記憶與推理的不同神經路徑

建造如GPT-5等AI語言模型的工程師從訓練數據中識別了兩個主要處理功能：記憶，涉及回憶如名言或書籍段落等精確文本，以及推理，指的是使用一般原則解決問題。AI初創公司Goodfire.ai的最新研究提供了潛在的確鑿證據，表明這些功能在模型的架構中通過完全獨立的神經路徑運行。

研究揭示了這些路徑之間的清晰區分。十月底發布的一篇預印本論文詳述了當研究人員移除記憶路徑時，AI模型喪失了97%的逐字重現訓練數據的能力，但幾乎保留了所有與邏輯推理相關的能力。

例如，在Allen Institute for AI的OLMo-7B語言模型的第22層中，底部50%的權重組件在記憶數據中顯示出23%更高的激活，而頂部10%在一般、非記憶文本中顯示出26%更高的激活。這種明顯的區別使研究人員能夠有效地切除記憶功能，同時保留其他能力。

一個驚人的發現是，算術運算似乎利用與記憶相同的神經路徑，而不是邏輯推理。移除記憶電路導致數學性能下降66%，而邏輯任務基本不受影響。這可能解釋了AI語言模型在沒有外部輔助的情況下經常數學不佳的原因；它們試圖從有限的記憶中回憶算術，而不是計算，類似於一個死記硬背乘法表而非理解過程的學生。研究結果表明，在現有規模下，語言模型將 “2+2=4” 視作一條記住的事實，而不是一個計算的邏輯運算。

需要注意的是，在AI研究中，“推理”包括一系列不一定等同於人類推理的能力。該研究中記憶去除後保留下來的邏輯推理任務，包括評估真/假陳述和遵循如果-那麼規則，基本上是在學習模式上應用於新輸入。這與更深刻的“數學推理”形成對比，該推理需要證明或創新的問題解決，這是當前AI模型即使在模式匹配能力完好的情況下仍然難以應對的領域。