古いPDP-11でAIモデルを起動:熱心なユーザーは6 MHzのCPUと64 KBのRAMを使用しました
マイクロソフトのベテランが古いコンピュータでトランスフォーマーを動かす
*デイヴ・プラマー(Dave Plummer)– 有名なWindows開発者、*
*最新のAIモデルでも10年以上前の機器で学習できることを示しています。*
何が行われたか
- ハードウェア:PDP‑11 / 44、47歳のコンピュータ、6 MHzプロセッサと64 KB RAM。
- モデル:「Attention 11」– PDP‑11アセンブラでダミアン・ブレート(Damien Buret)が書いたトランスフォーマーネットワーク。
- 学習課題:8つの数値から逆順を作ること。
モデルは例を覚える必要がなく、「反転」ルールを学ぶだけです。
仕組み
1. 初期化 – ランダムな重みで開始、精度ほぼゼロ。
2. 学習 – 各ステップで前向き計算(8ビット固定小数点)と重み更新。
3. パターンの獲得 – 数百イテレーション後、注意機構がルールを「発見」し、推測から実際の知識へ移行。
> 「私たちは学習そのものの簡略化された解剖学を見る…最終的にマシンは見えない境界線を越えて、推測から知識へと進む。」 – プラマー
結果
- 精度:逆順課題で100 %。
- 速度:約350ステップの学習で、PDP‑11/44(キャッシュ付き)で約3.5分。
現代AIへの意味
プラマーは、学習の基本原理―繰り返し行われる算術操作と誤差修正―が、非常に単純なシステムでも完全に実装されていると強調しています。
「この古いマシンは神秘的に考えるわけではなく、数千の数字を更新するだけです。現代AIの本質は、このプロセスを拡大することです。」
したがって、著者はトランスフォーマーの基本メカニズムは、動作環境に関係なく同じであると証明しました。
コメント (0)
感想を共有してください。礼儀正しく、話題に沿ってお願いします。
コメントするにはログイン