← Späť na projekty
Publikovaný výskum

HAI

Publikovaný nezávislý výskum: „The Brain Instruction Set — na modeli nezávislá báza sémantických primitív v LLM, od správania k mechanizmu.“

HAI — Human Artificial Intelligence
152
sémantických terminálov
9
modalít
0,929
RSA medzi zdrojmi
DOI
publikované (Zenodo)

HAI (Human Artificial Intelligence) skúma hypotézu Brain Instruction Set (BIS) — myšlienku, že ľudské poznanie sa dá reprezentovať vo vektorovom priestore so zdieľaným, sémanticky ukotveným jadrom a individuálnou väzbovou vrstvou nad ním. Myšlienka pochádza z roku 2000 a dnes je testovateľná voči reálnym jazykovým modelom.

Rekurzívnym rozkladom grafu 13 534 konceptov a 44 682 vážených hrán štúdia obnovila konečnú, zdieľanú bázu 152 overených sémantických „terminálov“ v 9 modalitách — pričom objavovanie nových terminálov saturovalo pod 2 %, čo podporuje tézu o konečnosti. Jadro 16 terminálov nezávisle potvrdil model od OpenAI aj od Anthropicu (81 % zhoda modalít).

Dve validačné brány replikovali tri modely z dvoch labov: reprezentačná podobnosť medzi zdrojmi bola vysoká (RSA = 0,929), perspektíva zdroja bola dekódovateľná z obsahu na 98,4 %, a geometria podobnosti terminálov reprodukovala známu psychofyziku bez zmyslového dohľadu (čuch ≈ 1D, chuť ≈ 2D, sluch ≈ 3D, zrak/hmat ≈ 5D). Štúdia výslovne meria štruktúru reprezentácií, nie qualia.

Nad rámec správania (v1.2) posúva BIS k mechanistickej báze: sondovanie open-weight modelov (Gemma-2-2B, Qwen2.5-1.5B, Phi-3.5-mini) ukazuje, že terminály sú lineárne čitateľné (AUC 0,86–0,93) a kauzálne ovplyvniteľné, vysvetlená variancia vrcholí v strede siete (R² = 0,59, vrstva 14) a jadro sa zhoduje s nezávislými sparse-autoencoder črtami (Gemma Scope).

Hlavné body

  • 152 overených sémantických „terminálov“ naprieč 9 modalitami
  • Rozklad grafu 13 534 konceptov / 44 682 hrán, objavovanie saturuje pod 2 %
  • Cross-model jadro 16 terminálov potvrdené modelmi OpenAI aj Anthropic
  • Reprezentačná podobnosť RSA = 0,929; perspektíva dekódovateľná na 98,4 %
  • Reprodukuje psychofyziku (čuch 1D, chuť 2D, sluch 3D, zrak/hmat 5D) bez zmyslov
  • Mechanistické: terminály lineárne čitateľné (AUC 0,86–0,93) a kauzálne ovplyvniteľné naprieč 3 architektúrami; zhoda so SAE črtami
HAI
HAI
HAI
HAI