◍ Publikovaný výskum

HAI

Publikovaný nezávislý výskum: „The Brain Instruction Set — na modeli nezávislá báza sémantických primitív v LLM, od správania k mechanizmu.“

Zenodo (DOI) ↗ GitHub ↗

152

sémantických terminálov

modalít

0,929

RSA medzi zdrojmi

DOI

publikované (Zenodo)

HAI (Human Artificial Intelligence) skúma hypotézu Brain Instruction Set (BIS) — myšlienku, že ľudské poznanie sa dá reprezentovať vo vektorovom priestore so zdieľaným, sémanticky ukotveným jadrom a individuálnou väzbovou vrstvou nad ním. Myšlienka pochádza z roku 2000 a dnes je testovateľná voči reálnym jazykovým modelom.

Rekurzívnym rozkladom grafu 13 534 konceptov a 44 682 vážených hrán štúdia obnovila konečnú, zdieľanú bázu 152 overených sémantických „terminálov“ v 9 modalitách — pričom objavovanie nových terminálov saturovalo pod 2 %, čo podporuje tézu o konečnosti. Jadro 16 terminálov nezávisle potvrdil model od OpenAI aj od Anthropicu (81 % zhoda modalít).

Dve validačné brány replikovali tri modely z dvoch labov: reprezentačná podobnosť medzi zdrojmi bola vysoká (RSA = 0,929), perspektíva zdroja bola dekódovateľná z obsahu na 98,4 %, a geometria podobnosti terminálov reprodukovala známu psychofyziku bez zmyslového dohľadu (čuch ≈ 1D, chuť ≈ 2D, sluch ≈ 3D, zrak/hmat ≈ 5D). Štúdia výslovne meria štruktúru reprezentácií, nie qualia.

Nad rámec správania (v1.2) posúva BIS k mechanistickej báze: sondovanie open-weight modelov (Gemma-2-2B, Qwen2.5-1.5B, Phi-3.5-mini) ukazuje, že terminály sú lineárne čitateľné (AUC 0,86–0,93) a kauzálne ovplyvniteľné, vysvetlená variancia vrcholí v strede siete (R² = 0,59, vrstva 14) a jadro sa zhoduje s nezávislými sparse-autoencoder črtami (Gemma Scope).

Hlavné body

152 overených sémantických „terminálov“ naprieč 9 modalitami
Rozklad grafu 13 534 konceptov / 44 682 hrán, objavovanie saturuje pod 2 %
Cross-model jadro 16 terminálov potvrdené modelmi OpenAI aj Anthropic
Reprezentačná podobnosť RSA = 0,929; perspektíva dekódovateľná na 98,4 %
Reprodukuje psychofyziku (čuch 1D, chuť 2D, sluch 3D, zrak/hmat 5D) bez zmyslov
Mechanistické: terminály lineárne čitateľné (AUC 0,86–0,93) a kauzálne ovplyvniteľné naprieč 3 architektúrami; zhoda so SAE črtami

Ďalšie projekty