Quantum Cognition: Kognitivní architektura pro lidskou umělou inteligenci a výpočetní techniku v paměti, část 1
Nov 07, 2023
Tento článek se zaměřuje na lidsko-umělou inteligenci (AI): „stroje, které myslí, které se učí a které tvoří“. Upozorňuji na některé problémy, které vedly k nevyváženému pokroku v AI (větší pokrok v umělé a méně pokrokové inteligenci) a zavádím kvantové poznání jako životaschopnou kognitivní architekturu pro lidskou AI a vznikající hardware.
V posledních letech, s rychlým rozvojem technologií umělé inteligence, stále více lidí začalo věnovat pozornost vztahu mezi umělou inteligencí a pamětí. Vztah mezi těmito dvěma je nerozlučný.
Umělá inteligence dokáže simulovat proces lidské paměti a umožňuje strojům zapamatovat si informace a ukládat je a získávat je jako lidé. V tomto smyslu technologie umělé inteligence značně rozšířila schopnosti lidské paměti. Umělá inteligence nám například může pomoci s rozpoznáváním řeči a obrazu, a tím nám pomůže efektivněji si zapamatovat a porozumět informacím.
Na druhou stranu schopnost lidské paměti může také poskytnout důležitou inspiraci pro vývoj umělé inteligence. Schopnost lidské paměti nám může pomoci lépe spravovat a analyzovat data a objevovat asociace a vzorce mezi daty. Tyto schopnosti lze také transformovat do algoritmů a programů, které počítačům pomohou lépe zpracovávat a využívat data. Proto je schopnost lidské paměti pro vývoj umělé inteligence klíčová.
Stručně řečeno, vztah mezi umělou inteligencí a pamětí se vzájemně posiluje. Vzájemně se doplňují a společně podporují technologický a společenský pokrok. Postavme se k rozvoji umělé inteligence a paměti pozitivně, s optimistickým přístupem a věřme, že mohou přinést lepší budoucnost. Je vidět, že potřebujeme zlepšit naši paměť a Cistanche deserticola nám může výrazně pomoci zlepšit paměť, protože Cistanche deserticola je tradiční čínský léčivý materiál, který má mnoho jedinečných účinků, jedním z nich je zlepšení paměti. Účinnost mletého masa vychází z mnoha účinných látek, které obsahuje, včetně kyselin, polysacharidů, flavonoidů atd. Tyto složky mohou podporovat zdraví mozku různými způsoby.

Klikněte na 10 způsobů, jak zlepšit paměť
Většina kognitivních architektur, tedy modelů lidského uvažování ve výzkumu umělé inteligence (AI), se nutně nesnaží modelovat proces lidského uvažování. Předpokládají, že lidé jsou racionální agenti, tedy maximalizátoři užitku, kteří se vždy řídí booleovskou logikou, což znamená, že události lze vždy kombinovat (například pomocí logické konjunkce) v libovolném pořadí. Snaží se lokalizovat ekvivalent aritmetologické jednotky (ALU) v lidských mozcích a promíchat data, aby byla nezávislá a identicky distribuovaná (IID). V následující části jsou uvedeny další podrobnosti.
PROBLÉMY S KLASICKÝM UVAŽOVÁNÍM PRAVDĚPODOBNOSTI
Klasická teorie pravděpodobnosti a široce přijímané Kolmogorovovy axiomy se řídí booleovskou logikou. To znamená, že logika událostí je komutativní a že události jsou vždy kompatibilní. To znamená, že A a B jsou stejné jako B a A a současná měření A a B nebo B a A nezpůsobí žádnou interferenci.
Tato logika funguje dobře pro kompatibilní události. Například, pokud nejprve změříte svou výšku a poté svou váhu, nejprve změříte svou váhu a poté svou výšku, nebo současně změříte svou výšku a váhu, to vše přinese stejný výsledek.
Ale realita je taková, že události mohou být neslučitelné, to znamená, že hodnocení je závislé na pořadí a může dojít k interferenci. Zvažte například otázku A: "Jedete na Floridu?" a otázka B: "Slyšeli jste, že na Floridu přichází bouře?" První žádost o odpověď na otázku A a poté otázku B nebo nejprve žádost o odpověď na otázku B a poté otázku A nebo současné položení otázek A a B a poté žádost o odpověď může vést k různým odpovědím.
Navíc může být booleovská konjunkce vnímána jako reprezentativnější než jedna z jejích složek a může změnit lidské uvažování. Zde je zjednodušený příklad.
Předpokládejme, že Bob byl identifikován jako podezřelý ze zneužití zranitelnosti zero-day. Předpokládejme také, že zneužívání takové zranitelnosti bylo často pozorováno členy slavné hackerské skupiny zvané H.Then, který z následujících scénářů se zdá pravděpodobnější?
1. Bob je zkušený hacker.
2. Bob je zkušený hacker a člen skupiny H.
Intuitivně řečeno, scénář 2 by mohl být vnímán jako pravděpodobnější. Ale s booleovskou logikou a klasickou teorií pravděpodobnosti nemůže být pravděpodobnost, že se dvě události stanou společně, větší než pravděpodobnost jediné události. Scénář 2 vnímáme jako pravděpodobnější než scénář 1 kvůli klamu konjunkce, kognitivní zaujatosti identifikované Tverskym a Kahnemanem1, která vysvětluje, že lidé mají obvykle větší sklon věřit podrobnému příběhu s explicitními detaily než krátkému kompaktnímu příběhu. Phishingovým útočníkům tato zaujatost velmi prospěla, protože nejprve poskytli svým cílům výslovný a podrobný popis události, která vyžaduje okamžitou pozornost, a poté je požádali, aby klikli na odkaz.
NEVĚDOMÉ UČENÍ
Goyal a Bengio2 tvrdí, že abychom dosáhli lidské umělé inteligence, musíme přejít od systému 1/implicitní/nevědomé zpracování k systému 2/explicitní/vědomé zpracování. Operace systému 1 je podobná, jako když jedeme v neznámé čtvrti, kde můžeme být rychlí a v bezvědomí. Provoz systému 2 je podobný, jako když jedeme v neznámém sousedství a musíme být pomalí a vědomi a také možná potřebujeme konzultaci.
Návrh Goyala a Bengia vyžaduje „sekvenční vědomé zpracování“ a zvažování „pozornosti jako postupného výběru toho, jaký výpočet provést v jakých množstvích“. Nicméně, jak bylo stručně řečeno, klasická pravděpodobnost má velká omezení se sekvenčním zpracováním. Předpokládá, že všechny události jsou kompatibilní a nebere v úvahu vliv pořadí.
Komunita strojového učení například zamíchá data, aby z nich vytvořila IID, aby se například vyhnula nadměrnému přizpůsobení (věnování přílišné pozornosti konkrétní datové sadě, na které je trénováno). Realita je ale taková, že data k nám nedorazí jako IID.2
"Příroda nemíchá data, a to bychom neměli. Když data zamícháváme, zničíme užitečné informace o těch změnách v distribuci, které jsou vlastní shromažďovaným datům a obsahují informace o kauzální struktuře."

KVANTOVÁ PRAVDĚPODOBNOST PRO UVAŽOVÁNÍ A DŮVOD
Doporučuji kvantové poznání3 jako životaschopnou alternativu pro kognitivní architektury, které využívají klasické uvažování a vyvozování. Kvantové poznání se liší od kvantové mysli. Nevychází z předpokladu, že se v mozku odehrává něco kvantového, ale čerpá inspiraci z matematické struktury kvantové teorie a jejích dynamických principů. Využívá například kvantovou pravděpodobnost – modelování pomocí teorie pravděpodobnosti z kvantové mechaniky, bez jakékoli fyziky.
Následující část ukazuje příklad funkce kvantové pravděpodobnosti, díky které je vhodná pro software a hardware člověka-AI.
ZACHYCOVÁNÍ NEKOMPATIBILIT
Kvantová pravděpodobnost, na rozdíl od klasické pravděpodobnosti, předpokládá, že všechny otázky jsou kompatibilní a může zachytit nekompatibilní. Kvantová pravděpodobnost využívá vektorový prostor a podprostor podobně jako klasické pravděpodobnostní použití vzorkového prostoru a události (tj. podmnožiny vzorkového prostoru). Vectorspace obsahuje všechny možné výsledky pro otázky. Vektor představující výsledek otázky pokrývá 1D podprostor, nazývaný paprsek, a soubor přesvědčení, které má člověk o otázce, je reprezentován vektorem jednotkové délky, nazývaným stavový vektor. Kvantová pravděpodobnost také používá proces mapování, nazývaný projekce, a pravděpodobnost přiřazená události se rovná druhé mocnině délky projekce. K výpočtu konjunkce výsledků otázek kvantová pravděpodobnost využívá sekvenční projekci. To umožňuje rozlišovat mezi zakázkami, to znamená, že projekt A a projekt B má jiný výsledek než projekt B a poté projekt A.
Opakuji zjednodušený příklad
Zde se znovu podíváme na náš zjednodušený příklad, abychom ilustrovali, jak může kvantová pravděpodobnost s využitím vektorového prostoru ilustrovat klam konjunkce v lidském uvažování. Na obrázku 1 modré šipky představují "Bob je zkušený hacker" podle B a jeho negace s ~/B. Podobně oranžové šipky představují "být členem skupiny H" s H a jeho negaci s ~/ H. S, stavovým vektorem, představuje stav našeho přesvědčení o Bobově charakterizaci a je reprezentován černou šipkou. Na obrázku 1 jsou dráhy promítání znázorněny zelenými a červenými tečkovanými čarami.
Pravděpodobnosti se počítají jako druhá mocnina délky průmětu stavového vektoru na odpovídající osu a jsou znázorněny délkami zeleného a červeného čtverce. Projekce na paprsek B je znázorněna zelenou tečkovanou čarou a pravděpodobnost (B) se rovná druhé mocnině délky tohoto pruhu, znázorněné zelenou délkou čtverce. Pro pravděpodobnost (B a H) musíme provést dva kroky, které jsou znázorněny dvěma červenými tečkovanými čarami. Nejprve promítneme stavový vektor na paprsek H. Za druhé, promítneme tuto předchozí projekci na B paprsek. Potom pravděpodobnost (B a H) je druhá mocnina délky poslední projekce, znázorněná délkou červeného čtverce.
Na obrázku 1 je sekvenční pravděpodobnost (B a H) větší než pravděpodobnost jedné události, tj. pravděpodobnost (B), odpovídající tomu, že délka červeného čtverce je delší než délka zeleného čtverce. Je to kvůli klamu konjunkce, který vedl k tomu, že scénář 2 byl vnímán jako pravděpodobnější než scénář 1. Nekompatibilitu (B a H), vedoucí k jejich interferenci, můžeme vztáhnout k heuristice reprezentativnosti (mentální zkratka); konjunkce se zdá reprezentativnější než jedna z jejích složek a být členem H si lze snáze představit nebo získat než Bob jako anzahrnující kategorii. Matematické vysvětlení tohoto příkladu naleznete v doplňkových materiálech dostupných na adrese 10.1109/MC.2023.3242056.
Schopnost kvantové pravděpodobnosti zachytit nekompatibility může také hrát důležitou roli při vývoji kauzálních struktur pro lidskou AII, konkrétně když se zabýváme nekompatibilními událostmi tím, že dáváme dohromady komplexní situace s obrovským množstvím dat z různých zdrojů. V takových situacích potřebujeme kauzální strukturální modely, abychom odhalili základní mechanismy dat versus elementární kauzální indukce, tedy modelování jediného vztahu příčina-následek, s použitím klasické pravděpodobnosti. V takových složitých situacích může kvantová pravděpodobnost poskytnout způsob, jak formalizovat myšlenku strukturálně lokálního kauzálního uvažování tím, že pracuje s neslučitelnými událostmi, skládá dohromady vzorové prostory a tvoří vektorový prostor.
Předpokládejme například, že potřebujeme provést prediktivní úsudek, to znamená najít podmíněnou pravděpodobnost účinku dané příčinou, neboli P (účinek|příčina), v komplexním problému s velkým množstvím dat, kde záleží na pořadí příchodu dat. Kvantová pravděpodobnost nám umožňuje rozdělit problém na menší problémy zodpovězením dotazů, jako jsou:
P (účinek|příčina1, žádná alternativní příčina),P (účinek|příčina1, příčina2),P (účinek|příčina2, příčina1) atd.

KVANTOVÁ PRAVDĚPODOBNOST FORIN-MEMORY COMPUTING
Kvantová pravděpodobnost využívá vektorový prostor, podobně jako vektorová symbolická architektura (VSA), známá také jako hyperdimenzionální výpočet, která je ústředním bodem nově vznikajícího hardwaru, například výpočetní techniky v paměti (IMC). V konvenční von Neumannově architektuře jsou paměť a procesor oddělené a výpočet vyžaduje přesun dat tam a zpět. Ale s architekturou IMC využívající „násobení vektorových matic“4 jsou paměť a procesor sloučeny a výpočty se provádějí tam, kde jsou data uložena s minimálním pohybem dat. Díky tomu je IMC, na rozdíl od konvenční von Neumannovy architektury, podobné lidskému mozku, kde jsou paměť a výpočty jsou umístěny. Nalezení ekvivalentu ALU v lidském mozku je nerealistické očekávání.

Kvantovou pravděpodobnost a IMC lze považovat za slibné výpočetní architektury pro lidskou AII, protože obě používají VSA. Je tedy rozumné uvažovat o kvantové pravděpodobnosti jako o kognitivní architektuře pro IMC.
Zde je příklad. Pracovní paměť v lidském mozku je mechanismus pro dočasné ukládání informací souvisejících s aktuální úlohou. Je rozhodující pro kognitivní schopnosti, jako je pozornost, uvažování a učení; většina kognitivních architektur jej tedy v nějaké formě implementuje. S kvantovým poznáním můžeme použít vysokorozměrné vektory k reprezentaci funkce pracovní paměti a k práci s relevantními daty v probíhajícím výpočtu. Stavový vektor kvantové pravděpodobnosti lze považovat za stav pracovní paměti, který představuje lidské přesvědčení o vzorcích funkcí a slouží jako mezipaměť pro model současného světa, stav systému a/nebo aktuální cíle. Kvantová pravděpodobnost buduje silný matematický základ pro IMC a organizuje tzv. operace s hyperdimenzionálními vzory, které by mohly být použity pro výpočty." Nahlížením na vzory jako na vektory můžeme "proniknout do obrovského množství znalostí o vektorech, maticích, lineární algebře a dalších. To je skutečně tradice ve výzkumu umělých neuronových sítí, ale zbývá prozkoumat bohaté oblasti vysokorozměrné reprezentace." Agenti, kteří to vždy maximalizují pomocí struk tury, která vždy následuje Booleanlogic, jsou základem existujících architektur AIcomputing. Ale tvrdím, že se musíme poučit z Einsteinovy teorie relativity, Gödelovy věty o neúplnosti a Simonovy teorie racionality, protože všechny vrhají světlo na kolaps absolutna.
V tomto článku jsem představil některá výpočetní omezení stávajících systémů AI. Vysvětlil jsem, že na rozdíl od axiomů klasické pravděpodobnosti není logika událostí nutně booleovská. Pokud jsou dvě události A a B neslučitelné, pak učení; většina kognitivních architektur jej tedy v nějaké formě implementuje. S kvantovým poznáním můžeme použít vysokorozměrné vektory k reprezentaci funkce pracovní paměti a k práci s relevantními daty v probíhajícím výpočtu. Stavový vektor kvantové pravděpodobnosti lze považovat za stav pracovní paměti, který představuje lidské přesvědčení o vzorcích funkcí a slouží jako mezipaměť pro model současného světa, stav systému a/nebo aktuální cíle.
Kvantová pravděpodobnost buduje silný matematický základ pro IMC a organizuje „operace na hyperdimenzionálních vzorcích, které by mohly být použity pro výpočty“. Můžeme vidět vzory jako vektory
"využít obrovské množství znalostí o vektorech, maticích, lineární algebře a dalších. To je skutečně tradice ve výzkumu umělých neuronových sítí, ale zbývá prozkoumat bohaté oblasti vysokorozměrné reprezentace."
Agenti, kteří vždy maximalizují il it y pomocí struk tury, která se vždy řídí booleovskou logikou, jsou zásadní pro existující AI konjunkci událostí A a B nelze definovat, protože nedochází, v ostrém kontrastu s booleovskou logikou, kde se události vždy mění. .
Nabídl jsem doporučení ohledně kvantové pravděpodobnosti a vysvětlil, jak uvažovat kvantové stavy jako měření nad nebooleovskou strukturou operátorů projekce. Abych porovnal kvantové stavy a klasické pravděpodobnostní stavy, vysvětlil jsem, jak lze projekci použít k popisu experimentů podobných klasické pravděpodobnosti. Vysvětlil jsem, jak kauzální strukturální modely (verzus elementární kauzalindukce) mohou pomoci se zachycováním sekvenčního vědomého zpracování. Také vysvětlil, jak kvantová pravděpodobnost použití vektorového prostoru z něj činí vhodnou kognitivní architekturu pro architekturu IMC.
Dosažení lidského AII a vývoj „strojů, které si myslí, že se učí a které tvoří“6 vyžaduje výpočetní modely, které mohou fungovat podobně. Ale lidské myšlení, učení a tvoření jsou často silně závislé na kontextu a pořadí, a to se klasickým modelům pravděpodobnosti a maximalizace užitku jeví jako matoucí.

POTVRZENÍ
Tento materiál je založen na práci podporované National ScienceFoundation pod cenou 2041788. Stručné matematické vysvětlení zjednodušené zkoušky a jejího opakování lze nalézt v doplňkových materiálech dostupných na 10.1109/MC.2023.3242056.
REFERENCE
1. A. Tversky a D. Kahneman, "Extensional versus intuitivní uvažování: Spojovací omyl nepravděpodobnost rozsudku," Psychol. Rev., sv. 90, č. 4, str. 293–315, říjen 1983, doi: 10.1037/0033-295X.90.4.293.
2. A. Goyal a Y. Bengio, "Induktivní předsudky pro hluboké učení poznání vyšší úrovně", Proc. Royi. Soc. A, sv. 478,č. 2266, říjen 2022, čl. Ne. 20210068, doi: 10.1098/rspa.2021.0068.
3. JR Busemeyer a P. Bruza, Quantum Models of Cognition and Decision.Cambridge, UK: Cambridge Univ.Press, 2014.
4. S. Spetalnick a A. Raychowdhury, "Praktická design-prostorová analýza výpočtu v paměti s SRAM," IEEE Trans. Circuits Syst. Já, Reg. Papers, sv. 69, č.p. 4, s. 1466–1479, duben 2022, doi: 10.1109/TCSI.2021.3138057.
5. P. Kanerva, "Hyperdimenzionální výpočty: Úvod do výpočetní techniky v distribuované reprezentaci s vysokorozměrnými náhodnými vektory," Cogn. Comp., sv. 1, str. 139–159, červen 2009, doi: 10.1007/s12559-009-9009-8.
6. H. Simon a A. Newell, "Heuristické řešení problémů: Další pokrok v operačním výzkumu", Oper. Res., sv. 6, č. 1, s. 1–10, leden/únor. 1958. [Online].Dostupné:https://www.jstor.org/stable/167397
For more information:1950477648nn@gmail.com






