Svetloba namesto elektrike
Prav nobene potrebe ni, da računalniki uporabljajo tranzistorje za krmiljenje elektronov. Dolgo pred pojavom elektronskih računalnikov so analogni uporabljali mehaniko, hidravliko ali tlačne pojave. Tudi digitalni računalniki so bili spočetka elektromehanični, nato z elektronkami in šele nazadnje na integriranih vezjih. Zdaj na vrata trka silicijeva fotonika, kjer podatke predstavljajo fotoni in se tudi obdelujejo v obliki svetlobnih curkov. Nevronske mreže so s takimi čipi nekajkrat hitrejše.
Da je svetloba v primerjavi z elektriko superiorna, smo se pri podmorskih telekomunikacijskih kablih že naučili. Prvi kabel med Anglijo in Francijo iz leta 1845 je bil bakren in izoliran z gutaperčo, zato je že po enem dnevu odpovedal. Tudi naslednji poskusi so bili kratkega veka, dokler niso bakrenih paric zamenjali koaksialni kabli. A za pravo revolucijo konec 20. stoletja so poskrbeli šele optični kabli, po kateri ne potujejo električni signali, temveč svetloba. Zmogljivosti so poletele v nebo.
Sčasoma je čedalje več podatkovnih povezav postalo optičnih, tako da so bili bakreni zgolj še zadnji kilometri do gospodinjstev. Z razmahom optičnih povezav do interneta so se zadnji kilometri najprej umaknili zadnjim metrom po stavbah, z brezžičnimi omrežji pa je še ta del premaknil v elektromagnetna valovanja. Medtem pa je svetloba v naših računalniških komponentah omejena na okrasne ledice, vse delo pa še vedno poteka z upravljanjem elektronov.
Doktorat, ki ni ostal v predalu
Yichen Shen je pred šestimi leti na MIT doktoriral iz fotonike pri Marinu Soljačiću. Glavnina doktorata je bila leto pozneje objavljena v članku v Nature Photonics (Deep learning with coherent nanophotonic circuits), kjer je opisal uporabo nanofotonskega procesorja iz 56 interferometrov na fotonskem integriranem vezju za prepoznavanje glasov. Doktorat ni ostal v predalu, Shen pa ne podoktorski raziskovalec v akademskem okolju. Leta 2017, le nekaj mesecev po objavi članka, je s še nekaj raziskovalci ustanovil Lightelligence kot odcepljeno podjetje MIT. Konec lanskega leta so predstavili prvi v praksi delujoči čip, ki uporablja svetlobo namesto elektrike za izvajanje osnovnih operacij, in napovedali, da bi lahko danes najhitrejše grafične kartice v nekaterih nalogah bistveno prehitel. Obljubljajo 350-kratne pospeške v primerjavi z današnjimi grafičnimi karticami. Novost se imenuje PACE (Photonic Arithmetic Computing Engine).
Čip, ki ga je Lightelligence predstavil decembra, je bil sicer še prototip, a zelo blizu končnega izdelka. Vsebuje tako električne kakor optične komponente, najbolj pa blesti pri reševanju problemov umetne inteligence, strojnega in globokega učenja. To ni presenetljivo, saj so nevronske mreže problem, za katerega moderni računalniki po von Neumannovem modelu (centralna procesna enota, pomnilnik, krmilna enota, enotno vodilo med pomnilnikom in procesno enoto, vhodi/izhodi) niso najprimernejši.
Klasična von Neummanova infrastruktura ni najprimernejša za simulacije nevronskih mrež.
Elektrika
Da bi lažje razumeli, kaj prinaša fotonika in kako delujejo fotonska integrirana vezja, se na kratko ustavimo pri klasičnih čipih. Na najnižjem nivoju gre za premetavanje elektronov oziroma nadzor nad električnimi tokovi v vezju. Današnji tranzistorji na poljski efekt (MOSFET) so stikala, ki jih upravljamo z električno napetostjo, pritisnjeno nanje. S tem spreminjamo njihovo prevodnost, torej tudi jakost električnega toka, ki teče skoznje. In to je, na konceptualni ravni, vse, kar počno. Regulirajo jakost toka, ki teče skoznje. Poleg tranzistorjev vezja sestavljajo še kondenzatorji, uporniki in vodniki, ki vse to povezujejo. Vse skupaj je ogromna sestavljanka, igra z električnimi naboji, torej s potenciali in tokovi. Dejansko gre za realizacijo velikega števila logičnih vrat, s čimer je mogoče izvajati osnovne operacije nad podatki.
Kaj je Isingov model
Isingov model je abstrakten matematični model, ki se v praksi največkrat uporablja za statističnomehanski opis feromagnetizma. Model najraje zapišemo kot rešetko (dvodimenzionalni model), na kateri je lahko posamezno mesto v enem izmed dveh stanj: –1 ali +1. Med sosednjimi mesti so prisotne interakcije, torej se »čutijo«.
Takšen opis je docela matematičen, a lahko približno opiše magnete, zlitine, mrežni plin (lattice gas) itd. Fiziki ga imajo izjemno radi, ker ima ob svoji enostavnosti nekaj zelo uporabnih lastnosti, denimo možnost faznega prehoda, kritično temperaturo in zlom simetrije v nizkotemperaturni fazi, predvsem pa je eden izmed redkih fizikalnih modelov, ki je rešljiv. Termodinamične količine v modelu lahko izračunamo brez poenostavitev. Večinoma je to težko opravilo, ker gre za ansambelske količine, torej so odvisne od vseh sistemu dostopnih stanj, ustrezno uteženih glede na njihovo verjetnost. Isingov model pa ima eksaktno rešitev, ki jo je že leta 1944 našel norveški fizik Lars Onsager.
Dvodimenzionalni Isingov model
Uporaba elektronskih elementov prinaša svoje omejitve, ki so povezane s hitrostjo prevajanja signalov, presluhi, z najvišjim dopustnim taktom delovanja, zmožnostjo miniaturizacije itd. Nivo više je način delovanja modernega von Neummanovega računalnika. Ta ukaze izvaja zaporedno, programe in podatke pa ima shranjene v pomnilniku. Ker je vodilo za komunikacijo med procesno enoto in pomnilnikom enotno, ni mogoč sočasen dostop do podatkov in ukaza. Kljub tej očitni slabosti je von Neummanova arhitektura danes prevladujoča, saj je fleksibilna. Njeno ozko grlo se blaži s predpomnilnikom (cache). Procesna enota je v bistvu aritmetično logična enota, ki je sposobna zaporednega izvajanja ukazov. Ti so logične operacije (in, ali, ne itd.), prestavljanje bitov in aritmetika.
Fotonika
Umetna inteligenca je zadnji razcvet – njena zgodovina je barvita in obsega vsaj dve dolgi zimi, ko je razvoj za več let zastal – doživela z globokim učenjem in nevronskimi mrežami z veliko (skritimi) nivoji. Klasični procesor to seveda lahko simulira, saj je univerzalen, a je neučinkovit. Precej bolje se odrežejo grafični procesorji, specifična vezja ASIC (application-specific integrated circuit) in FPGA (field-programmable gate array). Vsem je skupna učinkovitost pri izvajanju velikega števila ponavljajočih se, podobnih operacij, med katerimi je najpomembnejše množenje matrik. Potrebujemo torej neumne – točneje, neprilagodljive –, a zelo hitre stroje. Zakaj torej ne bi namesto elektrike vzeli svetlobe? Podatke, torej ničle in enice, lahko kodiramo s svetlobnimi pulzi.
Silicijeva fotonika združuje optične komponente na silicijevem substratu. Fotonika je sicer obstajala že precej prej, a šele z integracijo na silicij je zmogla pridobiti prednosti klasičnih integriranih vezij, kot so enostavnost izdelave, skalabilnost in nizka cena. Tako kot imajo navadni čipi tranzistorje, imajo fotonski čipi modulatorje, ki določajo prepustnost svetlobe, s čimer kodiramo informacijo. Svetlobo pa do njih vodijo valovodi oziroma kanali.
Shema integriranega vezja v silicijevi fotoniki. Slika: B.E.A. Saleh and M.C. Teich, Fundamentals of Photonics
Lightelligence kot modulator uporablja Mach-Zehnderjev interferometer (glej okvir). Ti curek svetlobe razklonijo v dva snopa, na njiju izvedejo različna fazna zamika in ju potem spet seštejejo. Sešteti svetlobni curek ima drugačno intenziteto od vpadlega, torej se je zgodilo procesiranje informacije. Različen fazni zamik se lahko doseže s segrevanjem, saj se lomni količnik snovi s temperaturo malenkostno spreminja, a so spremembe prepočasne za visoke takte. Še ena možnost je različno dopiranje valovoda, a to prinaša težave z miniaturizacijo in izgubami.
Lightelligence zato v valovod vbrizgava elektrone, s čimer prav tako spremeni lomni količnik. Konkurenca (Lightmatter) pa uporablja napravo, ki so jo poimenovali NOEMS (nano-optical electromechanical system). Zgrajena je podobno kot MEMS, z nabojem pa je mogoče valovod ravno dovolj upogniti, da se lomni količnik malce spremeni, kar fazno zamakne optični signal. NOEMS ne porabijo skoraj nič energije, lahko delujejo z več stomegaherčnimi takti in nimajo opaznih izgub. Multipleksiranje signalov, ki ga poznamo že iz optičnih vodnikov za prenos podatkov, pa omogoča obdelavo več signalov (vsak s svojo valovno dolžino) hkrati, kar omogoča paralelno obdelovanje.
Mach-Zehnderjev interferometer
Ključni gradnik prototipa je Mach-Zehnderjev interferometer. Interferenca je fizikalni pojav, ki ga opazimo ob seštevanju koherentnih valovanj na istem mestu, zaradi česar nastane nov valovni vzorec. Ekstremna primera sta konstruktivna interferenca, ko seštevamo valovanji v fazi, ter destruktivna interferenca, ko se valovanji v protifazi popolnoma izničita. Optična naprava, ki omogoča in izrablja interferenco, se imenuje interferometer.
Mach-Zehnderjev interferometer usmerjeni snop svetlobe razklopi na pravokotna snopa, izmed katerih eden potuje skozi vzorec, drugi pa ne. Na koncu ju z žarkovnim delilnikom spet združimo, a zaradi potovanja enega žarka skozi vzorec nista več v fazi. Interferometer z dvema detektorjema (za konstruktivno in destruktivno interferenco) izmeri to fazno razliko. Pri obdelavi podatkov s fotoniko enega izmed snopov bodisi fazno obrnemo (premik za 180 °C) bodisi ne, s čimer opišemo bitno ničlo ali enico (po seštevanju). Od hitrosti moduliranja signala je odvisno, kolikšen takt delovanja čipa lahko dosežemo.
Mach-Zehnderjev interferometer. Slika: Stefano Olivares, High-precision innovative sensing with continuous-variable optical states
Maurice Steinman iz Lightelligence je pojasnil, da so tovrstne fotonske enote v bistvu vrste analognih računalnikov. Zaradi tega so pomembni natančnost pri dizajnu in izdelavi, robustni algoritmi in večkratno ponavljanje. Pri gigaherčnem taktu so svetlobni pulzi dolgi eno nanosekundo, torej je treba imeti tudi ustrezne laserje.
Silicij ni primeren material za vir svetlobe, ker je energijska vrzel med prevodnim in valenčnim pasom posredna (indirect bandgap). To pomeni, da vzbujeni elektron ne more pasti v osnovni nivo in oddati fotona, temveč energijo odda s počasno relaksacijo, ob čemer nastaja toplota. Za laserje se zato uporablja indijev fosfid, ki se integrira v silicijevo vezje. Drugi materiali so še indij-galijev arzenid, silicij-germanij in dopirani silicij.
Kaj zmore
Prototip PACE sestavlja 12.000 fotonskih naprav (photonic devices), ki tiktakajo z 1 GHz. Comet, ki so ga predstavili leta 2019, jih je imel sto, uporaben pa je bil le na problemih, ki vključujejo umetno inteligenco. PACE pa lahko rešuje NP-polne probleme (NP complete), ki so računsko izjemno zahtevni in za katere hitrih (polinomskih) rešitev ni. Mednje sodijo klasični problemi, kot sta Isingov model in trgovski potnik, ter številni realni problemi iz bioinformatike, načrtovanja, šifriranja in optimizacije.
Prototip PACE. Slika: Lightelligence.
To ne pomeni, da je PACE uporaben za vse tovrstne probleme, še manj, da je povsod hitrejši od klasičnih sistemov, je pa zmogel Isingov problem (glej okvir) rešiti najhitreje doslej, pri čemer je prehitel celo namenskih Toshibin stroj na FPGA, in sicer za 25-krat. Od tod izvira optimistična trditev proizvajalca, da bi bil PACE lahko 350-krat hitrejši od čipa v Nvidijinem RTX 3080. Konkretno gre za množenje matrik dimenzije 64 x 64, ki na običajnem grafičnem čipu traja več sto ciklov, PACE pa to zmore v nekaj nanosekundah. Množenje matrik je operacija, ki se ponavlja pri reševanju NP-polnih problemov. Ker je rezultat operacije vhodni parameter za naslednje množenje, odpade potreba po shranjevanju tega podatka v pomnilnik, zato se lahko takoj uporabi za naslednje množenje. Od tod izvirajo nadaljnji prihranki časa.
Gledano od daleč pa je PACE čip ASIC na fotonskem jedru, ki je nameščen na klasičnem tiskanem vezju (PCB). Ima optični priključek za laserski vir svetlobe in kopico klasičnih čipov, ki skrbijo za operacije I/O in dostop do pomnilnika SRAM. Digitalno-analogni pretvornik je nujen, ker je fotonski čip v srži analogen. Z računalnikom komunicira prek vmesnika PCI-e, razume pa trenutno najpopularnejše programske pristope, kot je Googlov TensorFlow ali Facebookov PyTorch.
Pri drugih, realnejših problemih v komercialni uporabi bosta seveda potrebna zapisovanje v pomnilnik in branje iz njega, kar bo prednost stopilo. Shen pravi, da prihranki ne bodo več stokratni, realistično pa je pričakovati vsaj nekajkratne izboljšave. Priznava, da je PACE precej omejen pri problemih, ki jih je zmožen reševati. Zaradi tega ne razvijajo le strojne opreme, temveč tudi algoritme zanjo. PACE je namreč uspešen le s posebej prilagojenimi algoritmi. Opisali bi ga lahko torej kot ASIC (Application-Specific Integrated Circuit). Zna zelo malo stvari, a te zelo hitro. To sicer ni tako velik problem, kot bi se zdelo na prvi pogled, saj so NP-polni problemi prenosljivi med seboj.
Druga zelo pomembna prednost fotonike je manjša poraba energije. Ko povečujemo takt klasičnih čipov, s porabo energije raste tudi toplotni odtis – energija kam drugam tako in tako nima iti. PACE je učinkovitejši, manjša poraba energije pa pomeni, da ostaja hladen.
Lightelligence za letos obljublja komercialno dostopen čip, prihod na trg v večjih številkah pa v letu 2023. A Lightelligence ni edino podjetje, ki se ukvarja s silicijevo fotoniko. Na zelo podoben način to počne tudi Lightmatter, ki je še eno mlado podjetje. Tudi to je nastalo na MIT, vodi pa ga Nick Harris, ki je tam doktoriral in se podoktorsko usposabljal. Tudi Lightmatter je letos predstavil svoj čip Envise, ki je od 1,5- do 10-krat hitrejši od Nvidijinega A10, šestkrat varčnejši in takisto namenjen simulaciji umetne inteligence. Envise ima svoje prednosti zlasti pri globokem učenju (deep learning). Tudi Lightmatter načrtuje prve komercialno uporabe izdelke še letos.
Pričakovati je, da bo šlo sprva za nišne izdelke, ki pa bi vendarle lahko bili znanilci nove dobe. Na neki način bodo verjetno podobno kvantnim računalnikom – ne bomo jih imeli doma, temveč v specializiranih strojih, kjer bodo imeli točno določene namene in naloge.