Author Archives: Lisbeth Fajstrup

Mystiske hændelser i højere dimensioner

Tidlige computerspil var “flade” – karakterne kunne hoppe over, men ikke “til siden”. Nu er de naturligvis rumlige – på den flade computerskærm. Man kan så gå udenom i stedet for at forsøge at hoppe over. Men man kan stadig være fanget i et låst lokale. Hvis man har en fjerde dimension kan man bruge den til at “gå udenom”. Det er der nogen, der har lavet spil med – her er et forsøg, som muligvis ikke er realiseret:

Matematikere og anvendere af matematik har ikke noget problem med at tale om eksempelvis data i dimensioner højere end 3. For en gymnasieelev kan det lyde meget besynderligt og mange spørger “Er den fjerde dimension så tiden?” Men for daglige brugere af  modeller for fysik, biologi, økonomi og helt generelt højere dimensionalt data, er det slet ikke noget, vi overvejer.

Et punkt (1,-3,7,0,534,14) ligger for os i dimension 6, det 6-dimensionale rum. Der er nemlig 6 koordinater.  Vi kalder dette rum for \mathbb{R}^6 (udtales “r seks” og ikke “r i sjette”) At vi så ikke lige kan tegne det ind i et koordinatsystem er en anden sag. Man kan sagtens regne med 6 koordinater uden at tegne. I det følgende tænker jeg ind imellem på sådan et punkt som en vektor – fra Origo til (1,-3,7,0,534,14) – og ind imellem som et punkt.

Nedenunder er a = (a_1,a_2,\ldots, a_6) og b= (b_1,b_2,\ldots, b_6)

Addition og multiplikation med en skalar (et tal):

\mathbf{a+b}= (a_1+b_1,a_2+b_2,\ldots, a_6+b_6)

k\mathbf{a}=(ka_1,ka_2,\ldots,ka_6) (her er k et reelt tal.)

Afstand, vinkler, indre produkt.

Der er flere afstandsbegreber (metrikker), men den historie får I en anden gang. Her går vi med den Euklidiske version, som er den, de fleste er vant til. Jeg skriver alt i dimension 6, men det er naturligvis samme historie i dimension 238:

Skalarprodukt (indre produkt): \mathbf{a\cdot b}= a_1b_1+a_2b_2+\cdots +a_6b_6 – gang koordinater sammen parvis og læg resultaterne sammen.

Længden |\mathbf{a}|=\sqrt{\mathbf{a\cdot a}}

Afstand: Afstand mellem punkter er længden af vektoren, der forbinder dem: |\mathbf{a-b}|=\sqrt{\mathbf{(a-b)\cdot (a-b)}}

Vinkler: Vinklen v mellem a og b kan findes udfra

\cos(v)=\frac{\mathbf{a\cdot b}}{|\mathbf{a}||\mathbf{b}|}

Kugler og kuber.

Cirkler i planen og kugleflader i rummet med centrum C og radius r, er begge karakteriseret ved, at det er du punkter, der har  afstand r til et punktet C. Det kan umiddelbart generaliseres:

Kuglefladen med centrum i C=(c_1,c_2,\ldots,c_6)  og radius r er de punkter, der opfylder |\mathbf{x-C}| =r Med centrum i Origo og radius 1 får vi

S^5=\{\mathbf{x}\in\mathbb{R}^6 |\mathbf{x}|=1\}, de punkter i \mathbb{R}^6, som har længde 1. Hvorfor S^5 og ikke S^6? Fordi sådan en kugleflade har en dimension mindre – ligesom man kan have planer i \mathbb{R}^3. Den historie må også vente… Kuglefladen i \mathbb{R}^3 er altså S^2 og S^1 er en cirkel.

Rektangler og kasser kan også fint generaliseres. De punkter, der opfylder 0\leq x_1 \leq 5, 2\leq x_2\leq 4, -3\leq x_3\leq 5, 1 \leq x_4\leq 2, 1 \leq x_5\leq 2,1 \leq x_6\leq 2 er en kasse, et hyperrektangel om man vil.

Der er mere om kugleflader (kugler) i blogindlægget om kuglepakninger

Den “tesseract”, der vises i filmen ovenfor, er en kube i R^4, en hyperkube. Altså punkter (x_1,x_2,x_3,x_4), hvor alle koordinater ligger mellem 0 og 1. Ydersiden af sådan en kube er der, hvor mindst en af koordinaterne er enten 0 eller 1. En sædvanlig kube har 6 sideflader: (0,x_2,x_3) (1,x_2,x_3) (x_1,0,x_3) (x_1,1,x_3) (x_1,x_2,0) (x_1,x_2,1).

En hyperkube har 8 kuber på sin “overflade”: (0,x_2,x_3,x_4) (1,x_2,x_3,x_4)(x_1,0,x_3,x_4) (x_1,1,x_3,x_4) (x_1,x_2,0,x_4) (x_1,x_2,1,x_4) (x_1,x_2,x_3,0) (x_1,x_2,x_3,1). De hænger sammen – ligesom sidefladerne på en sædvanlig kube. Man kan selvfølgelig ikke se det i vores sædvanlige dimension, men man kan lave en film, hvor man ser projektionen af en roterende hyperkube:

En sædvanlig kube, der roterer kan vores hjerne straks lave 3d, selvom den er på en 2d skærm:

File:Hexahedron.gif

 

Kurver og kontinuitet.

Det går jo fint med at generalisere det, vi kender fra plan og rum. Nu prøver vi med kurver. vi skal jo snyde i et spil og komme ud af et lukket rum ved at bruge en dimension mere.:

 

En parametriseret kurve i \mathbf{R}^n er en funktion r: \mathbf{R}\to\mathbf{R}^nr(t)=(r_1(t),r_2(t),\ldots,r_n(t), funktionen tager én koordinat ind og giver n koordinater ud. Man kan også sige, at den består af n koordinatfunktioner.

Kontinuitet: Gymnasieintuitionen om “ikke at løfte blyanten” har det svært, når blyanten skal tegne noget i højere dimensioner. I får definitionen at tygge på, men faktisk kan jeg nøjes med sige r: \mathbf{R}\to\mathbf{R}^nr(t)=(r_1(t),r_2(t),\ldots,r_n(t) er kontinuert, hvis alle koordinatfunktionerne er kontinuerte.

Her er definitionen: r: \mathbf{R}\to\mathbf{R}^nr(t)=(r_1(t),r_2(t),\ldots,r_n(t) er kontinuert i $t_0$, hvis der til ethvert \varepsilon >0 findes et \delta>0, så |t-t_0|< \delta  garanterer, at |r(t)-r(t_0)|<\varepsilon

Jeg illustrerer, hvordan man kommer ud af et kugleformet rum – I kan selv oversætte til noget med kasser:

Hvis en 2d-computerspilsfigur er spærret inde i cirklen S^1 og kun kan bevæge sig i planen, så kan den ikke komme ud (uden at krydse gennem cirklen): Lad os antage, jeg har bevæget mig ud langs kurven (r_1(t),r_2(t)) startende med t=0 sluttende med t=1. Det er en kontinuert kurve (ellers kan alt lade sig gøre i det computerspil 🙂 ).

Så er |(r_1(0),r_2(0)|<1, fordi jeg begynder indenfor cirklen. Og |(r_1(1),r_2(1)|>1, fordi jeg ender udenfor. Nu påstår jeg, at der er et tidspunkt t_0, hvor |r(t_0)|=1. Hvorfor? Jo, den sammensatte funktion g(t)= |r(t)| er kontinuert og g(0)<1, g(1)>1. Så siger mellemværdisætningen, at der findes t_0, hvor |r(t_0)|=1.

Hvis den 2d-computerspilsfigur får sig en ekstra dimension, så kan den komme ud – den hopper over kanten:

  • Lad os starte i (0,0), som nu udvides med en dimension – vi starter i (0,0,0).
  • Første del af kurven er r(t)=(0,0,t) for t mellem 0 og 1.
  • Næste del er r(t) = (t-1,0,1) for t mellem 1 og 3 – nu er vi kommet til punktet (2,0,1).
  • Sidste del er r(t)= (2,0,4-t) for t mellem 3 og 4. Nu er vi i punktet (2,0,0) og vi folder den tredie dimension sammen igen.

Jeg passerer naturligvis igen et sted, hvor |r(t)|=1, men det er i punktet (0.0.1), som jo ikke ligger på cirklen. Jeg hopper over.

Hvis jeg er lukket inde i S^2 kan jeg komme ud med samme trick: Jeg starter i (0,0,0). Folder min fjerde dimension ud og er nu i (0,0,0,0). Den kontinuerte kurve ud er

  • (0,0,0,t) for t mellem 0 og 1. Så er vi i (0,0,0,1)
  • (t-1,0,0,1) for t mellem 1 og 3. Så er vi i (2,0,0,1)
  • (2,0,0,4-t) for t mellem 3 og 4. Vi ender i (2,0,0,0) of folder den fjerede dimension ind igen.

Der er naturligvis et tidspunkt, hvor |r(t)|=1, nemlig i punktet (0,0,0,1), men det er ikke på S^2, som er punkter  (x,y,z,0). Jeg er “hoppet over” via den fjerde dimension.

Har man knuder på snørebåndene eller på sit strikkegarn, kan man også have nytte af en fjerde dimension. Der kan alle knuder løses op…

 

Løgnedetektorer og screening for sygdomme

I årets valgkamp ville Ekstrabladet have politikere til at underkaste sig en løgnedetektor. Det ville politikerne ikke – og det er der mange gode grunde til. En af dem er, at løgnedetektorer ikke virker. Det er ellers så smart i de amerikanske film, i talkshows og andre steder, at man kan finde “sandheden” med sådan en test. Men det er der ikke noget belæg for. (Nedenstående er en delvis genudsendelse fra Numb3rs-bloggen, men mon ikke, mange har glemt det indlæg…)

I bogen The Lie behind the Lie detector er en lang udredning om problemerne ved løgnedetektorer. Man kunne ellers forestille sig at man ret let kunne lave kontrollerede forsøg, eller undersøge noget af alt det data, man har fra allerede udførte løgnedetektioner, og det har man  også gjort, men det giver ikke gode resultater. Problemet er bl.a., at de fysiologiske reaktioner, man måler, også kan komme fra andet, end at man lyver. Og det er meget vanskeligt at skille ad. Og så er vi jo et stykke væk fra noget objektivt. Se også The polygraph and lie detection.
Et andet problem er, at forskellige personer fortolker et løgnedetektorudkrift forskelligt – i en Nature artikel fra 1984 tog man 207 udskrifter fra løgnedetektorer i en stribe senere opklarede sager og fik dem analyseret af 14 andre løgnedetektoreksperter. Det gav dom til 43 % af de uskyldige og frikendelse til 36 % af de skyldige…

Det er selvfølgelig værst, at man risikerer at dømme en uskyldig, men i andre lignende situationer kan både falske positive og falske negative være problematisk. Tester man for en sygdom kan det være lige problematisk at sende raske personer igennem en behandling med bivirkninger som at overse nogen, som er syge.

Hvordan ved man, om en test er god?

En test for en sygdom skal jo finde de syge, men helst ikke udpege for mange raske som værende syge. Lad os sige, man har en positiv test, hvis den viser, man er syg.

Der er et antal falsk positive FP (raske, som tester positivt)

Et antal falsk negative FN (syge med en negativ test)

Et antal sandt positive SP( De syge med positiv test)

Og et antal sandt negative SN (raske med negativ test)

Specificitet er \frac{SN}{(SN+FP)}, andelen af de raske, som tester negativt, altså sandsynligheden for at testen viser, man er rask, givet man er rask,  P(testrask|rask).
Sensitiviteten er \frac{SP}{(SP+FN)}, andelen af syge, der tester positivt P(testsyg|syg).

Vi er mere interesserede i “den anden vej”:

Den positivt prædiktive værdi er \frac{SP}{(SP+FP)}, andelen af positivt testede, som rent faktisk er syge, sandsynligheden for at være syg, når testen viser, man er det, P(syg|testsyg).
Eller, man kan se på den negativt prædiktive værdi \frac{SN}{(SN+FN)}, andelen af negativt testede, der rent faktisk er raske P(rask|testrask).
De prædiktive værdier afhænger af, hvor stor en andel af de testede, der er syge, prævalensen. Og ikke kun af sensitivitet og specificitet.

Eksempel: En test har sensitivitet 0,86 og specificitet 0,92

På et hospital henvises folk, som mistænkes for at have  sygdommen, til test. På et andet er det en test, der laves på alle. Prævalensen i det første tilfælde er altså højere end i det andet tilfælde.

Hospital 1 er 37 ud af 49 patienter syge. (Prævalensen er 37/49=0,76)

SP=0,86×37=32,
SN=(49-37)x0,92=11,
FP=12-11=1,
FN=37-32=5.

Specificitet SN/(SN+FP)=11/12=0,92

Sensitivitet SP/(SP+FN)=32/37=0,86

Positiv prædiktiv værdi SP/(SP+FP)=32/33=0,97

Negativ prædiktiv værdi SN/(SN+FN)=11/16=0,69

Hospital 2 er 37 ud af 157 syge. Prævalens 0,24

SP=32, SN=110, FP=10,  FN=5,

Specificitet SN/(SN+FP)=110/120=0,92

Sensitivitet SP/(SP+FN)=32/37=0,86

Positiv prædiktiv værdi SP/(SP+FP)=32/42=0,76

Negativ prædiktiv værdi SN/(SN+FN)=110/115=0,96

Hvis man tester en stor befolkningsgruppe med få syge, vil den negative prædiktive værdi være stor, i.e., hvis man tester negativt, er man med stor sandsynlighed rask. Men dem, der tester positivt vil i mange tilfælde være raske, i.e., sandsynligheden for at være syg givet testen viser syg, er lille. (Tallene er fra How sensitive is sensitivity, how specific is specificity, Phillips, Scott og Blasczcynski, American Journal of Roentgenology. Prøv selv at regne på, hvod der sker, hvis der er 37 syge ud af 12037. Så bliver positiv prædiktiv værdi 0.03 og negativ prædiktiv værdi 0,99. Der er altså rigtig mange blandt dem, der tester positivt, som alligevel er raske – her 97 ud af 100. Det er det, man skal overveje, når man laver store screeninger for sygdomme. Der er flere raske, som skal undersøges yderligere, måske behandles og i hvert fald bliver unødigt bekymrede.

På Understanding Uncertainty er der en fin animation af andre eksempler.

Løgnedetektorer igen.
Lad os nu antage, at de kan finde løgnere med en vis sandsynlighed (det kan de ikke, men alligevel…). Tester man alle, der ansøger om job i FBI, CIA,… og det gør man…vil dem, der ser ud til at lyve, stadig med ret stor sandsynlighed tale sandt. I.e., mange får et stempel som spion, uden at være det. Dem, der udses som ikke værende spioner, er det med ret stor sandsynlighed ikke, men det er mere fordi, der er rigtig mange, der ikke er spioner, end fordi man er god til at finde spioner. Der vil jo stadig være en enkelt spion der slipper ind nu og da.

Vi kan være glade for, at vi ikke bruger metoden til noget seriøst i Danmark og håbe på, det forbliver noget, der hører til pjattede TV-programmer. Så fans af Doctor Phil eller  andre populære brugere af løgnedetektorer bør tage det med et gran salt. Udover det helt oplagte, at sårbare mennesker ikke bør være underholdning. Men det er ikke matematik – bare almindelig ordentlighed.

Abelprisen 2019 går til Karen Uhlenbeck.

Tirsdag blev årets Abelprisvinder annonceret i en live streamet begivenhed i Oslo.

Karen K.Uhlenbeck får prisen for sit nybrudsarbejde (de skriver “nybrottsarbeid” på norsk) indenfor geometriske differentialligninger, gaugeteori og integrable systemer. Og for den fundamentale indflydelse, hendes arbejde har haft i analyse, geometri og matematisk fysik.

Her fortæller Karen Uhlenbeck om Emmy Noethers arbejde. (Foto Andrea Kane, IAS,Princeton) Noether var  i 1928 en af hovedforedragsholderne ved den internationale kongress for matematiker, ICM. Den næste kvinde i rækken af hovedforedragsholdere ved ICM var Karen Uhlenbeck i 1990.

Karen Keskulla Uhlenbeck (f. 1944) har, ligesom de andre Abelprismodtagere, haft en lang karriere i matematik og der er mange fine interviews og portrætter af hende på nettet. På Celebratio.org er hun  portrætteret i et fint interview af Allyn Jackson. Der er i øvrigt andre fine matematikerportrætter.

Jeg kender Uhlenbecks matematik fra da jeg i mit speciale beskæftigede mig med Gaugeteori. Uhlenbecks “bubbling” var helt centralt i det, der dengang var det hotte emne, 4-dimensionale mangfoldigheder og nye ideer, som forbandt forskellige områder af matematik og Gaugeteori fra fysik. Jeg vil (og kan) ikke forklare Uhlenbecks arbejde i detaljer, men nybrud, som Abelpriskommiteen kalder det, er en god overskrift.

Minimalflader, variationsregning og bobler/instantoner.

Minima og maksima for funktioner kendes fra gymnasierne. Man skal differentiere funktionen og finde nulpunkter.

Variationsregning er et skridt videre: Det, der skal minimeres er et funktional, som er en funktion, hvis input er andre funktioner. Det klassiske eksempel er det brachistochrone problem: Lav den hurtigste kuglebane mellem to punkter. Kuglen lægges i det øverste punkt og er kun påvirket af tyngdekraften, mens den ruller til det andet punkt. Man ville måske gætte på en linje – det er sådan en pæn kurve – men den blå kurve nedenfor giver svaret.

Billedresultat for brachistochrone

Man skal altså se på alle de kurver, der findes fra A til B – kurverne er de variable, funktionen er den samlede tid.

Mere generelt ser man på den samlede energi. Der er her vide rammer for, hvad energifunktionalet kan være. Man kan faktisk også her differentiere og finde nulpunkter for den afledede, men det kræver mere maskineri. Og man får bragt partielle afledede ind i billedet.

Uhlenbecks PhD-afhandling, “The calculus of variations and global analysis”, 1968, er i dette område.

Mens det brachistochrone problem drejer  sig om alle kurver mellem to punkter, kan man i stedet se på flader (2-dimensionale objekter) mellem givne randkurver (tænk på sæbehinder)

Billedresultat for soap bubble minimal surface

OBS: Det er ikke det, der er Uhlenbecks “bubbling”.

Man leder her efter fladen med mindst areal. Trækker man ringene langt fra hinanden, får man to sæbehinder – en i hver ring.

I det mere generelle problem, som Uhlenbeck og Jonathan Sacks løste, har man flader i mere komplicerede rum end vores sædvanlige Euklidiske. En flade er da en funktion fra kuglefladen til dette mere komplicerede rum. De konstruerer en følge af sådanne afbildninger, som allesammen er “pæne” og kommer tættere og tættere på en ny flade – en grænse for følgen. Matematikstuderende har set den slags grænsefunktioner i indledende analyse.

Grænsefladen er en funktion, som er pæn, bortset fra i et endeligt antal punkter, singulariteter. Tæt på singulariteterne har man “bubbling”. Arealet af grænsefladen er mindre end forventet – det er ikke grænsen for arealerne af følgen. Noget af arealet er boblet af – som et stykke tyggegummi.

Metoden og ideerne har haft enorm indflydelse – grænser, der kan kontrolleres, bortset fra i endelig mange punkter, er ikke så ringe endda. Og bubbling giver en forståelse af singulariteterne.

Gauge Teori

(udtales som en engelsk port, “gage”) drejer sig i fysik om de fænomener, som ikke ændrer sig, selvom man skifter “koordinatsystem” – laver en gaugetransformation. Fysikerne Yang og Mills fik i 1999 Nobelprisen for det, de i 1954 havde foreslået som en model for den svage vekselvirkning og som udvidede de hidtil brugte “koordinatskift” (til ikke-abelske grupper for de indviede).

Det, der skal være uafhængigt af valg af koordinatsystem er nogle partielle differentialligninger.

Invarians under koordinatskiftet simplere eksempel:

“Vindretningen er NNØ (Nord Nord Øst), hvor jeg står” giver kun mening, hvis jeg har et koordinatsystem med retningerne. Men vinden har den retning, den har.

Billedresultat for vindretning danmark

Står man på Nordpolen, given NNØ ikke mening – der skal bruges flere koordinatsystemer for at beskrive retninger på Jorden, og tilhørende “oversættelser” fra et koordinatsystem til et andet.

Tilbage til Gaugeteori. Den kombination af partielle differentialligninger (Yang Millsligningerne)  og geometri (kugleflader, mere komplicerede flader og lignende højeredimensionale objekter – mangfoldigheder) kræver nye metoder og mod til at gøre noget i det ene matematiske område, som man aldrig har prøvet før. Uhlenbeck gav matematisk fast grund under fødderne i studiet af Yang Mills ligningerne. Bl.a. er bubbling fundamentalt. Uhlenbeck forklarer selv i interviewet med Allyn Jackson, at bubbling fungerer, når man har et problem, der er invariant under skalering – noget, hun allerede havde klarlagt i sin phd-afhandling.

Som den skarpsindige læser vil se, er Uhlenbecks arbejde ikke let at forklare. Hun har arbejdet mellem matematiske områder og kastet sig ud på det dybe vand imellem områderne.

Karen Uhlenbeck

Karen Uhlenbeck i Berkeley i 1969.

En anden side af Karen Uhlenbeck er hendes arbejde for at give matematikken videre. Hun startede, sammen med Dan Freed i 1996 Park City Mathematics Institute, PCMI, hvor bl.a. gymnasielærere og matematikere mødes. Det er flere parallelle sommerskoler og har haft stor betydning for mange, som er mødtes der. Der er en forskningsdel for phd-studerende og der er fokus på at give minoriteter i faget mulighed for at få fodfæste.

Karen Uhlenbeck har haft enorm indflydelse i både matematik som fag og blandt matematikere, og potentielle matematikere, hvor hun siger, hun håber, hun kan være rollemodel for de skæve eksistenser. Hun er rollemodel for mange, hun er en matematisk superstjerne og nu får hun Abelprisen. Det er jeg meget begejstret for.

Læs mere i Quanta Magazine  og på Abelprisens sider. Der er mange andre, men dem finder I nok, når I Googler.

Julekalenderanbefaling

Jeg er lidt sent ude, men det bliver jo jul alligevel.

Der kommer ikke julekalender her på bloggen. Men der er heldigvis andre, der tror, de kan holde dampen oppe og poste 24 indlæg med matematik. Så her skyder vi genvej og henviser til andre.

Først på tysk Mathe im Advent
Man skal vistnok tilmelde sig.
The Aperiodical har selvfølgelig en julekalender. Der er mange fine matematikhistorier og opgaver. Og naturligvis Møbiusbånd.

Matthew Scroggs, endnu en matematikformidler i Storbritannien, har opgaver og hovedbrud.

Plus Magazine har en. Med Podcasts.

Transum, som jeg ikke kendte i forvejen har også en – med opgaver.

Og så noget matlabkode forklædt som juletræ:

Koden finder I her.

I kan vælge forskellige parametre. Hvor mange kugler skal der på? Hvor skinnende skal kuglerne være… Uhyre nyttigt 🙂

Scutoiden- en ny byggeblok i biologi

En artikel i Nature Communications om et “nyt matematisk objekt” har givet genlyd. Scutoiden hedder den lille ny. Den kan ses på figur d, hvor to scutoider passer sammen (den grønne og den gule)

Fig. 1

Illustration fra Nature Communications.

Scutoider er (op)fundet af en gruppe forskere – biologer, dataloger, matematikere, som ville forstå, hvordan visse typer væv, epithelvæv, er opbygget. Den slags væv er lagdelt – eller pakket mellem nogle lag. Ifølge artiklen i Nature, er der epithel-celler, som forbinder celler i to (flade) lag. Det har man bl.a. set i bananfluer – drosophila.

File:Epithelium TCJ.pngBillede fra Wikipedia – cell junctions.

Hvis lagene ikke krummer, er der allerede en fin model, hvor de to lag forbindes med prismer og keglestubbe (a og b på første figur – frustrum er keglestub).

Men hvad nu, hvis lagene krummer? Som eksempelvis når væv er afgrænset omkring en blodåre, tarmene eller noget i den retning?

I hvert afgrænsende lag danner cellegrænserne Voronoiceller:

Billedresultat for cells form voronoi De røde prikker er centre. Et punkt i en “celle” ligger tættere på det røde punkt i cellen end på noget andet rødt punkt.

Sådan er det altid – uanset, om lagene krummer eller ej. Nu skal to sådanne lag forbindes. I modellen skal der laves en forbindelse fra hver Voronoicelle i det ene lag til hver Voronoicelle i det andet, som man ser i a) og b) i første figur. Når lagene er plane, har man hidtil kunnet gøre det med keglestubbe og prismer – fordi man i det tilfælde har lige mange kanter langs matchende Voronoiceller i de to lag.

Forestiller vi os nu, at de to lag er cylindriske med forskellig radius som i c) og desuden for at gøre det simplere, at cellekernerne ligger “samme sted” bortset fra radiuskoordinaten – mere præcist: Punkter i rummet kan beskrives med en radius, vinkel og en højde. Figuren nedenfor viser radius, vinkel og højde (\rho,\varphi, z). Cellekernerne på de to forskellige cylindere har altså samme (\varphi,z), men forskellig \rho

Hvad sker der så med Voronoicellerne? Bliver de ikke bare “ganget ud” med radius? Nej! For afstande mellem punkter på cylinderne bliver ikke bare ganget:

Afstande på en cylinder kan findes ved at “rulle cylinderen ud” til et rektangel og måle i planen.

Er cylinderen h høj og har radius r, er rektanglet h på den ene led og 2\pi r på den anden. Med samme højde og radius R er det h på den ene led og 2 \pi R på den anden. Og så ændrer Voronoicellerne sig kvalitativt. På billederne nedenfor, som Jakob Gulddahl Rasmussen har lavet til mig, er 6-kanten omkring det midterste punkt blevet til en 4-kant, når der strækkes på den ene led. Linjestykkerne er midtnormaler mellem par af punkter (på linjestykket er der lige langt til to af “cellekernerne”) og de slutter, når de møder andre midtnormaler. I kan lege med, hvordan det ændrer sig, når man strækker på den ene led, eller  når man flytter  i en af de mange apps, der findes. Her er en på University of Michigan. – Se mere på Numb3rsbloggen

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Og så kommer problemet: Man skal indsætte en forbindelse mellem celler med forskelligt antal kanter. Det kan ikke være en keglestub eller et prisme, for de har samme antal kanter i øverste og nederste flade. Det er her Scutoiden skal bruges. I figuren øverst ser man scutoider mellem femkanter og sekskanter. Den ene kant i scutoiden deler sig et stykke nede i to kanter. (Hvis man flytter delepunktet helt ned (eller op), får man et prisme, men det er ikke sådan, vævet opfører sig.)

Scutoidens sider er ikke plane – de krummer. Men det har vist sig, at det er sådan, det ser ud, når man kigger nærmere på en bananflue, eller hvad man nu har.

Scutoider bruges nu til at lave modeller for epithelvæv. Man gætter på, at de kan bruges til at lave kunstigt væv.

Man kan købe 3d-printede scutoider, der er artikler om scutoider her, der og allevegne. Jo, den lille ny er berømt.

Pair of Packable Scutoids 3d printed Order &quot;Small&quot; for hollow models or &quot;Large&quot; for (same size) solid models

Selvfølge har den uforlignelige Matt Parker lavet en video om scutoider. Med piberensere… Og interview med matematikeren bag.

Om det er ny matematik, kan man bestemt godt diskutere. Men det er ny indsigt og giver nye anvendelsesmuligheder i et samarbejde mellem mange fagområder. Det er da helt fremragende!

Sommerferie – og masser af matematik

Det er sommer og der er stilhed på bloggen. Mens I venter er her et tilbud:

På The Aperiodical har de The Big Internet Math-Off – inspireret af VM i fodbold, I presume. Det er knock out fra begyndelsen af. To matematikformidlere fortæller om deres yndlingsmatematik og der kan så stemmes. Her er et forslag: Jeg lover, at vi vil fortælle mere her på bloggen om mindst et af emnerne. (Eller måske bare give en dansk version – det er svært at konkurrere med Matt Parker og co.)

Her er de hidtidige indlæg:

James Tanton mod Nira Chamberlain.

Tanton: Om at skære en kage op og samle den igen og få kage tilovers – og lave uendelig meget kage.

Chamberlain: Om Formel 1 og hvordan Reynoldsligningen sikrer, hjulene ikke falder af.

Samuel Hansen mod Paul Taylor

Hansen: Hvorfor dine venner har flere venner, end du har (Link til Soundcloud) og hvordan det kan bruges til at stoppe epidemier.

Taylor: Hvordan kan man være helt sikker på, Pythagoras’ sætning holder (se linket ovenfor – det er ikke en video.)

Peter Rowlett mod Alison Kiddle

Rowlett: Parabolske kurver – herunder at tegne dem med rette linjer. Og tikz-kode, så du kan gøre det i LaTeX. Også en lille video

Kiddle: Hagas sætning – matematisk origami, om at folde et kvadrat og få delt siderne  i diverse brøkdele Se også Plus Magazine

Edmund Harriss mod Colin Wright

Harriss: Penrose fliselægning. Det har vi haft på bloggen før, men ikke med så fine fliser skåret i træ 🙂

Wright: Tag et spil kort og lav 13 bunker (med 4 i hver). Hvis der er alle kort es, 2,3,…, konge, (ikke nødvendigvis i rækkefølge)  er du færdig. Ellers: Kan du omorganisere hver bunke, så du ender med at have es,to,…, konge øverst? Svaret er, ifølge Wright, altid ja.

Tiago Hirth mod Evelyn Lamb

Hirth: Et rebtrick med Borromeanske ringe

 

Lamb: Wallis’ si og sammenhængen med \pi. (I familie med Sierpinskis tæppe, Mengers svamp,…) One level of the construction of the Wallis sieve Hun har mere om det på sin blog Det er et af en længere række af yndlingsobjekter (favourite spaces – svært at oversætte)

Matt Parker mod Matthew Scroggs 

Parker: Machine Learning med perler i æsker. En “maskine” lærer at spille kryds og bolle.

 

Scroggs: Om at spille Asteroids i en kortprojektion (han kalder det Mathsteroids). Blogmosteren her synes, det er supercool, men kortprojektioner er altså virkelig god matematik.

Her er spillet i Mercatorprojekttionen

Der er andre, som er mere udfordrende: Billedet her viser rette linjer i den projektion, der bruges i FNs logo.

FNs logo

James Propp mod Zoe Griffiths

Propp: Om knuder og rebtrick.

Griffiths: Sandsynlihedsteori og placering af passagerer i et fly

 

Jo Morgan mod Tony Mann

Morgan: Hexaflexagons. Med link til Vi Harts videoer om netop det. De har danske undertekster!

 

Mann: Om tilfældige tal og at score 100% til enhver eksamen (Njah, mon dog)

 

 

 

 

 

 

 

 

 

 

 

Ford-cirkler – og addition af brøker som vor mor IKKE gør det.

Vælg to hele tal p og q, som er parvis primiske (det eneste tal, der går op i både p og q er tallet 1). Tegn cirklen i planen med radius \frac{1}{2q^2} og centrum i (\frac{p}{q},\frac{1}{2q^2}) . Bed nu en anden om at gøre det samme – med nyt valg af p og q. De to cirkler vil tangere x-aksen og enten tangere hinanden eller ikke have noget til fælles. Bliv ved og der opstår et fint mønster af cirkler. De kaldes Ford-cirkler, fordi de blev beskrevet i en artikel i American Mathematical Monthly i 1938 af Lester R. Ford Sr.

Notation: Fordcirklen svarende til p,q kaldes C(p,q).

Her på figuren er valgt p\leq q, så 0\leq \frac{p}{q}\leq 1 og dermed er x-koordinaten for centrum mellem 0 og 1. Tallet i cirklen er x-koordinaten for centrum (forkortet, så det svarer til p/q). Farven indikerer nævneren p.

Her er nogle konstateringer:

  • Ethvert rationalt tal a/b på x-aksen bliver rørt af en Fordcirkel: Forkort a/b og lav så Fordcirklen.
  • Radius og dermed højde af C(p,q) afhænger kun af q.

To Fordcirkler skærer ikke hinanden:

To Fordcirkler C(p,q) og C(r,s) vil enten tangere (kysse kaldte jeg det i indlægget om kuglepakninger) eller slet ikke røre hinanden:

De har centrum i hhv. (\frac{p}{q},\frac{1}{2q^2}) og (\frac{r}{s},\frac{1}{2s^2}) så afstand mellem centrene opfylder

d^2=(\frac{p}{q}-\frac{r}{s})^2+(\frac{1}{2q^2}-\frac{1}{2s^2})^2

Summen af de to radier er s=\frac{1}{2q^2}+\frac{1}{2s^2}

Nu sammenligner vi d og s ved at udregne d^2-s^2. Hvis de to cirkler skærer hinanden er d^2-s^2<0 . Tangerer de, er d^2-s^2=0.

d^2-s^2=(\frac{p}{q}-\frac{r}{s})^2+(\frac{1}{2q^2}-\frac{1}{2s^2})^2-(\frac{1}{2q^2}+\frac{1}{2s^2})^2=(\frac{p}{q}-\frac{r}{s})^2- 4(\frac{1}{2q^22s^2})=(\frac{ps-rq}{qs})^2- (\frac{1}{q^2s^2})=\frac{(ps-rq)^2-1}{(qs)^2}

Forskellige Fordcirkler skærer ikke:

Hvis de to cirkler skærer, er
( ps - rq )^2 - 1<0 og altså ( ps - rq )^2 <1

Men  ps – rq  er et helt tal, så det vil kræve
ps – rq = 0 og altså  ps = rq ,
\frac{p}{q}=\frac{r}{s}
og altså er det samme cirkel.

Fareyfølger.

Hvis C(p,q) og C(r,s) tangerer, er |ps-rq|=1. Det leder til en anden pudsig observation. men først skal vi have indført brøkregning a la Farey:

Dette er de første Fareyfølger

  1. F_1=\frac{0}{1},\frac{1}{1}
  2. F_2=\frac{0}{1},\frac{1}{2}, \frac{1}{1}
  3. F_3=\frac{0}{1},\frac{1}{3},\frac{1}{2},\frac{2}{3}\frac{1}{1}
  4. F_4=\frac{0}{1},\frac{1}{4},\frac{1}{3},\frac{1}{2},\frac{2}{3},\frac{3}{4},\frac{1}{1}
  5. F_5=\frac{0}{1},\frac{1}{5},\frac{1}{4},\frac{1}{3},\frac{2}{5},\frac{1}{2},\frac{3}{5},\frac{2}{3},\frac{3}{4},\frac{4}{5},\frac{1}{1}

Fareyfølgen F_n er uforkortelige brøker mellem 0 og 1 med nævner højst n. Rækkefølgen er efter størrelse. De elementer, der tilføjes til F_n for at få F_{n+1} er medianten af naboerne:

I F_5 tilføjes \frac{2}{5}. Naboerne er \frac{1}{3},\frac{1}{2}. Medianten er dårlig brøkregning, Fareyplus:

\frac{1}{3}\oplus\frac{1}{2}=\frac{1+1}{3+2}=\frac{2}{5}

Her er det tilsvarende for Fordcirklerne

Hvorfor gælder det? Her er først nogle konstateringer:

  1. Hvis 0<\frac{a}{b}<\frac{c}{d}<1 ligger medianten imellem dem \frac{a}{b}<\frac{a+c}{b+d}<\frac{c}{d}. Man viser det første ulighedstegn som følger:  \frac{a}{b}<\frac{a+c}{b+d} \Leftrightarrow (b+d)a<(a+c)b \Leftrightarrow da<cb og det følger af \frac{a}{b}<\frac{c}{d}.
  2. Medianten mellem to naboer i F_k tilføjes i skridtet fra F_n til F_{n+1}, når nævneren den forkortede brøk svarende til \frac{a+c}{b+d} er højst n+1.
  3. Medianten af to naboer i en Fareyfølge F_k er uforkortelig: Medianten er ikke i F_k, da \frac{a}{b}, \frac{c}{d} er naboer. Antag \frac{a+c}{b+d}=\frac{rq}{rp} og $\frac{q}{p}$ er uforkortelig. Så er p>k, da medianten ikke er i F_k. rp=b+d og b+d\leq 2k. Altså er r=1.

Medianten tilføjes altså i skridtet fra F_{b+d-1} til F_{b+d}.

Nu mangler vi blot at se, at alle uforkortelige brøker kommer med i en proces, hvor vi begynder med \frac{0}{1},\frac{1}{1} og tilføjer medianter.

Stern Brocot-træet.

Lad os undlade at holde styr på, hvor store nævnerne er. Så bygger vi Stern-Brocot-træet (opkadt efter Moritz Stern, matematiker, og Achille Brocot, urmager (!) ):

Vi bruger kun den venstre side. De stiplede linjer hjælper til at se, hvad der tages medianter af, men et lag eller “niveau” er kun de sidst tilkomne.

Påstand: Alle uforkortelige brøker kommer med i et lag i træet. (Og det er derfor ok at konstruere Fareyfølger via medianter.)

Først er hjælperesultat: Hvis \frac{a}{b} < \frac{c}{d} er barn og forælder eller forælder og barn i træet (forbundet med en kant opad eller nedad fra \frac{a}{b} til $latex  \frac{c}{d}$, så er bc-ad=1. Bevis: Induktion. Det er ok for 0/1 og 1/1. Hvis ok for \frac{a}{b} < \frac{c}{d}, så er det ok for kanter til og fra medianten: Der er enten en  kant nedad mellem  \frac{a}{b} < \frac{a+c}{b+d} eller opad \frac{a+c}{b+d}<\frac{c}{d}.
b(a+c)-a(b+d)=bc-ad=1 pr antagelse. Og tilsvarende for den anden side. (Lav selv et særargument for medianterne med hhv. 0/1 og 1/1.) En konsekvens er, at afstanden er  |\frac{a}{b} - \frac{c}{d}|=\frac{1}{bd}.

 

Argument for, at alle uforkortelige brøker er med i Stern-Brocot-træet: : På det k’te niveau i træet er summen af nævner og tæller i brøkerne mindst k+2, da Niveau k fremkommer som medianter fra niveau k-1 og højere niveauer. (Der laves hele tiden medianter med 0/1 og 1/1).

Antag nu, at p/q ikke er med i træet. Specielt er den ikke med på niveau p+q-1. Men den ligger mellem to naboer (forbundet med en kant), hvor den ene er på niveau p+q-1: \frac{a}{b} <\frac{p}{q}< \frac{c}{d}. Omskriv de to uligheder til

bp-aq>0 og cq-dp>0. Det er hele tal, så vi kan skrive \geq 1 begge steder.

Heraf: (bp-aq)(c+d)+(cq-dp)\geq c+d+a+b\geq p+q+1 (Det sidste følger af, at den ene brøk er fra niveau p+q)

Udregn venstresiden og brug bc-ad=1, da disse er forælder og barn i træet. Venstresiden giver da p+q. Og vi har en modstrid.

Tilbage til Fordcirklerne:

To Fordcirkler C(p,q) og C(r,s) tangerer hvis og kun hvis |ps-rq|=1. Altså svarer brøker, som er naboer i en Fareyfølge til tangerende Fordcirkler. Og det gælder også omvendt, men det har vi ikke vist her.

Endnu et pænt billede. His Fordcirklerne skærer, så vil halvcirklen fra (p/q,0) til (r/s,0) passere skæringspunktet.  Farven på halvcirklerne svarer til den Fareyfølge, hvori brøkerne er naboer.

 

 

 

Langlands får Abelprisen 2018 for at stille gode og dybe spørgsmål.

I 1967 skrev den dengang 31-årige Robert P.Langlands et 17 sider langt brev til André Weil. Weil var 30 år ældre og en af den tids store og indflydelsesrige matematikere. De to mødte hinanden, da de ventede på at komme ind til et foredrag, Langlands gav sig til at fortælle om nogle ideer og Weil foreslog ham at skrive dem ned. Måske for at slippe væk… Weil inviterede desuden Langlands til at besøge ham på Institute of Advanced Studies, Princeton og det lange brev skrev han inden besøget. Billedet her viser, hvad Langlands skrev på forsiden:  ”In response to your invitation to come and talk I
wrote the enclosed letter. After I wrote it I realized
there was hardly a statement in it of which I was certain.
If you are willing to read it as pure speculation
I would appreciate that; if not – I am sure you have
a waste basket handy.”

Weil fik renskrevet de 17 sider – på skrivemaskine – og det er det, derblandt matematikere kaldes Langlandsprogrammet.

Nu får Langlands  Abelprisen for sine “spekulationer”! Han har naturligvis selv bevist matematiske resultater, men priskomitéen skriver, han får prisen for “sit visionære program, der forbinder repræsentationsteori og talteori.”

Langlands på en konference i 2016. (Dan Komoda/Institute for Advanced Study)

Langlandsprogrammet indeholder nogle formodninger (conjectures) og et program for, hvordan man bør kunne bevise, at disse er korrekte. Det drejer sig om nogle forbindelser mellem områder af matematik, som ellers er ret forskellige i både emneområde og metoder. Den slags forbindelser giver sædvanligvis anledning til rigtig mange nye indsigter i begge områder. Lad mig forsøge at kaste lys på et lille hjørne af, hvad det går ud på:

Nogle primtal kan skrives som en sum af to kvadrattal:

2= 1^2+1^2
5= 1^2+2^2
13=2^2+3^2
17=1^2+4^2
29=2^2+5^2

Hvis man ser bort fra 2 (vi skriver “for et ulige primtal”, men der betyder jo bare, at 2 ikke er med) har alle disse primtal en fælles egenskab: Et primtal p, som ikke er 2, kan skrives som en sum af to kvadrattal hvis og kun hvis p=4k+1, hvor k er et naturligt tal. Det beviste Euler. Det er et eksempel på en reciprocitetslov – en egenskab ved primtallene udtrykkes ved division med rest . Her er det division med 4, som skal give rest 1. Vi skriver p\equiv 1 \mod 4

Et komplekst tal a+bi kaldes et Gaussisk heltal, hvis a,b er hele tal. Hvis p=m^2+n^2, så er (m+in)(m-in)=p ( husk, i^2=-1 og så er resten givet ved at gange ind i paranteser) og omvendt. Et primtal p er et produkt af to Gausisske heltal hvis og kun hvis det er en sum af to kvadrattal. 

De Gaussiske rationale tal er tal a+bi, hvor a og b er rationale tal (kan skrives som en brøk \frac{c}{d}, hvor c og d er hele tal. Ganger, dividerer, adderer eller subtraherer man to Gaussiske rationale tal med hinanden, er resultatet rationalt. De Gaussiske rationale tal udgør derfor ikke bare en delmængde \mathbb{Q}(i) af de komplekse tal, men et legeme. Man kan se det som en udvidelse af de rationale tal – man tilføjer i og reglen i^2=-1 og “beholder” regnereglerne. Det kaldes en legemsudvidelse. 

Nu ser vi på symmetrier.
Hvilke afbildninger har vi f:\mathbb{Q}(i)\to \mathbb{Q}(i), som er lineære: f((a+bi)+(c+di))=f(a+bi)+f(c+di) og bevarer produktstrukturen f((a+bi)(c+di))=f(a+bi)f(c+di) og desuden opfylder f(a+0i) = a+0i. Der er kun to afbildninger: Identitetsafbildningen f(a+bi)=a+bi og g(a+bi)=a-bi.

Da g(g(a+ib))=a+ib (man får skiftet fortegnet to gange), udgør funktionerne f og g en gruppe og g har orden 2 – sammensæt den med sig selv to gange, så får man identiteten.Det er Galoisgruppen for legemsudvidelsen \mathbb{Q}(i) over \mathbb{Q}.

Tilsvarende kan man se på Galoisgruppen for andre udvidelser af de rationale tal. Tænk på \mathbb{Q}(i) som en udvidelse af \mathbb{Q} med rødder i x^2+1 og dermed kvadratrødder af alle negative rationale kvadrattal. Vi ved, at alle andengradspolynomier ax^2+bx+c med rationale a,b,c, har to rødder (mere præcist, kan skrives a(x-r_1)(x-r_2) med  r_1,r_2\in \mathbb{R}(i) og en formel for disse rødder kan skrives blot med brug af kvadratrodssymbolet.

Alle tredjegradspolynomier med rationale koefficienter x^3+ a_2x^2+a_1x+a_0 har rødder, som kan opskrives ved brug af kvadratrødder og kubikrødder. Tilsvarende for 4.gradspolynomier, når man tilføjer fjerde rødder. Men for femtegradspolynomier går det galt. Det viste Abel og Galois. Det er altså ikke nok at kunne løse ligninger x^5=a for at kunne løse alle femtegradspolynomieligninger. Det mere generelle spørgsmål er, om der er en sammenhæng mellem løsninger til et polynomium P(x) og et andet Q(x).

Man kan formulere resultatet om primtal som sum af kvadrattal via Galoisgrupper. For et (ulige) primtal p er i^p=i, hvis p\equiv 1\mod 4 og i^p=-i, hvis p\equiv 3\mod 4. Funktionen z\to z^p kaldes en Frobeniusafbildning og er et element af  Galoisgruppen. Frobeniusafbildningen er forbindelsen mellem “kan man skrive p som en sum af to kvadrattal” og  “hvad er p \mod 4“.

Tilsvarende spørgsmål. Polynomiet x^2+x+1 har rod 1, når man regner modulo 3, da  1^2+1+1=3\equiv 0\mod 3. Men 1 er ikke en rod modulo 5. Hvor meget information er der i, at kende antallet af rødder modulo  primtal? Og hvad har det med Galoisgrupper at gøre?

Langlandsprogrammet foreslår en vidtrækkende generalisering af dette.

Det giver en forbindelse mellem harmonisk analyse – automorfe former, som er funktioner fra de komplekse tal til de komplekse tal med visse periodicitets egenskaber  –  og rødder i polynomier undersøgt via regning med rest som ovenfor. Andrew Wiles brugte en forbindelse af den type, da han løste Fermats problem.

Jeg har støttet mig til dels informationen på Abelprissiderne nogle noter fra et foredrag at Laurent Lafforgue, som fik Fieldsmedaljen for sit arbejde med Langlandsprogrammet og diverse populariseringer.

 

 

 

 

 

 

 

 

Grisecykler og differensligninger.

Cykler og cyklisk betyder her perioder og periodisk opførsel. Men der er faktisk et begreb i økonomi, som hedder “The Pork cycle” eller “The hog cycle” og det giver vel hos de fleste indre billeder af grise på cykel. Inden vi går videre, skal I have sådan en gris:

Billedresultat for buon compleanno in ritardo

I økonomi er det en anden historie: Med en meget simpel model, afhænger efterspørgslen efter grise(kød) (kun) af prisen og det gør udbuddet også. Der er to funktioner  D er “demand”, efterspørgsel, S er “supply”, udbud og de er funktioner af prisen p: D(p) og S(p).

Men prisen varierer jo med tiden, så det er ikke hele historien. Her lader vi tiden gå i “hop” og altså gør priserne det også: p_1, p_2,\ldots, p_{n-1}.p_n,\ldots Og naturligvis udbud og efterspørgsel: S_1,S_2,\ldots,S_{n-1},S_n,\ldots og  D_1,D_2,\ldots,D_{n-1},D_n,\ldots.

Man kan lade hvert hop svare til en time, en dag, en uge, en måned eller hvad der nu passer i modellen.

Nu kan vi så skrive D_n=f(p_n) for at indikere at efterspørgslen idag afhænger af prisen idag. Men udbuddet af grise kan ikke afhænge af prisen idag. Den kendte griseavleren ikke, da hun besluttede, hvor mange grise, der skulle produceres. Med en passende periode (den tid, det tager at få en gris klar til salg) kan vi skrive S_n=g(p_{n-1}) – udbuddet idag afhænger af prisen i forrige periode.

Hvad kan vi mere sige om funktionerne f og g? Las os gå ud fra, de er differentiable funktioner af en variabel f,g:\mathbb{R}\to \mathbb{R}, hvor input er pris og output er mængden af grisekød – i kilo eller en anden passende enhed. Højere pris giver mindre efterspørgsel og mere udbud, så f'(x)<0 og g'(x) >0. Der er eksempler på varer, hvor det ikke er rigtigt – basale fødevarer, som er forholdsvis billige er et eksempel. Men det er en model, så nu går vi med den.

Her er en graf (fra Wikipedia, Creative Commons) med de to funktioner

Bemærk, at prisen er op ad andenaksen, mens mængden er på førsteaksen. Efterspørgsel er den røde kurve, udbud er den blå.

Pilene indikerer et tidsforløb: Griseavleren ved, at grisene til tid 1 er blevet solgt til prisen p_1 og sætter gang i produktion af g(p_1)=Q_2 grise. De udbydes til salg og man må forestille sig en slags auktion, hvor der nu er Q_2 grise, som give prisen p_2=f^{-1}(Q_2).

Det ser griseavleren og producerer så g(p_2)=Q_3 grise til salg. De går til prisen p_3. Fortsætter man pilene rundt, kan man se, prisen svinge ind mod den pris, der svarer til skæringspunktet mellem de to kurver – den kaldes ligevægtsprisen.

Men det kunne også være gået anderledes:

Her vil prisen svinge længere og længere væk fra ligevægtsprisen. Modellen er en cobweb-model; det ligner et spindelvæv, hvis man tager flere ture rundt. Svingningen i priser er den såkaldte grisecykel.

Det afhænger tydeligvis af funktionerne f og g, om det går mod eller væk fra ligevægt. Det kan skrives op med en differensligning:

S_n=D_n og altså f(p_n)=g(p_{n-1}). Nu simplificerer vi yderligere og lader begge funktioner være lineære:

f(x)=a+bx og g(x)=c+dx, hvor a>0, b<0,d>0 og a>c.  c kan  godt være negativ – måske produceres der ikke grise, hvis prisen er for lav.) Så bliver ligningen a+bp_n=c+dp_{n-1}, som kan omskrives til

bp_n-dp_{n-1}=c-a

Skæringspunktet, ligevægtsprisen, er \bar{p}=\frac{c-a}{ b-d}.

Sådan en førsteordens differensligning kan man løse. Generelt ser det sådan ud – vi ser på løsninger til differensligningen

k_1y_n+k_2y_{n-1}=\varphi(n) med k_1\neq 0 og omskriver til y_n+ky_{n-1}= h(n)

  1. Løs det tilhørende homogene problem y_n+ky_{n-1}= 0. Løsningen er $latex  y_n=(-k)^nA$ – det er ikke svært at se, at det er en løsning, uanset A, og at der ikke er andre. (Et induktionsbevis kan gøre det. Ikke noget fancy som for differentialligninger.)
  2. Nu finder man en partikulær (altså bare en) løsning til det inhomogene problem. I vores tilfælde, hvor h(n) er konstant, har vi fundet ligevægtsløsningen \bar{y}.
  3. Den generelle løsning er nu, som vi kender det fra differentialligninger, y_n =A(-k)^n+\bar{y}

Det bruger vi for bp_n-dp_{n-1}=c-a – omskriv til p_n+\frac{-d}{b}p_{n-1}=\frac{c-a}{b} og får

p_n=A(\frac{d}{b})^n+\bar{p}

Da \frac{d}{b}<0, vil $p_n$ svinge omkring \bar{p}. Hvis d<b svinger det ind mod \bar{p}, hvis d=b svinger det frem og tilbage mellem de samme to værdier (grafen i midten nedenfor) og d>b giver svingning væk fra ligevægten. Man kan selvfølgelig finde A, hvis man kender en begyndelsesbetingelse. Kender man p_ 0, er A= p_0-\bar{p}

Billedresultat for cobweb model

Man kan lege med andre forventede priser. Ovenfor tror griseavleren, prisen holder fra en periode til den næste og det synes lidt naivt… Måske ser producenterne  på prisen i de to seneste perioder og så får man en andenordens differensligning. Mere generelt er adaptive forventninger det, at man lærer af, hvor meget, man skød forkert i de seneste perioder. Der findes naturligvis mere generelle modeller og prisdannelse på andre markeder såsom ejendomsmarkedet.

Genetisk landkort – lineær algebra, statistik og forundringsparathed

Dette landkort viser ikke det, du tror (clickbait… )

Fra artiklen

Genes mirror geography within Europe
John Novembre, Toby Johnson, Katarzyna Bryc, Zoltán Kutalik, Adam R. Boyko, Adam Auton, Amit Indap, Karen S. King, Sven Bergmann, Matthew R. Nelson, Matthew Stephens & Carlos D. Bustamante
Nature 456, 98-101(6 November 2008)
doi:10.1038/nature07331

Overordnet viser kortet følgende: Afstand mellem genetisk information fra to personer – en del af DNA – er i en vis forstand den samme, som geografisk afstand mellem de to personers oprindelsessted.

Mere præcist er det lavet ved Principal Component Analysis (PCA) – så lad os se på det først.

Principal Component Analysis:

Mange har set “bedste rette linje” i gymnasierne og PCA er noget lignende, men alligevel ikke helt.

(Fra Wikipedia CC-by-4.0 )

Figuren viser datapunkter i planen, altså data med 2 koordinater. De to akser midt i billedet er fundet med PCA: Origo er i midtpunktet for data, den længste akse er den retning, hvor der er mest variation. Det giver et nyt koordinatsystem. Man mister, som man kan se, ikke meget information ved kun at kende koordinaterne langs den akse, der går langs den længste af de to vektorer, altså projicere vinkelret ind på den linje. Og det er pointen i PCA: Fra en sky af højdimensionalt data – mange koordinater – finder man de retninger, der bedst forklarer variationen i data. Er man heldig, m.a.o., er der passende struktur i data, skal der ikke så mange af de nye koordinater til.

Landkortet kommer fra 1000 personer, datapunkter. Man kender 200.000 genetiske markører. Der er altså som udgangspunkt 200.000 koordinater(!) og PCA har reduceret til 2 koordinater. Akserne er tegnet ind som PC1 og PC2.

Hvordan finder man så disse akser i dette nye koordinatsystem? Og hvordan ved man, hvilke koordinater, der er mest betydende? Til det bruger man lineær algebra. Konkret gør man som følger – med et eksempel:

Opstil data i en matrix:

X=\left( \begin{array}{ccccccc}2&2&3&4&1&-3&-9\\3&1&3&3&4&-7&-7\\4&1&4&4&-1&-7&-5\end{array}\right)    Jeg har 7 punkter med hver 3 koordinater; hver søjle er koordinaterne for et punkt. Jeg har valgt dem, så middelværdien af hver af koordinaterne er 0. Er den ikke det, skal man trække middelværdien fra. Så nu er Origo, (0,0,0),  midt i min datasky. I eksemplet med DNA har de en 200.000 x 1000 matrix.

Fra matricen X udregnes først XX^T, covariansmatricen. Det giver en 3×3 matrix

XX^T=\left( \begin{array}{ccc} 124&117&103\\117&142&117\\103&117&124\end{array}\right)

Kender man ikke matrix produkt, så tænk på det som en organiseret opstilling af alle de skalarprodukter, man kan lave med de tre rækker i X.

Det er et centralt resultat i lineær algebra, at der til sådan en symmetrisk matrix (der står det samme over og under diagonalen) hører tre egenvektorer og det viser sig at være de vektorer, vi leder efter til PCA. Her er det (sådan cirka)

 

v_1= \left( \begin{array}{c} 1\\1,097\\1 \end{array}\right), v_2= \left(\begin{array}{c}-1\\0\\1\end{array}\right), v_3=\left(\begin{array}{c}1\\-1,823\\1\end{array}\right)

Det er egenvektorer for XX^T. De tilhørende egenværdier er (igen sådan cirka – I kan selv regne dem præcist ud, hvis I synes, det er vigtigt). 350, 21, 14. Den første værdi er, som man kan se, langt større end de andre. Altså X X^Tv_1=350 v_1

Det betyder, at langt det meste af variationen i data sker i retning langs v_1. Man mister ikke megen information ved kun at se på datapunkternes projektion ind på den retning.

Her er PCA Explained Visually  Man kan lege med data i 2 og 3 dimensioner og der er et eksempel på, hvordan madvaner og geografi hænger sammen (i Storbritannien).

Landkortet laves som følger:

  1. Find en 200.000×200.000 matrix udfra den oprindelige 200.000 x1.000 matrix.
  2. Udregn egenværdier og egenvektorer for denne.
  3. Se på størrelsen af egenværdierne. Her er to af dem betydeligt større end de andre.
  4. De to tilhørende egenvektorer PC1 og PC2 giver en plan i det 200.000 dimensionale rum. Landkortet viser projektionen af de 1000 datapunkter ind på denne plan. Man har derefter farvet datapunkterne efter personernes oprindelsesland. Og drejet det lidt, så det ligner et sædvanligt landkorts nord-syd og øst-vest orientering. De store farvede cirkler er middelværdier. Eksempelvis er den turkise, der står DK i, middelværdi for alle datapunkter fra Danmark.

Det illustrerer, at afstanden mellem de genetiske markører i meget høj grad kan forklares med geografisk afstand. Bemærk, at den Iberiske halvø (Spanien og Portugal) ligger lidt upræcist. Det skyldes, at afstanden ikke måles direkte på en globus. Det er en rejseruteafstand – den genetiske afstand  afhænger af, hvor langt man tidligere typisk har rejst for at finde sin partner. De lille kort viser, at man i Schweiz har fundet partner blandt dem, der talte samme sprog.

Man kan også undersøge forholdet mellem geografiske og genetiske afstande på andre måder. Mikkel (fra vores eget institut) har undersøgt noget tilsvarende for Y-kromosomer (som kun mænd har), dog ikke vha. PCA men vha. en såkaldt modelbaseret klyngeanalyse. Her ses resultatet: