Grisecykler og differensligninger.

Cykler og cyklisk betyder her perioder og periodisk opførsel. Men der er faktisk et begreb i økonomi, som hedder “The Pork cycle” eller “The hog cycle” og det giver vel hos de fleste indre billeder af grise på cykel. Inden vi går videre, skal I have sådan en gris:

Billedresultat for buon compleanno in ritardo

I økonomi er det en anden historie: Med en meget simpel model, afhænger efterspørgslen efter grise(kød) (kun) af prisen og det gør udbuddet også. Der er to funktioner  D er “demand”, efterspørgsel, S er “supply”, udbud og de er funktioner af prisen p: D(p) og S(p).

Men prisen varierer jo med tiden, så det er ikke hele historien. Her lader vi tiden gå i “hop” og altså gør priserne det også: p_1, p_2,\ldots, p_{n-1}.p_n,\ldots Og naturligvis udbud og efterspørgsel: S_1,S_2,\ldots,S_{n-1},S_n,\ldots og  D_1,D_2,\ldots,D_{n-1},D_n,\ldots.

Man kan lade hvert hop svare til en time, en dag, en uge, en måned eller hvad der nu passer i modellen.

Nu kan vi så skrive D_n=f(p_n) for at indikere at efterspørgslen idag afhænger af prisen idag. Men udbuddet af grise kan ikke afhænge af prisen idag. Den kendte griseavleren ikke, da hun besluttede, hvor mange grise, der skulle produceres. Med en passende periode (den tid, det tager at få en gris klar til salg) kan vi skrive S_n=g(p_{n-1}) – udbuddet idag afhænger af prisen i forrige periode.

Hvad kan vi mere sige om funktionerne f og g? Las os gå ud fra, de er differentiable funktioner af en variabel f,g:\mathbb{R}\to \mathbb{R}, hvor input er pris og output er mængden af grisekød – i kilo eller en anden passende enhed. Højere pris giver mindre efterspørgsel og mere udbud, så f'(x)<0 og g'(x) >0. Der er eksempler på varer, hvor det ikke er rigtigt – basale fødevarer, som er forholdsvis billige er et eksempel. Men det er en model, så nu går vi med den.

Her er en graf (fra Wikipedia, Creative Commons) med de to funktioner

Bemærk, at prisen er op ad andenaksen, mens mængden er på førsteaksen. Efterspørgsel er den røde kurve, udbud er den blå.

Pilene indikerer et tidsforløb: Griseavleren ved, at grisene til tid 1 er blevet solgt til prisen p_1 og sætter gang i produktion af g(p_1)=Q_2 grise. De udbydes til salg og man må forestille sig en slags auktion, hvor der nu er Q_2 grise, som give prisen p_2=f^{-1}(Q_2).

Det ser griseavleren og producerer så g(p_2)=Q_3 grise til salg. De går til prisen p_3. Fortsætter man pilene rundt, kan man se, prisen svinge ind mod den pris, der svarer til skæringspunktet mellem de to kurver – den kaldes ligevægtsprisen.

Men det kunne også være gået anderledes:

Her vil prisen svinge længere og længere væk fra ligevægtsprisen. Modellen er en cobweb-model; det ligner et spindelvæv, hvis man tager flere ture rundt. Svingningen i priser er den såkaldte grisecykel.

Det afhænger tydeligvis af funktionerne f og g, om det går mod eller væk fra ligevægt. Det kan skrives op med en differensligning:

S_n=D_n og altså f(p_n)=g(p_{n-1}). Nu simplificerer vi yderligere og lader begge funktioner være lineære:

f(x)=a+bx og g(x)=c+dx, hvor a>0, b<0,d>0 og a>c.  c kan  godt være negativ – måske produceres der ikke grise, hvis prisen er for lav.) Så bliver ligningen a+bp_n=c+dp_{n-1}, som kan omskrives til

bp_n-dp_{n-1}=c-a

Skæringspunktet, ligevægtsprisen, er \bar{p}=\frac{c-a}{ b-d}.

Sådan en førsteordens differensligning kan man løse. Generelt ser det sådan ud – vi ser på løsninger til differensligningen

k_1y_n+k_2y_{n-1}=\varphi(n) med k_1\neq 0 og omskriver til y_n+ky_{n-1}= h(n)

  1. Løs det tilhørende homogene problem y_n+ky_{n-1}= 0. Løsningen er $latex  y_n=(-k)^nA$ – det er ikke svært at se, at det er en løsning, uanset A, og at der ikke er andre. (Et induktionsbevis kan gøre det. Ikke noget fancy som for differentialligninger.)
  2. Nu finder man en partikulær (altså bare en) løsning til det inhomogene problem. I vores tilfælde, hvor h(n) er konstant, har vi fundet ligevægtsløsningen \bar{y}.
  3. Den generelle løsning er nu, som vi kender det fra differentialligninger, y_n =A(-k)^n+\bar{y}

Det bruger vi for bp_n-dp_{n-1}=c-a – omskriv til p_n+\frac{-d}{b}p_{n-1}=\frac{c-a}{b} og får

p_n=A(\frac{d}{b})^n+\bar{p}

Da \frac{d}{b}<0, vil $p_n$ svinge omkring \bar{p}. Hvis d<b svinger det ind mod \bar{p}, hvis d=b svinger det frem og tilbage mellem de samme to værdier (grafen i midten nedenfor) og d>b giver svingning væk fra ligevægten. Man kan selvfølgelig finde A, hvis man kender en begyndelsesbetingelse. Kender man p_ 0, er A= p_0-\bar{p}

Billedresultat for cobweb model

Man kan lege med andre forventede priser. Ovenfor tror griseavleren, prisen holder fra en periode til den næste og det synes lidt naivt… Måske ser producenterne  på prisen i de to seneste perioder og så får man en andenordens differensligning. Mere generelt er adaptive forventninger det, at man lærer af, hvor meget, man skød forkert i de seneste perioder. Der findes naturligvis mere generelle modeller og prisdannelse på andre markeder såsom ejendomsmarkedet.

Hvor kommer DNA profilen fra?

De såkaldte Ancestry Informative Markers (AIMs) er genetiske markører som indeholder en høj grad af information omkring en persons genogenetiske ophav. Med genogenetisk menes der genetiske markører som relaterer sig til geografisk lokation af subpopulationer. Vi ved at mange fænotypiske træk (fx hud- og hårfarve) er defineret af genetiske markører, mens andre markører ikke nødvendigvis manifesterer sig i umiddeltbart synlige træk.

Det humane genom består af over 3 milliarder nukleobaser angivet ved bogstaverne A, C, G og T. Store dele af genomet er identisk for alle mennesker – idet dette netop gør os til homo sapiens. Den simpleste form for afvigelser er de såkaldte Single Nucleotide Polymorphisms (SNPs), som er enkelt position på genomet hvor fx mindst 1% af populationen har en alternativ base. Fx kunne A være den oprindelige tilstand for en markør mens C er en muteret tilstand. Sådanne markører er interessante fra et populationsgenetisk synspunkt idet fx alle afrikanere kunne have genotypen AA (et A fra mor og et A fra far) mens alle asiater er CC. Ved at benytte informationen fra flere af sådanne markører er det muligt at fastslå hvor det er mest sandsynligt at person kommer fra.

I retsgenetik, som er disciplinen hvor DNA benyttes i en retlig sammenhæng (fx straffe-, faderskabs- og familiesammenføringssager), rapporteres beviset typisk i form af et likelihood ratio, dvs. man evaluerer hvor sandsynligt bevismaterialet (her DNA profilen) er under to stridende hypoteser. Lad E være bevismaterialet (E for evidence, mens H_A er hypotesen at DNA profilen stammer fra Afrika, mens H_E er hypotesen at profilen stammer fra Europa. I forhold til at vurdere om bevismaterialet taler for et europæisk ophav frem for et afrikansk, kan vi bestemme likelihood ratioet, LR_{EA},
LR_{EA} = \dfrac{P(E \mid H_E)}{P(E \mid H_A)},
hvor P(E \mid H_E) er sandsynligheden for E hvis H_E er sand, og tilsvarende for P(E \mid H_A) hvis H_A er sand. Typisk estimeres disse sandsynligheder ud fra en stikprøve fra hhv.\ de europæiske og afrikanske populationer. Hvis vores estimater gav LR = 10^4 = 10000 betyder det at det er titusind gange mere sandsynligt at se profilen i den europæsiske population frem for den afrikanske.

Problemet vi har fokuseret på i vores forskning (link til artikel i Theoretical Population Biology) er hvorledes man håndterer situationen hvor en konkret DNA profil stammer fra en subpopulation hvor fra vi endnu ikke har en stikprøve af DNA profiler. Fx hvis profilen E stammer fra Grønland, men hvor vi kun har data fra Afrika og Europa. Hvad ville det give af information at vide en given profil er titusind gange mere sandsynlig i Europa end i Afrika når begge hændelser er ekstremt usandsynlige? I dette tilfælde, lad os antage at profilens hyppighed i Grønland er P(E\mid H_G) = 10^{-2} = 0.01 mens i Europa P(E\mid H_E = 10^{-100} og Afrika er P(E\mid H_A = 10^{-104} (således at $LR_{EA} = 10^{4}$). Idet vi konkret ikke kender til den Grønlandske hyppighed (vi antager at vi ikke har en stikprøve derfra) kan vi ikke bestemme hyppigheden relativt i forhold til den grønlandske.

At den relative hyppighed er stor betyder ikke nødvendigvis at DNA profilen stammer fra populationen med den største profil-sandsynlighed. Vores løsning var at fokusere på hvornår er en profil for sjælden i en given population? I statistiske termer kan dette oversættes til: er profilen en outlier i den givne population? Denne tilgang gør det muligt at konkludere at der ikke findes en relevant population i det tilgængelige reference materiale. Fx hvis en given profil bliver erklæret outlier i samtlige tilgængelige populationer konkluderes det at profilen stammer fra en endnu ikke undersøgt population (eller evt. har et mere kompliceret genetisk ophav – fx med forældre med vidt forskellige genogenetiske baggrund).

På kortet nedenfor ses lokationen for de populationer som er inkluderet i reference materialet. Farven af hvert punkt angiver om profilen er blevet erklæret som outlier (blå) eller ej (rød). Profilen er i dette tilfælde fra Grønland og konklusionen er derfor korrekt.

Lokation af populationerne. Farven indikerer beslutning omkring outlier (blå) eller ej (rød)

I plottet herunder vises profil hyppighederne for de forskellige populationer. Igen er det tydeligt at profilen er hyppigst forekommende i Grønland, P(E\mid H_G) = 10^{-37} hvor de nærmeste populationer har hyppigheder omkring 10^{-46} - 10^{-50}. Altså er profilen omkring 10^{10} mere sandsynlig i Grønland i forhold til disse populationer.

Genotype sandsynligheder af den grønlandske profil. Punkterne er estimatet og linjer angiver usikkerheder.

Summen af de reciprokke primtal er uendelig.

Hilberts hotel, som tidligere flygtigt er blevet nævnt på denne blog, er en pædagogisk model til illustrering af begrebet uendelighed. Hotellet har (tælleligt) uendeligt mange værelser og kan derfor rumme (tælleligt) uendeligt mange gæster. Normalt, når man diskuterer Hilberts hotel, bekymrer man sig om, hvordan man får plads til flere gæster, hvis alle værelser er optagede. En anden bekymring kunne gå på, hvordan man dog får bespist alle disse gæster.

Her er en mulig løsning: Lav en kæmpe grydefuld suppe. Gæsterne kan nu efter tur tage suppe, dog må de højst tage halvdelen af grydens indhold. På den måde er der suppe til alle, omend første gæst nok får mere suppe end gæst nummer én milliard. Hvis vi i det følgende regner i enheden grydefuld suppe, så kan første gæst højst få 1/2, hvorefter gæst nummer to højst kan tage 1/4, gæst nummer tre højst 1/8 osv. Tager første gæst 1/2, er der 1/2 tilbage, tager anden gæst 1/4, er der 1/4 tilbage osv., så der efter den n’te gæst, som tager \frac{1}{2^n}, er \frac{1}{2^n} tilbage, og der vil således ikke være noget tilbage, når alle gæster har taget. Lægger vi disse tal sammen, får vi altså hele grydens indhold:

1=\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{16}+\frac{1}{32}+\dotsb
eller, som den velopdragne matematiker ville skrive:

\displaystyle \sum_{n=1}^\infty\frac{1}{2^n}=1
Vi kan altså lægge uendeligt mange tal sammen og få noget endeligt. Det er klart, at dette kun kan lade sig gøre, fordi leddene i summen bliver mindre og mindre jo længere ud i summen, vi når. Det er dog ikke et tilstrækkeligt krav på leddene, hvis vi ønsker at en sum skal være endelig, som følgende eksempel illustrerer.

Antag, at første gæst har én kubikmeter bagage med, den næste en halv kubikmeter bagage, den tredje en tredjedel kubikmeter bagage og så fremdeles, således at den n’te gæst har \frac{1}{n} kubikmeter bagage. Kan alle gæsternes bagage være i ét (endeligt) stort rum? Vi kan begynde med at se lidt på, hvor meget plads de første 2N gæsters bagage fylder, hvor N er et eller andet (stort) tal. Kald det samlede antal kubikmeter for S_{2N}, så har vi at:

\displaystyle \begin{array}{rl}\displaystyle S_{2N}\!\!\!&=1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}+\frac{1}{5}+\frac{1}{6}+\dotsb+\frac{1}{2N-1}+\frac{1}{2N}\\&=\frac{1}{2}+(\frac{1}{2}+\frac{1}{2})+(\frac{1}{3}+\frac{1}{4})+(\frac{1}{5}+\frac{1}{6})+\dotsb+(\frac{1}{2N-1}+\frac{1}{2N})\end{array}
Bemærk, at \frac{1}{2n-1}+\frac{1}{2n}>\frac{1}{2n}+\frac{1}{2n}=\frac{1}{n}, for n=1, 2, 3, \dotsc. Vi får derfor følgende vurdering.

\displaystyle \begin{array}{rl}S_{2N}\!\!\!&=\frac{1}{2}+(\frac{1}{2}+\frac{1}{2})+(\frac{1}{3}+\frac{1}{4})+(\frac{1}{5}+\frac{1}{6})+\dotsb+(\frac{1}{2N-1}+\frac{1}{2N})\\&>\frac{1}{2}+\frac{1}{1}+\frac{1}{2}+\frac{1}{3}+\dotsb+\frac{1}{N}=\frac{1}{2}+S_N,\end{array}
hvor S_N er det samlede antal kubikmeter for de første N gæsters bagage. Vi har nu vist at

S_{2N} >\frac{1}{2}+S_N,

og kan konkludere, at al bagagen ikke kan være på endeligt megen plads: hver gang, vi fordobler antallet af gæster, vi tager bagagen fra, får vi brug for mere end en halv kubikmeter mere plads! Har vi 100 kubikmeter, løber vi altså helt sikkert tør for plads efter 200 fordoblinger af antallet af gæster, og har vi K kubikmeter, løber vi tør efter 2K fordoblinger. Den førnævnte velopdragne matematiker ville skrive

\displaystyle \sum_{n=1}^\infty\frac{1}{n}=\infty,
til trods for, at \frac{1}{n} også går mod 0, når n går mod \infty. Grunden til at \sum_{n=1}^\infty\frac{1}{2^n} er endelig mens \sum_{n=1}^\infty\frac{1}{n} er uendelig, er kort fortalt at \frac{1}{2^n} går meget hurtigt mod 0 mens \frac{1}{n} går noget langsommere mod 0, når n går mod \infty. Tilsvarende: 2^n går hurtigere mod \infty end n går mod \infty, når n går mod \infty.

Som Lisbeth har nævnt i et tidligere blogindlæg, så har vi siden Euklid vidst, at der findes uendeligt mange primtal. Ser vi på de første tal i følgerne af tal på formen n og 2^n samt følgen af primtal,

\begin{array}{ll}&1, 2, 3, 4, 5, 6, 7, 8, 9, 10, \dotsc\\&2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, \dotsc\\&2, 3, 5, 7, 11, 13, 17, 19, 23, 29,\dotsc\end{array}
er det klart, at primtalsfølgen vokser noget hurtigere end følgen af naturlige tal, men også at den (i hvert fald i begyndelsen?) vokser meget langsommere end følgen af toerpotenser. Man kunne derfor spørge sig selv om, om summen \sum_{i=1}^\infty\frac{1}{p_i}, hvor p_i betegner det i’te primtal, er endelig eller ej? Vi vil i det følgende give et bevis for, at det sidste er tilfældet. Beviset er ret kort, hvis ellers man vil acceptere et par relativt simple resultater som bruges undervejs.

Først bemærker vi, at ethvert naturligt tal n kan skrives entydigt på formen

n=p_1^{m_1}p_2^{m_2}\dotsb p_n^{m_n},

hvor p_i er det i’te primtal og m_i er en potens mellem 0 og n, hvor vi husker, at p^0=1 uanset p (i hvertfald så længe p\ne0). Produktet kunne også skrives n=\prod_{i=1}^n p_i^{m_i}, hvor produkttegnet \prod defineres ved \prod_{i=1}^nq_i=q_1 q_2\dotsb q_n. Vi illustrerer med de første fire naturlige tal:

\begin{array}{rl}1&=2^0\\2&=2^1\cdot 3^0\\3&=2^0\cdot 3^1\cdot 5^0\\4&=2^2\cdot 3^0\cdot 5^0\cdot 7^0,\end{array}
osv. Betragt nu udtrykket

\displaystyle \prod_{i=1}^N\sum_{j=0}^N p_i^j=(p_1^0+p_1^1+p_1^2+\dotsb+p_1^N)(p_2^0+p_2^1+\dotsb+p_2^N)\dotsb(p_N^0+p_N^1+\dotsb+p_N^N).
Dette viser sig at være summen af alle tal på formen p_1^{m_1}p_2^{m_2}\dotsb p_N^{m_N}, hvor m_i er et tal mellem 0 og N, begge inkl. (over vej dette!). Dette udtryk er altså større end summen \sum_{n=1}^N n, som blot er summen af alle tal mellem 1 og N (hvor leddene altså blot er nogle af tallene på formen p_1^{m_1}p_2^{m_2}\dotsb p_N^{m_N}). Præcis samme argument giver os, at

\displaystyle\sum_{n=1}^N\frac{1}{n}\le \prod_{i=1}^N\sum_{j=0}^N \frac{1}{p_i^j}
Ovenfor så vi, at hvis vi “lader N gå mod \infty” i \sum_{j=1}^N \frac{1}{2^j}, så får vi 1, eller:

\displaystyle \sum_{j=0}^\infty \frac{1}{2^j}=2=\frac{1}{1-\frac{1}{2}}.
(Husk, at 2^0=1, så summen giver 1+1=2, hvis vi tager j=0 med også). Man kan vise, at der generelt gælder, at

\displaystyle \sum_{j=0}^\infty \frac{1}{p^j}=\frac{1}{1-\frac{1}{p}},
hvis ellers p>1. En sådan sum kaldes en geometrisk række og behandles bl.a. i dette indlæg. Prøv evt. selv at overveje tilfældet p=3, hvor der er \frac{1}{1-\frac{1}{3}}-1=\frac{1}{2} gryde suppe, og første gæst tager 1/3 gryde, dvs. 2/3 af grydens indhold, hvorefter der er \frac{1}{2}-\frac{1}{3}=\frac{1}{6} tilbage, næste gæst tager 2/3 af grydens indhold, dvs. \frac{2}{3}\cdot\frac{1}{6}=\frac{1}{9}=\frac{1}{3^2} osv. (Generelt kan man betragte en gryde, som til at begynde med er \frac{1}{1-\frac{1}{p}}-1 fyldt og hvor hver gæst tager 1-\frac{1}{p} af, hvad der er tilbage: det svarer til, at første gæst tager \frac{1}{p} grydefuld, anden gæst tager \frac{1}{p^2} osv. og efter uendeligt mange gæster er der intet tilbage). Vi ser nu, at

\displaystyle \sum_{n=1}^N\frac{1}{n}\le \prod_{i=1}^N\sum_{j=0}^N \frac{1}{p_i^j}\le\prod_{i=1}^N\sum_{j=0}^\infty \frac{1}{p_i^j}=\prod_{i=1}^N \frac{1}{1-\frac{1}{p_i}}.
Vi bemærker nu, at hvis p\ge 2, så er \frac{1}{1-\frac{1}{p}}<e^{\frac{2}{p}} (prøv evt. selv at bevise dette eller nøjes med at konstatere det på en grafisk lommeregner), og da alle primtal netop er større eller lig 2, så fås:

\displaystyle \sum_{n=1}^N\frac{1}{n}\le\prod_{i=1}^N \frac{1}{1-\frac{1}{p_i}}<\prod_{i=1}^N e^{\frac{2}{p_i}}=e^{2\sum_{i=1}^N\frac{1}{p_i}},
hvor vi gjorde brug af potensregnereglen e^ae^b=e^{a+b}. Vi er nu ved vejs ende: Venstre side går mod \infty når N går mod \infty, højre side er e opløftet i 2 gange summen af de første N reciprokke primtal. Altså må summen af de reciprokke primtal også gå mod uendelig (tag evt. logaritmen på begge sider af ulighedstegnet og dividér med 2, hvis du ikke er overbevist — logaritmen er en voksende funktion, så uligheden bevares!).

Genetisk landkort – lineær algebra, statistik og forundringsparathed

Dette landkort viser ikke det, du tror (clickbait… )

Fra artiklen

Genes mirror geography within Europe
John Novembre, Toby Johnson, Katarzyna Bryc, Zoltán Kutalik, Adam R. Boyko, Adam Auton, Amit Indap, Karen S. King, Sven Bergmann, Matthew R. Nelson, Matthew Stephens & Carlos D. Bustamante
Nature 456, 98-101(6 November 2008)
doi:10.1038/nature07331

Overordnet viser kortet følgende: Afstand mellem genetisk information fra to personer – en del af DNA – er i en vis forstand den samme, som geografisk afstand mellem de to personers oprindelsessted.

Mere præcist er det lavet ved Principal Component Analysis (PCA) – så lad os se på det først.

Principal Component Analysis:

Mange har set “bedste rette linje” i gymnasierne og PCA er noget lignende, men alligevel ikke helt.

(Fra Wikipedia CC-by-4.0 )

Figuren viser datapunkter i planen, altså data med 2 koordinater. De to akser midt i billedet er fundet med PCA: Origo er i midtpunktet for data, den længste akse er den retning, hvor der er mest variation. Det giver et nyt koordinatsystem. Man mister, som man kan se, ikke meget information ved kun at kende koordinaterne langs den akse, der går langs den længste af de to vektorer, altså projicere vinkelret ind på den linje. Og det er pointen i PCA: Fra en sky af højdimensionalt data – mange koordinater – finder man de retninger, der bedst forklarer variationen i data. Er man heldig, m.a.o., er der passende struktur i data, skal der ikke så mange af de nye koordinater til.

Landkortet kommer fra 1000 personer, datapunkter. Man kender 200.000 genetiske markører. Der er altså som udgangspunkt 200.000 koordinater(!) og PCA har reduceret til 2 koordinater. Akserne er tegnet ind som PC1 og PC2.

Hvordan finder man så disse akser i dette nye koordinatsystem? Og hvordan ved man, hvilke koordinater, der er mest betydende? Til det bruger man lineær algebra. Konkret gør man som følger – med et eksempel:

Opstil data i en matrix:

X=\left( \begin{array}{ccccccc}2&2&3&4&1&-3&-9\\3&1&3&3&4&-7&-7\\4&1&4&4&-1&-7&-5\end{array}\right)    Jeg har 7 punkter med hver 3 koordinater; hver søjle er koordinaterne for et punkt. Jeg har valgt dem, så middelværdien af hver af koordinaterne er 0. Er den ikke det, skal man trække middelværdien fra. Så nu er Origo, (0,0,0),  midt i min datasky. I eksemplet med DNA har de en 200.000 x 1000 matrix.

Fra matricen X udregnes først XX^T, covariansmatricen. Det giver en 3×3 matrix

XX^T=\left( \begin{array}{ccc} 124&117&103\\117&142&117\\103&117&124\end{array}\right)

Kender man ikke matrix produkt, så tænk på det som en organiseret opstilling af alle de skalarprodukter, man kan lave med de tre rækker i X.

Det er et centralt resultat i lineær algebra, at der til sådan en symmetrisk matrix (der står det samme over og under diagonalen) hører tre egenvektorer og det viser sig at være de vektorer, vi leder efter til PCA. Her er det (sådan cirka)

 

v_1= \left( \begin{array}{c} 1\\1,097\\1 \end{array}\right), v_2= \left(\begin{array}{c}-1\\0\\1\end{array}\right), v_3=\left(\begin{array}{c}1\\-1,823\\1\end{array}\right)

Det er egenvektorer for XX^T. De tilhørende egenværdier er (igen sådan cirka – I kan selv regne dem præcist ud, hvis I synes, det er vigtigt). 350, 21, 14. Den første værdi er, som man kan se, langt større end de andre. Altså X X^Tv_1=350 v_1

Det betyder, at langt det meste af variationen i data sker i retning langs v_1. Man mister ikke megen information ved kun at se på datapunkternes projektion ind på den retning.

Her er PCA Explained Visually  Man kan lege med data i 2 og 3 dimensioner og der er et eksempel på, hvordan madvaner og geografi hænger sammen (i Storbritannien).

Landkortet laves som følger:

  1. Find en 200.000×200.000 matrix udfra den oprindelige 200.000 x1.000 matrix.
  2. Udregn egenværdier og egenvektorer for denne.
  3. Se på størrelsen af egenværdierne. Her er to af dem betydeligt større end de andre.
  4. De to tilhørende egenvektorer PC1 og PC2 giver en plan i det 200.000 dimensionale rum. Landkortet viser projektionen af de 1000 datapunkter ind på denne plan. Man har derefter farvet datapunkterne efter personernes oprindelsesland. Og drejet det lidt, så det ligner et sædvanligt landkorts nord-syd og øst-vest orientering. De store farvede cirkler er middelværdier. Eksempelvis er den turkise, der står DK i, middelværdi for alle datapunkter fra Danmark.

Det illustrerer, at afstanden mellem de genetiske markører i meget høj grad kan forklares med geografisk afstand. Bemærk, at den Iberiske halvø (Spanien og Portugal) ligger lidt upræcist. Det skyldes, at afstanden ikke måles direkte på en globus. Det er en rejseruteafstand – den genetiske afstand  afhænger af, hvor langt man tidligere typisk har rejst for at finde sin partner. De lille kort viser, at man i Schweiz har fundet partner blandt dem, der talte samme sprog.

Man kan også undersøge forholdet mellem geografiske og genetiske afstande på andre måder. Mikkel (fra vores eget institut) har undersøgt noget tilsvarende for Y-kromosomer (som kun mænd har), dog ikke vha. PCA men vha. en såkaldt modelbaseret klyngeanalyse. Her ses resultatet:

Underskriftsindsamling i Storbritannien imod matematisk umulige fodbolde

I Storbritannien har de overtrådt en af matematikkens love (se nedenfor, hvilken overtrædelse, det drejer sig om), da de tegnede fodbolde på vejskiltene:

Terrible signage (photo: The Independent)

Det har fået Matt Parker, til at lave en underskriftsindsamling mod dette uvæsen. Matt Parker er “Stand up Matematiker” og mener det nok på den ene side ikke så alvorligt og på den anden side er det en mulighed for at få matematik på dagsordenen, som netop Matt nok ikke vil overse.

Problemet med de fodbolde er, at de er dækket af et mønster af sekskanter. Her går jeg ud fra, at skiltemaleren tænker sig mønsteret fortsætte på hele fodbolden. Man kan ikke sætte sekskanter sammen, så de dækker en fodbold. En traditionel fodbold har en blanding af sekskanter og femkanter.

Hvor ved vi så det fra? Svar: Det siger Euler.

Eulerkarakteristik

En polygon har lige mange hjørner og kanter:

PolygonUnfilled

En polygon er (i denne sammenhæng) en cirkel, som er knækket og rettet ud, så der bliver et antal linjestykker (kanter) og knækpunkter (hjørner). Hvis man bliver mere liberal i sin definition gælder ovenstående muligvis ikke – og det kan være sværere at definere, hvad kanter og hjørner er.

Et polyeder får man ved at opdele kuglefladen i trekanter, firkanter, femkanter,….  – kald dem sider efter følgende regler:

  1. To sider kan mødes i et hjørne, en fælles kant eller slet ikke
  2. En side skal være det, der ligger indenfor en polygon – som ovenfor.

Eulers polyederformel siger om sådan et polyeder:

Antal sider – Antal kanter + Antal hjørner =2.

Traditionelt skriver vi F-E+V=2.

F for “faces”, E for “edges”, V for “vertices”.

Man får 2, uanset, hvordan vi har delt kuglefladen op efter opskriften ovenfor.

Symmetric view of associahedron

Tilbage til den britiske afstemning og vejskiltene:

Hvordan ved vi, man ikke kan sy en fodbold af sekskantede stykker? (Hvor man overholder ovenstående princip om at mødes langs enten kant, hjørne eller ikke mødes. Man kan naturligvis godt sy to sekskanter sammen til en besynderlig fodbold. ) Lad os antage, at vi har syet sådan en fodbold.

  • Alle kanter deles af præcis to af stykkerne og der er 6F kanter, inden vi syr sammen. Heraf: E=\frac{6F}{2}=3F
  • Ved hvert hjørne er det mindst tre stykker, der mødes (Er der kun to, vil de dele mere end én kant.) Der er 6F hjørner, inden vi syr sammen.
    Heraf: V \leq \frac{6F}{3} =2F

(tænk over det. )

Nu regner vi – sætter ligning og ulighed ind:

F-E+V=F-3F+V \leq F-3F+2F=0 men vi ved jo F-E+V=2, så den går ikke.

Hvor mange femkanter skal man bruge sammen med sekskanterne?

Hvis vi laver fodbold med F_5 femkanter og F_6 sekskanter, og forlanger, præcis 3 skal mødes i hvert hjørne, så får vi ved ræsonnementet ovenfor

F_5+F_6 - \frac{5 F_5+6 F_6}{2}+\frac{5 F_5+6F_6}{3}=2

Flyt lidt rundt og få  F_5-\frac{5 F_5}{2} +\frac{5F_5}{3} +F_6 - \frac{6 F_6}{2}+\frac{6F_6}{3}=2

Leddene med F_6 går ud. Tilbage står, at der skal være præcis 12 femkanter. Uanset antallet af sekskanter. Jeg ved ikke, hvor mange sekskanter, man kan have. 0 er ok – det giver et dodekaeder. 20 er også ok – det giver en sædvanlig fodbold.

 

Sekskanter og baderinge:

Hvis man ikke syr fodbolde men baderinge, kan man godt lave dem af sekskantede stykker:

Hvis vi dækker en torus (en badering) med stykker som ovenfor og tæller F, E, V, så får vi F-E+V=0. Eulerkarakteristikken af en torus er 0. Nu kan vi ikke afvise, at vi kan dække med sekskanter – kravet var jo F-E+V \leq F-3F+2F=0. M.a.o. skal vi sy en torus af sekskanter, så skal de mødes præcis tre i hvert hjørne.

Regulære polyedere:

går vi tilbage til opdeling af kuglefladen ved vi, den ikke kan dækkes af sekskanter. Lad os sige, vi vil dække med n-kanter (vi ved ikke, hvad n er, men det skal holdes fast.) Og at der skal være tre, der mødes ved hvert hjørne. Så siger Euler

F-\frac{nF}{2}+\frac{nF}{3}=2 Reducer og få 2=F(1-\frac{n}{2}+\frac{n}{3})=F(1-\frac{n}{6})

F er positivt og 2=F(1-\frac{n}{6}). Altså er 1-\frac{n}{6} > 0 , så n kan være 1,2,3,4,5, men det er antal sider i en polygon, så 1,2 duer ikke. man kan altså kun bygge regulære polyedere med trekanter, firkanter og femkanter.

Kig lidt nærmere på det (eksempelvis skal der \frac{nF}{2} og \frac{nF}{3} være hele tal, da de er antal hhv. kanter og hjørner) og (gen)find de fem regulære polyedere:

Billedresultat for regulært polyeder

Mere luft under vingerne:

Eulerkarakteristik har mange anvendelser, kan generaliseres til højere dimensioner, kan sige noget om datamængder og meget mere. Lidt mere tilgængeligt. Hvor mange kan man  sætte sammen med de 12 femkanter, hvis man vil lave en ny slags fodbold med femkanter og sekskanter?

 

 

 

 

 

Matematisk tidsfordriv.

Det britiske Open University har i samarbejde med UK Mathematics Trust lanceret Perplex. Det er en app (du kan finde den til både Android og iPhone)  og et website, hvor man kan spille “matematiske” spil eller måske nærmere løse opgaver, som har en underliggende matematisk forklaring.

Jeg har ikke leget så meget med det – lige nu er der ikke særlig mange opgaver og legepladser i det, men det kommer jo nok. Det går, så vidt jeg kan se, ud på at løse opgaverne i færrest mulig “træk” – så får man stjerner og kan gå videre til næste (type) opgave.

Lærer man mon matematik af at lege med den slags opgaver? Njah, måske. Det kommer nok an på, om man tænker over, hvad man gør. At lave en strategi for at bruge færre “træk” kan der være meget matematik i. Der er i hvert fald en del strategisk “hvis … så” i det. Desuden er der en forklaring på matematikken bag de forskellige spil. Fire-farveproblemet, latinske kvadrater, talteori, Goldbach formodningen,…

Der er mange andre spil med logisk/matematisk tilsnit både online, brætspil etc.

Her er et par sites:

Angela und Otto Janko  har en stribe “logikrätzel” , “zahlenrätzel” – Sudokuagtige puslerier – og andre, som kan løses interaktivt. Sitet er primært på tysk, men det er nu ikke svært at forstå.

MathIsFun har også puzzles and games.

ThinkFun  har lagt en del af deres spil ud i en online version.

Der er masser af matematik om det at spille spil:

  • er der en vindende strategi? En algoritme/opskrift, som altid vil føre til, at den, der starter (og bruger strategien) vinder.
  • vil der altid være en vinder?
  • slutter det altid? Og hvor lang tid tager det højst/mindst?
  • etc.

Det er et enormt emne – der er skrevet bøger om det. Men jeg skal ikke rode mig ud i mere. I skal sikkert videre med et spil RushHour, en Rubiksterning, Hanois tårne, et spil Set, Ricochet Robots … Dem er der allesammen matematik i. Men det er der også i skak, dam, mølle, kryds og bolle,….

Studieretningsprojekter og det, der ligner.

Lige nu er der tryk på gymnasierne – reformen skal sættes igang for 1g’erne og 3g’erne skal vælge emner og fag til studieretningsprojekter, SRP. Her på bloggen kan vi muligvis give indspark til SRP ved at give en oversigt over, hvad vi har haft blogindlæg om.

Disclaimer: Husk først at tale med gymnasiets lærere om de vilde forslag, du måske kan finde her. Vi er ikke gymnasielærere og kender ikke dine præcise forudsætninger. Og måske ved vi heller ikke helt så klart, hvad der kræves i et SRP.

Her er en oversigt over indlæggene (jeg har udeladt dem, der ikke er matematik i):

 

Sker der noget nyt i matematik? om de mange, mange nye artikler (100.000 om året) og resultater, der kommer i matematik.

Fra fladt papir til krumme flader. Om matematikken bag, hvordan grafén kan komme til at krumme.

Hvad er det næste tal? Om følger af hele tal, som de eksempelvis optræder i IQ-tests og om Neil Sloanes oversigt over rigtig mange af den slags følger. Og hvorfor det kan være nyttigt for anden end IQ-test.

Smilehuller og rynker – golfbolde og fingeraftryk Et nyt resultat om, hvordan lagdelte stoffer danner mønstre på overfladen. Matematikken er krumning og geometri.

Gæt næste tal i rækken Næste tal i rækken kan være hvad som helst. Men kan altid finde et system, der begrunder, at næste tal er det, man nu vil have, det skal være.

Studiepraktik. Kom og besøg os. Studiepraktik i 2015. Det gør vi igen i 2016. Der kom senere et indlæg om, hvad der var foregået. 

Krumning – indre og ydre Om den matematiske måde at tale om krumning på.

Verdens Statistikdag 20/10 2015 var Verdens Statistikdag ifølge FN. Der er rigtig gode grunde til at sætte fokus på at have gode data. Og altså hylde statistikken.

Findes der matematiske genier? Matematikere får ikke ideer ved at ligge på stranden og være geniale. Der er masser af hårdt arbejde involveret. Læs også, hvad Terence Tao har sagt om netop det.

Idag er det Booles fødselsdag. Hurra hurra… Om Boole og hans bidrag til matematik, elektronik, datalogi,…

Et nyt resultat om kompleksitet(?)- rygters bureau. Det forlød, at et nyt resultat om kompleksitet af grafisomorfiproblemet ville blive præsenteret – og rygtet talte sandt,. på bloggen skrev vi om, hvad det gik ud på.

abc-formodningen. Nej, det er ikke noget med alfabetet. En matematisk formodning, som påstås bevist i en række artikler, som der er meget få, der mener, de forstår. Men på bloggen kastede vi os ud i en forklaring af, hvad formodningen siger. Det er ikke helt så svært.

Mod det uendelige univers. Uendelighed har vi under en form for kontrol i matematik. Vi har definitioner, så vi ved, hvad vi taler om. Det forklarer vi i dette indlæg.

Hvor ved vi fra, at logaritmefunktionen går mod uendelig? Titlen siger vist, hvad dette handler om…

Epsilons hemmelighed. En julekalender, som ikke er der. Bloggen havde ikke en julekalender, men der er links til andre matematikblogs, som har julekalender.

Komplekse tal og flotte mønstre. Matematik kan bruges til at lave flotte mønstre. Her er det med udgangspunkt i de komplekse tal. Nærmere bestemt Gaussiske primtal – se mere i indlægget.

Nyt år i matematik I anledning af nytår kom et indlæg om anvendt matematik og forbindelserne til og fra matematik, som endnu ikke bruges i andre fagområder. Med udgangspunkt i en artikel skrevet af Ingrid Daubechies.

Matematikfilm fra gamle dage. Amerikanske film om matematik. Fra 60’erne.

Hvordan man kommer til kort. Om matematikken bag landkort – fra den runde jord til flade kort.

Cantormængden. De reelle tal er så sære, at man bliver helt svimmel. Cantormængden er et af mange eksempler på dette.

Meget store primtal. Der blev fundet endnu et meget stort primtal. Indlægget handler om primtal og hvorvidt det er interessant, at der er endnu et meget stort et. (Hint: det er det sådan set ikke).

Cantormængder – på den fede måde. Andre sære delmængder af de reelle tal – her “fede Cantormængder”.

Mød AAUs matematikere – nogen af dem. Henvisning til foredrag for gymnasieelever og andre matematikinteresserede i Ungdommens Naturvidenskabelige Forening.

For få kvinder på Læsø? Det gav store overskrifter, at “kvinderne forlader udkantsdanmark”. Her forklarer vi, hvordan man analyserer den slags tal. Om data kunne være udtryk for noget tilfældigt eller det ser ud til at være noget andet.

Når livet er lineært. er titlen på en bog. Indlægget drejer sig om at bruge smarte metoder fra lineær algebra til billedbehandling.

Når livet er lineært II Mere fra samme bog. Her om matricer og grafer (netværk).

Kan man skrive en børnebog om Fermats sidste sætning? Ja. det kan man. Indlægget forklarer noget om Fermats sidste sætning og om den danske børnebog, der handler om en del af beviset.

Turingprisen til Diffie og Hellman. Turingprisen blev givet for Kryptering med offentlig nøgle. Indlægget forklarer, hvad det går ud på og hvad Diffie og Hellman har lavet.

Hvorfor er der kvaternioner i mit computerspil? Kvaternioner bruges til at beskrive rotationer. Vi fortæller, hvordan det hænger sammen. Og hvad kvaternionerne er.

Idag er det Einsteins fødselsdag. Hurra, hurra, hurra (og det er Pi-dag). Om tallet pi og hvorfor det dukker op så mange steder.

Abelprisen 2016 gik til Andrew Wiles.

Steffen Lauritzens tiltrædelsesforelæsning. Steffen tiltrådte som adjungeret professor. Indlægget handler om grafiske modeller, som Steffen har være primus motor i at udvikle.

Keplerproblemet er løst i dimension 8 og 24 Keplerproblemet drejer sig om kuglepakninger. Man kan pakke kugler i højere dimensioner. Og man kan spørge,hvor tæt de kan ligge. Det er nu besvaret i dimension 1,2,3, 8 og 24. Vi forklarer, hvordan det mon kan være, at det netop er de dimensioner.

Symmetri og kvasisymmetri. Friser, fliser, tapeter og krystaller. Symmetri har en helt bestemt betydning i matematik. Vi forklarer om, hvordan man “regner” med symmetri. Og om fliselægninger, der ikke har symmetri, selvom der bruges de samme fem fliser hele tiden.

Om ligningen på vores Flyt Verden sider. På AAUs “Flyt Verden” sider bruger vi ligningen e^{i\pi}+1=0. Her forklarer vi, hvad den betyder.

Lidt mere om symmetri og det, der ligner. Mønstre, der ser regulære ud, men ikke passer helt ind i beskrivelsen af symmetri, er måske dele af symmetri i højere dimension. Den indsigt – om kvasikrystaller – gav Nobelprisen. Vi forklarer noget af dette.

Matematik og vira. En meget ny anvendelse af symmetri er på virus og deres muligheder for at udvikle sig. Det fortæller vi om her.

Olympisk matematik. Mest om orden. Rangordning af lande efter OL-medaljer er en funktion fra medaljer til de naturlige tal. Der er mange måder at gøre det på. Bør funktionen også afhænge af befolkningens størrelse, af BNP, af …

Andre gode blogs. Jo, de findes. Henvisning til andre (fortrinsvis engelsksprogede) blogs og websites om matematik.

Hvordan kan man regne på/med information, man ikke kan se? Når flere firmaer eller personer vil udføre en beregning, sammenligning, auktion, afstemning… hvor deres “private” data indgår og andre ikke må få adgang til det, så har man brug for kryptografi. Secure multiparty computation er denne branche. Matematikken forklares her.

Den matematiske version af hønen og ægget. Hvad kom først, sinus, cosinus og \pi eller koordinatsystemet? Fra abstrakt analyse til linje, plan, vinkel. Herunder et argument for, at \pi er irrationalt og hvordan man kan finde så mange decimaler, man vil, hvis man kan differentier den inverse funktion til tangensfunktionen.

Sofa-konstanten og Euler-mursten. Nogle uløste matematiske problemer, som kan forstås. Hvor stor en sofa kan man skubbe gennem en gang, der knækker? Og findes der kasser hvis længde, bredde, højde, diagonaler på sidefladerne og hoveddiagonal allesammen er hele tal?

Retfærdighed og kager. Om at dele noget – kager, landområder,… så det er retfærdigt, eller alle bliver så tilfredse som muligt. Man skal først beslutte, hvad man mener med retfærdigt – der er flere muligheder. Misundelsesfrit er en mulighed. Vi forklarer de forskellige muligheder og en algoritme, som er helt ny, som laver en misundelsesfri opdeling i mange stykker af typen “du deler, din søster vælger først”. (OBS: Det er ikke bare lige store stykker. Måske kan du bedst lide flødeskum og din søster kan bedst lide chokolade.)

Collatzformodningen. Et uløst problem, som bl.a. bruges til at teste computere. Begynd med et tal. Hvis det er lige, så del med 2. Hvis det er ulige, så gang med 3 og læg 1 til. Gør det igen. Formodningen er, at du ender med at få 1.

Problemet med lykkelig slutning. Endnu et uløst problem. Din værste fjende har tegnet nogle punkter i planen – der må ikke ligge tre eller flere på linje. Hvor mange skal der være for at du altid kan vælge 4 af dem ud og forbinde dem til en konveks firkant (en, der buler udad). Svar: 5. Skal man lave en 6-kant er svaret 17. For en 7-kant (eller n-kant med n >6) ved vi det ikke.

Uafhængighed og noget om plat og krone. Slå et antal gange med en mønt. Er hændelsen “Der optræder både plat og krone undervejs” uafhængig af hændelsen “Plat optræder højst en gang” uafhængige? Man skal have defineret uafhængighed – derefter viser det sig, at de to hændelser er uafhængige, hvis man slår præcis tre gange, hverken flere eller færre.

Julenørderier. Matematisk julepynt… Bl.a. et Sierpinski-juletræ og en Møbiusjulekugle…

Helfgott finder fejl i Babais artikel om Grafisomorfiproblemet. Tidligere har vi skrevet om et nyt resultat om kompleksitet. Nu viser det sig at være forkert… måske.

AAU-matematikere går til filmen. Der er nu fire halvtimesfilm i serien 10 danske matematikere. AAU har leveret en om kodningsteori og en om geometri/topologi/dimension.

Grafisomorfialgoritmen er nu rettet. Der var en fejl, men den kunne rettes.

Rumudfyldende kurver – med anvendelser! Man kan lave en kontinuert kurver, som går igennem alle punkter i planen. Det er matematisk en vildt fascinerende opdagelse. Og det gav Cantor og andre sjælelige problemer… Og nu anvendes det til at arrangere højeredimensionalt data på en linje.

April i matematikkens og statistikkens tegn. Diverse henvisninger til materiale fra den amerikanske Mathematics Awareness Month, som i 2017 var om statistik. Også nogle videoer…

Polymath- matematik i fællesskab, online åbent for alle. Et nyt projekt under Polymath er Rotaformodningen, som vi forklarer her. Det handler om basis for vektorrum.

I morgen er det Einsteins fødselsdag. Og pi-dag. Mest om nogle opgaver, som har noget med \pi at gøre.

Abelprisen går til Yves Meyer. Om wavelets og Abelprisvinderens rolle i det område.

Den Gaussiske KorrelationsUlighed. Et bevis, der blev gemt og glemt. Har man data med to koordinater – højde, vægt eksempelvis – kan man tale om sandsynligheden for at punkter ligger i et område i planen. Her drejer det sig om et rektangel omkring punktet (gennemsnitshøjde, gennemsnitsvægt). Og sammenhængen med intervaller omkring hhv. gennemsnitshøjde og gennemsnitsvægt. Det forklarer vi bedre i blogindlægget…

Vores matematiske hjerne. Et link til en kronik, jeg skrev engang. Om at tænke på og med matematik.

Flyt Verden med Eulers formel. Om eksponentialfunktioner, sinus og cosinus, komplekse tal. Også noget om, at der er flere måder at indføre eksponentialfunktionen – matematik kan ses fra mange sider.

Fugle i flok, cellulære automater og emergens. Om simple regler, som giver anledning til komplekse mønstre og opførsel. Med udgangspunkt i en ny togstation i Campbridge.

Linjerede flader – struktur og design – og matematik. Man kan bygge smukt krummede flader ved brug af linjer. Hyperboloider og hyperbolske paraboloider. Vi giver matematik og billeder af bygninger.

Hvor mange forskellige trekanter findes der? Der er uendelig mange. Vi kvalificerer spørgsmålet og svarer i en vis forstand med en ny trekant. Det er matematikken kerneopgaver – klassifikation, præcisering af  spørgsmål, abstraktion… og jeg har ikke læst det andre steder.

Sandbunker – matematik, fysik og flotte billeder. Igen noget med simple lokale regler, som giver interessant global opførsel. Der er forbindelser til differentialligninger i fysik og igen smukke billeder.

 

 

Sandbunker – matematik, fysik, kombinatorik og flotte billeder.

I 1987 fandt fysikerne Bak, Tang og Wiesenfeld på “sandbunker” en model for “self organized criticality”. Det vil jeg ikke vove mig ud i at forklare i detaljer, men det svarer til en slags faseovergang, som vi kender det fra materialer, der går fra fast til flydende til dampform. Det selvorganiserede indikerer, at systemet kommer i en særlig fase uden man behøver at påvirke det med eksempelvis varme. Sandbunker er en slags generalisering af  cellulære automater, som vi har set på tidligere. Celulære automater kan give komplicerede mønstre, men det kræver lidt arbejde og sker bestemt ikke altid. Sandbunker gør det af sig selv. Det er aktuel forskning, der er forbindelser til mange områder, både i teoretisk fysik og i kontrol af robotter.

Her er et billede af sådan en sandbunke – fra Sandpile Galleries på Carnegie Mellon 

Andre havde opdaget sandbunkerne fra et kombinatorisk synspunkt – uden fysik. På billedet er farverne antal sandkorn i en pixel Blå = 0, lyseblå =1, gul=2, rødbrun=3.

Lidt at fundere over. Der er ret skarpe grænser mellem farverne. Nærmest fraktalagtigt.  Zoom ind på midten og se en blomsteragtig struktur

 

 

 

Zoom ind på randen og se spidser og bratte overgange – et randfænomen.

 

Man laver en sandbunke efter følgende regel: Opdel planen i felter, ovenfor er det

Hæld sand ud over – fordelt på hver pixel. Begynd nu en proces, hvor stablerne vælter efter en fast regel:

For eksempel:

Hvis der er mere end 4 sandkorn på felt (x,y), så fjern de fire og læg en på hver af (x+1,y), (x-1,y), (x,y+1), (x,y-1). Bliv ved med det. Billedet ovenfor er lavet ved at starte med 2^{30} sandkorn i origo og lade dem vælte ud. Nedenfor er man startet med 2^{16} sandkorn. Og nedenunder det har jeg zoomet ind på det med 2^{30}.

 


Zoom ind på det første billede:


Nogle grundlæggende egenskaber ved sandbunker:

  1. Det er lige meget, hvilket felt man “vælter” først. Resultatet bliver det samme efterhånden. Man siger, sandbunker er Abelske. OBS: For cellulære automater skal man udføre et “move” på alle pixels på en gang.
  2. Det stabiliserer. Uanset starten vil der efterhånden ikke være mere at vælte.

Mere generelt kan man erstatte opdelingen af planen i et gitter med en graf, hvor der er regler for, hvordan sand fordeles ud fra hjørnerne. eller man kan lave et andet gitter i planen.

Man kan lade området være begrænset, så sandet vælter ud over kanten, hvis det når en randpixel. Gør man det, vil sandbunken ende med i gennemsnit 2,125 sandkorn pr. pixel. Begynder man med at have 3 på hver pixel, vil det naturligvis forblive sådan. Men dropper man et enkelt sandkorn et sted, vil det starte en serie af laviner, som ender med ca. 2,125 korn pr. pixel. (Det har jeg læst i Nautilus)

Videoen viser et 255×255 grid, som har indstillet sig i ligevægt med 2,125 korn pr pixel. Man tilføjer et enkelt sandkorn (af gangen, I presume)  i midten og et smukt system af laviner udfolder sig. Farverne fortæller, hvor mange gange sandet i den den pixel “er væltet”.

David Perkinson og Brian Head har lavet software, hvor man kan lege med sandbunker.

 

 

Rotorregler – mobile overvågningsrobotter.

En anden type sandbunkeregler er rotorregler, som man eksempelvis bruger til at studere mobile overvågningsenheder. Hver pixel sender sandkorn (robotter) i retninger, som skifter cyklisk –  eksempelvis nord, øst, syd, vest. Hvis alle skifter i takt og starter mod nord kan man studere et sandkorn, der starter i Origo. Det gennemgår (0,0), (0,1), (1,1), (1,0), (0,0). Med aggregerede rotorregler stopper sandkornet, når det kommer til en fri pixel. Sandkorn nummer 1 vil stoppe i (0,0). Sandkorn 2 begynder, når pilene peger mod øst, så det stopper i (1,0) Sandkorn 3 sendes til (0,-1). De pixels, der er besat efter 3 skridt er altså \{ (0,0), (1,0), (0,-1) \}. Billedet nedenfor viser de pixels, der er besat efter 2^16 sandkorn er myldret ud fra Origo. Farverne er den retning, den pågældende pixel pegede, da den blev “besat”. Man må nok forestille sig, at de mobile enheder kigger i den retning. Billedet er fra artiklen Laplacian Growth, Sandpiles and Scaling limits.Lionel Levine og Yuval Perez, Bulletin of the AMS, Juli 2017.. Der kan man finde mange matematiske spørgsmål om sandbunker, både løste og uløste.

 

 

 

Studiepraktik – Besøg Institut for Matematiske Fag 25-26-27 oktober 2017

Kom og besøg os. Gymnasieelever er inviteret til tre dages besøg på Aalborg Universitet.

Vi har tre matematikuddannelser

  1. Matematik (som også omfatter statistik.)
  2. Matematik-Økonomi.
  3. Matematik-Teknologi.

Du kan få et indtryk af alle tre uddannelser plus lære noget matematik. Du møder nogen måske kommende medstuderende og hører om

Differensligninger ved Jakob Gulddahl Rasmussen

Signalbehandling med lineære filtre ved Zeineb Al-Jawahri 

Endelige legemer: Fejlkorrigerende koder og morgendagens kryptografi, ved René Bødker Christensen

Differensligninger og regression med økonomiske anvendelser, v/Esben Høg

Symmetri. I matematik, fysik, biologi og rundt omkring os v/ Lisbeth Fajstrup

Du får en introduktion til uddannelserne:

Karrieremuligheder og studievalg ved Morten Grud Rasmussen.

Og så er der mad, der er “after study”, fælles for alle, der er på studiepraktik og genrelt mulighed for at opleve både AAU og Aalborg. Læs mere på Studiepraktiksiderne for Matematikuddannelserne.

(Lige nu henvises til  programmet for 2016, men det bliver opdateret meget snart.)

 

Hvor mange forskellige trekanter findes der?

Dumt spørgsmål. Der er (mindst) to problemer: Hvad betyder forskellige? Og næsten uanset, hvad det betyder, så er der nok uendelig mange. Hvilket igen kan betyde flere ting, for vi har forskellige slags uendelig….

Det er typisk i matematik: Spørgsmålene skal justeres, før vi kan få et meningsfuldt svar.

I løbet af sommeren har der været forskelige “svar” på lignende spørgsmål: Hvor mange billardborde findes der med visse egenskaber (sætter man en kugle til at rulle, vil den enten i det lange løb komme vilkårligt tæt på alle punkter på billardbordet eller gentage den samme bane igen og igen) – se Quanta Magazine .

Hvis en femkant skal kunne bruges som eneste flise i en fliselægning, som dækker hele planen, hvad kan man så sige om den femkant? Svar: Der er 15 forskellige muligheder.

Tilbage til trekanterne. I skolen er to trekanter ens, hvis de er kongruente. To figurer er kongruente, hvis man kan få den ene til at ligge præcis oveni den anden ved at parallelforskyde og dreje  – og sommetider tillader man også spejling.

Paralleforskydning, drejning og spejling bevarer vinkler, længder og arealer, så vi har følgende

  1. Hvis to trekanter er kongruente, så er deres vinkler parvis ens.
  2. Hvis to trekanter er kongruente, så er deres sidelængder parvis ens.
  3. Hvis to trekanter er kongruente, så har de samme areal.

I geometri i gymnasiet eller grundskolen har de fleste set eksempler på argumenter “den anden vej”:

  • Hvis to trekanter har parvis ens sidelængder, så er de kongruente.
  • Hvis en vinkel og de to hosliggende sider er lige store, er de kongruente.
  • Hvis en side og de to hosliggende vinkler er lige store, er de kongruente.

Illustrationen er fra Wikipedia:

Lad os stille spørgsmålet igen: Hvor mange forskellige trekanter er der, når kongruente trekanter anses for ens?

Igen er svaret uendelig mange, men der er et bedre svar, nemlig en klassifikation. Ovenfor genkaldte vi resultatet fra gymnasiet: Hvis to trekanter har parvis ens sidelængde, så er de kongruente.

M er mængden af alle trekanter. Den opdeler vi  i kongruensklasser – en kongruensklasse K er en delmængde af M, hvori alle trekanter er kongruente og sådan at trekanter udenfor K ikke er kongruente med trekanter i K. Det giver en opdeling af M i delmængder, som ikke har noget fælles med hinanden – disjunkte delmængder. (Man kan vise, kongruens er en ækvivalensrelation og udlede det derfra. ) Notationen [T] står for den kongruensklasse, som indeholder trekanten T, altså alle de trekanter, som er kongruente med T.

Definer en funktion F:M -> \mathbb{R}^3  ved F(T)= (a,b,c), hvor a,b,c er sidelængderne for T og a\leq b\leq c.

Et par observationer:

F(T_1)=F(T_2) hvis og kun hvis T_1 er kongruent med T_2. Så vi kan definere

G: {kongruensklasser af trekanter } -> \mathbb{R}^3  ved G([T])=F(T).

Vi ville gerne kunne sige: Der findes præcis en kongruensklasse for enhver vektor (x,y,z)\in \mathbb{R}^3 med 0 <x\leq y \leq z – det ville give en klassifikation; en direkte oversættelse fra trekanter til bestemte vektorer i rummet og tilbage igen. Altså en invers til funktionen G.

Men det er helt sikkert forkert: (1,2,4) er ikke sidelængderne i en trekant. – Den sidste sidelængde er “for lang”.  Det er ikke alle sådanne (x,y,z), som er i billedmængden for F.

Trekantsuligheder

I en trekant opfylder sidelængderne (a,b,c) følgende uligheder:

  1. a+b > c.
  2. b +c > a.
  3. a+c > b.

Når vi navngiver, så a\leq b \leq c, er ligning 2 allerede opfyldt. Ligning 3 kan udledes:
c+a\geq b+a >b, så nu er spørgsmålet:

Kan vi altid  finde en trekant med sidelængder (a,b,c), hvis bare (a,b,c) opfylder 0<a\leq b \leq c og a+b > c?

Det kan vi. Det kan man f.eks. se som følger:

Cirklen med centrum i (0,0) og radius a skærer cirklen med centrum i (c,0) med radius b i et punkt P, som ikke ligger på x-aksen. trekanten med hjørner (0,0), (c,0) og P har sidelængder som ønsket. Punktet P=(x,y) kan findes som skæringspunkt mellem de to cirkler, altså som løsning til et ligningssystem:

Ligningen for cirkel 1 x^2+y^2=b^2 og for cirkel 2 (x-c)^2+y^2=a^2. Det giver

x=\frac{b^2+c^2-a^2}{2c} og y=\pm\sqrt{b^2-\frac{(b^2+c^2-a^2)^2}{4c^2}}. Der er to muligheder – cirklerne skærer hinanden ovenfor og nedenfor linjestykket (0,0) – (c,0).

Eller man kan bruge, at cirkler er kontinuerte kurver og se, at de passerer x-aksen i hhv. -b, b og c-a og c+a. Da c-a < b må de to kurver skære hinanden for at nå til yderpunkterne (-b,0) og (c+a,0).

Konklusion:

Der findes præcis en kongruensklasse af trekanter for hvert  (a,b,c)\in \mathbb{R}^3, som opfylder  0<a\leq b \leq c og a+b > c.

Det er et klassifikationsresultat. Det udnytter, at sidelængder er invariante under de flytninger, vi tillader i kongruensrelationen. Og omvendt, at trekanter med samme sidelængder er kongruente. Desuden skulle vi have skåret billedmængden for F til. Her kan vi endda konstruere en trekant med de givne sidelængder. Det kan man ikke altid i klassifikationsresultater – ofte ved man blot, der findes en.

Andre spørgsmål, man kan stille er.

  • Hvis afstanden fra (a,b,c) til (x,y,z) er lille, kan man så sige noget om afstanden mellem de tilsvarende kongruensklasser af trekanter? (Ja, hvis man definerer afstand mellem trekanter passende.)
  • Hvad kan man sige om 4-kanter?
  • Hvis trekanter er ens, når de er similære (den ene er kongruent til en skalering af den anden), kan man så klassificere dem? (Ja. Skaler, så den længste side er 1 – det må man godt, da similær=ens. der er nu en similaritetsklasse for hvert par (a,b) med 0<a\leq b\leq 1 og a+b\geq 1. Den mængde kan I tegne i planen. Det bliver en trekant med hjørner (0,1), (1,1) og (1/2,1/2). )
  • og meget mere….

Klassifikation er en matematisk grunddisciplin a la biologernes kortlægning af dyr og planter. Det er nysgerrighedsdrevet, men ofte også meget praktisk anvendeligt. Klassifikation af krystalstrukturer er matematik, men grundlæggende for kemi.