Den matematiske version af Hønen og Ægget.

Horia har heldigvis skrevet til bloggen igen:

Den matematiske version af Hvem kom først, hønen eller ægget? 

Når man  første gang lærer om funktioner og deres grafer, er et koordinatsystem den første ting man tegner. Vi vælger et origo, vi tegner x-aksen, og bagefter y-aksen. Men hvor ved vi  fra, at “den rigtige” y-akse skal stå vinkelret pa x-aksen? Hvorfor skal der
være 90^{\circ} mellem de to linjer? Og hvad har det med \pi/2 at gøre?
Jeg skal nu prøve at overbevise jer om, at tallet \pi samt  sinus og cosinus
funktionerne kom før koordinatsystemet. Med andre ord, kan den abstrakte matematisk
analyse bruges til at give en præcis mening til begreber som ret linje, plan, vinkel, osv.

Det Euklidiske rum.

Vi starter med at organisere planen  \mathbb{R}^2 som et vektorrum hvor hvert punkt r er entydigt beskrevet af to reelle koordinater x og y, eller r = [x; y]. Rummet \mathbb{R}^2 er samtidig et Hilbertrum genereret af det euklidiske indre produkt, og det gør i sidste ende, at afstanden mellem to punkter r = [x; y] og r’ = [x’; y’] er givet ved Pythagoras’ formel:

|\mathbf{r}-\mathbf{r}'|=\sqrt{(x-x')^2+(y-y')^2}.
Hvis vi har en kurve i planen defineret ved r(t) = [x(t); y(t)] hvor både x(t) og y(t) er
differentiable funktioner, så definerer vi buelængden mellem punkterne   r(t_0) og  r(t_1)  som:

L(t_1,t_0):=\int_{t_0}^{t_1} \sqrt{(x'(t))^2+(y'(t))^2}dt
Tag nu et stykke papir frem og vælg et vilkårligt punkt O. Papiret modellerer \mathbb{R}^2 mens O svarer til punktet [0; 0]. Vælg nu et andet vilkårligt punkt P \neq O pa papiret og kald det [1; 0].

På denne måde bestemmer vi også hvad det betyder at have “længde en” i vores model.
x-aksen bliver nu den rette linje som forbinder O med P. Set som et underrum af
dimension 1, består vores x-akse af alle punkterne af typen [t; 0] hvor t\in\mathbb{R}. Vi er nu klar til at gå i gang med at finde punktet med koordinater [0; 1] og derefter at tegne y-aksen.

Cosinus og sinus.

Betragt systemet af differentialligninger f'(t) = -g(t) og g'(t) = f(t), hvor f(0) = 1
og g(0) = 0. Den generelle teori omkring førsteordens lineære differentialligninger med
en global Lipschitz betingelse garanterer, at der findes en entydig global løsning til vores
ligningsystem.

Lad os nu udlede nogle vigtige egenskaber ved f og g.
1. Funktionen h(t) = f^2(t) + g^2(t) må være konstant, fordi h'(t) = 0 for alle t, og derfor har vi, at h(t) = f^2(t) + g^2(t) =h(0) = 1 for alle t. Vi konkluderer, at billedmængden af kurven r(t) = [f(t); g(t)] er en delmængde af enhedscirklen.

2.  Nu viser vi, at f og g er periodiske. Vi ved, at -1\leq f(t)\leq 1 og -1\leq g(t)\leq 1. Når t bliver kun lidt større end 0, er f(t) stadigvæk tæt på 1, derfor positiv. Ligningen g'(t)=f(t) medfører til, at g vokser og bliver større end nul. Samtidig har vi fra f'(t)=-g(t)<0, at f er aftagende og bliver mindre. Det må derfor eksistere et t_1>0 sådan at f(t_1)=0 og g(t_1)=1.

Når t er lidt større end t_1, bliver f negativ og aftagende mod -1 mens g forbliver positiv men aftager mod 0. Det må eksistere et t_2>t_1 sådan at f(t_2)=-1 og g(t_2)=0.

Når t er lidt større end t_2 bliver g negativ og aftagende mod -1 mens f er negativ og voksende mod 0. Det må eksistere et t_3>t_2 sådan at f(t_3)=0 og g(t_3)=-1.

Endelig, når t er lidt større end t_3, er g negativ og voksende mod 0 mens f er positiv og voksende mod 1. Det må eksistere et T>t_3 sådan at f(T)=1 og g(T)=0.

En vigtig konsekvens er, at funktionerne \tilde{f}(t):=f(t+T) og \tilde{g}(t):=g(t+T) løser det samme system som f og g, og har de samme begyndelsesværdier. Løsnings entydighed medfører derfor til, at f(t)=f(t+T) og g(t)=g(t+T). Det beviser, at f og g er periodiske og tallet T er den mindste (positive) periode. Fra nu af, ændrer vi f‘s navn til \cos, g‘s navn til \sin, og skriver 2\pi i stedet for T.

3. Definer u(t):=\cos^2(t/2)-\sin^2(t/2) og v(t):=2\cos(t/2)\sin(t/2). Vi har, at u'=-v og v'=u samt med u(0)=1 og v(0)=0. Løsningens entydighed medfører igen at u(t)=\cos(t) og v(t)=\sin(t). Med andre ord:

\cos(t)=\cos^2(t/2)-\sin^2(t/2),\quad \sin(t)=2\cos(t/2)\sin(t/2).

4. Vi skal nu vise, at t_1=\pi/2, t_2=\pi og t_3=3\pi/2. Husk, at t_1 er det mindste positive tal hvor \cos(t_1)=0 og \sin(t_1)=1, t_2 er det mindste positivt tal hvor \cos(t_2)=-1 og \sin(t_2)=0, mens t_3 er det mindste positivt tal hvor \cos(t_3)=0 og \sin(t_3)=-1. Perioden T=2\pi er det mindste positivt tal hvor \cos(T)=1 og \sin(T)=0.

Hvis vi indsætter t=2\pi i ligningen ovenfor, har vi at:

0=\sin(2\pi)=2 \cos(\pi) \sin(\pi),\quad 1=\cos(2\pi)=\cos^2(\pi)-\sin^2(\pi).

Den første ligning kræver, at enten \cos(\pi) eller \sin(\pi) må være nul. Hvis vi kobler det med den anden ligning, konkluderer vi, at \sin(\pi)=0 og \cos(\pi)=\pm 1. Men \cos(\pi) kan ikke være lig med $+1$ fordi \pi<T=2\pi og T er det mindste positiv tal hvor systemet vender tilbage til begyndelsesværdien. Derfor er \cos(\pi)=-1 og \sin(\pi)=0, og ud fra definitionen af t_2 må vi have, at t_2=\pi.

Definer u(t):=-\cos(\pi-t) og v(t):=\sin(\pi-t). Vi ser, at u'=-v og v'=u samt med u(0)=1 og v(0)=0. Så har vi, at u(t)=\cos(t) og v(t)=\sin(t). Eller:

Ligning 3 \cos(t)=-\cos(\pi-t),\quad \sin(t)=\sin(\pi-t).

Indsæt t=\pi/2 i ligningen ovenfor. Det giver \cos(\pi/2)=-\cos(\pi/2), eller \cos(\pi/2)=0. Men det eneste punkt mellem 0 og t_2=\pi hvor cosinus kan være nul er t_1. Derfor har vi, at t_1=\pi/2, og \sin(\pi/2)=\sin(t_1)=1.

Vi skal vise nu, at t_3=3\pi/2. Definer u(t):=\cos(-t) og v(t):=-\sin(-t). Igen igen u'=-v, v'=u, u(0)=1 og v(0)=0. Så har vi, at:

Ligning 4 \cos(t)=\cos(-t),\quad \sin(t)=-\sin(-t).

Indsæt t=-\pi/2 i Ligning 3  og brug Ligning 4:

0=\cos(\pi/2)=\cos(-\pi/2)=-\cos(3\pi/2),\quad -1=-\sin(\pi/2)=\sin(-\pi/2)=\sin(3\pi/2).

 

Hvor stort er \pi?

Tangensfunktionen defineres som \tan(t)=\frac{\sin(t)}{\cos(t)} for -\pi/2<t<\pi/2. På det interval har vi, at \tan'(t)=\frac{1}{\cos^2(t)}>0, funktionen er bijektiv og billedmængden er \mathbb{R}. Dens inverse noteres med \arctan, er defineret på \mathbb{R} med værdier i (-\pi/2,\pi/2), og \arctan'(x)=\frac{1}{1+x^2}.

Indsæt t=\pi/2 i Ligning 2. Vi ser, at \sin(\pi/4)=\cos(\pi/4)=1/\sqrt{2} og  \tan(\pi/4)=1 og \arctan(1)=\pi/4. Derfor:

\pi= 4\int_0^1 \arctan'(x)dx=4 \int_0^1 \frac{1}{1+x^2}dx.

Taylors formel med restled medfører til:

1-y+\ldots -y^{2n+1} <\frac{1}{1+y}<1-y+\ldots +y^{2n},\quad n\geq 0,\quad y>0,

og hvis y=x^2:

1-x^2+\ldots -x^{4n+2}<\frac{1}{1+x^2}<1-x^2+\ldots +x^{4n}.

Efter integration mellem 0 og 1:

4\sum_{k=0}^{2n+1} \frac{(-1)^k}{2k+1} <\pi <4\sum_{k=0}^{2n} \frac{(-1)^k}{2k+1},\quad n\geq 0.

Det definerer en konvergent række, og ved hjælp af det kan vi komme arbitrært tæt på \pi. I hvert fald, er \pi mindre end 4. Rækken blev først fundet omkring 1400 tallet af den indiske matematiker Madhava fra Sangamagrama, og senere genfundet  af James Gregory i 1668.

Tegning af y-aksen.

Nu er vi næsten klar til at tegne vores y-akse. Betragt kurven \mathbf{r}(t)=[\cos(t),\sin(t)]. Vi har lige set, at når t varierer fra 0 til 2\pi, dækker vi hele enhedscirklen. Buelængden fra \mathbf{r}(0)=[1,0] til \mathbf{r}(\theta) hvor \theta \leq 2\pi er givet ved formlen 1. Her husker vi igen, at x'(t)=-y(t), y'(t)=x(t), x^2(t)+y^2(t)=1 og derfor (x'(t))^2+(y'(t))^2=1. Det giver:

L(0,\theta)=\theta,\quad L(0,\pi)=\pi.

Tag nu en passer og tegn cirklen med origo i O og som går gennem P=[1,0]. Cirklen krydser igen x-aksen i punktet \mathbf{r}(\pi)=[-1,0]. Tag et stykke snor af længde 4 og dæk den del af cirklen hvor y>0, og med et endepunkt i \mathbf{r}(0). Vi har vist, at \pi<4, så er snoren lang nok til at nå punktet \mathbf{r}(\pi). Klip snoren således at et af stykkerne dækker den øvre halvcirkel fra \mathbf{r}(0) til \mathbf{r}(\pi). Vi ved, at længden af stykket må være lig med \pi. Del snoren i to og sæt en halvdel af den tilbage på cirklen med et endepunkt i \mathbf{r}(0). Halvdelen er nu kun \pi/2 lang, så må det andet endepunkt ligge på  \mathbf{r}(\pi/2)=[0,1]. Tegn y-aksen og drik en stor, sort kaffe.

Tallet \pi er irrationalt.

Ja, det ved jeg godt. De moderne, pengefikserede tider vi lever i, er i mindre grad egnede til rene matematiske spørgsmål som irrationaliteten af et mærkeligt tal som \pi. Men alligevel: dem som har nået at læse hertil må have haft en ærlig interesse i matematik, derfor skal jeg bare fortsætte uanset hvad.

Jeg skal tage udgangspunkt i Ivan Nivens artikel “A simple proof that \pi is irrational”, Bull. Amer. Math. Soc. 53(6), 509 (1947). Vi skal vise, at \pi ikke kan skrives som en brøk a/b hvor a og b er begge heltal. Men lad os antage det modsætte; det vil sige, vi antager at \pi=a/b hvor a og b er heltal.

Vi definerer to polynomier:

p_n(x)=\frac{1}{n!}x^n(a-bx)^n,\quad P_n(x)=p_n(x)-p_n''(x)+\ldots+(-1)^n p_n^{(2n)}(x),\quad n\geq 1.

Lad os nu vise, at alle tal af typen p_n^{(j)}(0) er heltal. For eksempel, har vi at:

p_n'(x)=\frac{1}{n!}(nx^{n-1}(a-bx)^n-nbx^n(a-bx)^{n-1})=\frac{1}{(n-1)!}x^{n-1}(a-bx)^{n-1}(x-b(a-bx)).

Vi ser, at p_n'(0) er nul hvis n>1 og p'_1(0) = a hvis n=1. Hvis vi fortsætter med at differentiere, finder vi, at p_n^{(j)}(0) er altid nul hvis j<n, mens når j\geq n, er de eneste ikke nul bidrag fra de forskellige led  kun dem hvor vi har “differentieret væk” faktoren x^n. Det giver en n! som gør, at resultatet bliver et heltal.

Vi bemærker identiteten p_n(x)=p_n(a/b-x). Kædereglen siger, at p_n^{(j)}(a/b)=(-1)^jp_n^{(j)}(0), derfor er p_n^{(j)}(\pi) også heltal, for alle j\geq 1. En vigtig konsekvens er, at både P_n(0) og P_n(\pi) er heltal.

Ud fra definitionen af P_n(x) ser vi, at P_n''(x)+P_n(x)=p_n(x). Derfor:

(P_n'(x)\sin(x)-P_n(x)\cos(x))'= P_n''(x)\sin(x)+P_n(x)\sin(x)=p_n(x)\sin(x).

Analysens fundamentalsætning medfører til:

\int_0^\pi p_n(x)\sin(x)dx =P_n(\pi)+P_n(0),

hvor højresiden altid er et heltal, for alle n. Funktionen p_n(x)\sin(x) er altid positiv på intervallet (0,\pi), derfor er dens integral også positiv ved siden af at være et heltal. Vi må have:

1\leq \int_0^\pi p_n(x)\sin(x)dx, \quad {\rm for} \; {\rm all}\; n\geq 1.

På den anden side, er p_n(x)\sin(x)\leq \frac{ \pi^n a^n}{n!} når 0<x<\pi. Derfor,  1\leq \int_0^\pi p_n(x)\sin(x)dx\leq \frac{ \pi^{n+1} a^n}{n!}. Men højresiden går mod nul når n vokser, og her er vores modstrid.