Variační principy

Variační počet

Pierre-Louis Moreau de Maupertuis , 1698-1759, francouzský fyzik a teolog.

Konfigurace těles ve Sluneční soustavě (přinejmenším těch, které zde pobývají dostatečně dlouhou dobu) nejsou a nemohou být náhodné. Nabízí se vysvětlení, že se veškerý pohyb děje tak, aby byla určitá (sumární) charakteristika extrémní.

Podle de Maupertuise příroda realizuje určitý účel a chová se tak, že jisté kvantity minimalizuje (tj. šetří). Je zde tedy něco navíc oproti obvyklému příčinnému chápání věcí. Navrhl univerzální zákon přírody podle kterého se tělesa pohybují tak, že celková spotřeba jisté veličiny (tzv. "akce") je co nejmenší možná.

Tato myšlenka není nová - je základem variačního počtu, matematické disciplíny, která se používá k obecné formulaci fyzikálních úloh již od 17. století.
U zrodu variačního počtu stáli: ital Galileo Galilei (1564-1642) a francouz Pierre de Fermat (1601-1665).

Galileo Galilei

Galileo Galilei , 1564-1642, itaslský fyzik a astronom. Ukázal, že příčinou změny rychlosti je síla.

Galileo Galilei formuloval (r.1638) problém křivky nejrychlejšího pádu (tzv. brachistochrony). Dané dva body v gravitačním poli se mají spojit takovou křivkou, po které 'sklouzne' dolů hmotný bod v nejratším možném čase.

Fermat, Pierre de

Fermat, Pierre de [ferma], 1661-1665, francouzský matematik, "král amatérů", povoláním právník.

Podle Pierre de Fermat paprsek světla se šíří mezi dvěma body po takové cestě, kterou světlo urazí v nejkratším čase. Tento princip vysvětluje zákon odrazu i zákon lomu světla.

Bratři Bernoulliové

Bernoulli, Jacob [bernuli], 1654-1705, Bernoulli, Johann [bernuli], 1667-1748 švýcarští matematici. Výrazně přispěli k rozvoji variačního počtu.

Variační principy

Problém brachistochrony vyřešil (r.1696) Johann Bernoulli. Je také autorem obecné formulace principu virtuálních posunů. Spolu s bratrem Jacobem nastudovali Leibnitzův diferenciální počet a aplikovali jej na celou řadu fyzikálních problémů.

O dalším rozvoj se zasloužili Leonard Euler (1707-1783), D'Alembert, Jean-Baptiste Le Rond (1717-1783), Karl Friedrich Gauss (1777-1855), Pierre Simon Laplace (1749-1827), Ampere (1775-1836), Jacobi (1804-1851), J.A.Serret (1819-1885), M.V.Ostrogradský (1801-1861), Weierstrass (1815-1897), Ritz (1878-1909), ...

Lagrange, Josepf Louis

Lagrange, Josepf Louis, Comte [lagránž], 1736-1813, italsko-francouzský matematik a fyzik, známý svým přínosem k rozvoji mechaniky a astronomie.

Variační principy se dělí na diferenciální a integrální .

Mezi diferenciální patří princip virtuálních prací, D'Alembertův princip, Gaussův princip, Lagrangeovy rovnice 1. druhu,... Lagrange vyjádřil princip nejmenší akce ve tvaru integrálu, jenž musí mít minimum nebo maximum. Předvedl speciální řešení problému tří těles.

Hamilton W.Rowan , 1805-1865, matematik a fyzik. Povšiml si souvislosti mezi mechanikou a optikou, Vyšetřoval integrály jako funkce jejich mezí.

Integrální tvoří Maupertuis-Lagrangeův princip, Hamiltonův princip, Jakobiho princip...

Aplikace v astronomii

Poincaré, Jules Henri , 1854-1912, francouzský matematik, fyzik, astronom a filozof. Je považován za jednoho z posledních univerzálních matematiků. Ukázal (r.1895) existenci jistých extrémů v rezonančních gravitačních soustavách.

H.Poincaré zjistil, že rušící funkce v rezonančním gravitačním systému (průměrovaná s ohledem na kritický nebo rezonanční parametr) má lokální minimum.

Možnost postupného vzniku rezonančních konfigurací byla ukázána pomocí numerických integrací pohybu těles (Hills, 1970). K synchronizaci musí přitom podle některých analýz dojít i při působení velmi slabých sil mezi tělesy (A.M.Molčanov).

Michael William Ovenden

Michael William Ovenden , 1926-1987, kanadský astronom. Předložil domněnku, že asteroidy jsou části bývalé velké planety (zvané Azték). Rozpracoval princip minimální interakce na příkladě Jupiterových měsíců.

M.Ovenden, (?inspirován myšlenkami R.Basse z r.1958?), navrhl (před r.1972) funkci, jejíž extrém by se měl hledat - průměrnou potenciální energii. Tento tzv. Ovendenův princip minimální interakce se ale podařilo aplikovat jen na určité skupin těles (pro měsíce s Laplaceovou rezonancí,...).

Astronom A.E.Roy věnoval svoji knihu (Orbital motion, r.1973) právě M.Ovendenovi a stručný nástin principu minimální interakce do ní zařadil.
Caxton C.Foster (viz) se pokusil sestavit počítačový program, ověřující a demonstrující Ovendenův princip. V soustavě 3 těles postupně posouval dráhy, za dodržení zákona zachování energie a momentu hybnosti. Přitom hledal takové konfigurace, jejichž průměrná potenciální energie je minimální.

Mechanizmus ovlivňování

Zdá být zřejmé, že tělesa mají skutečně tendenci se vzájemně vyhýbat. Vcelku jasný je i mechanismus, který tuto tendenci působí: V okamžiku konjunkcí jsou tělesa - v důsledku zachování momentu hybnosti - podle okolností urychlována nebo bržděna, aby pak další konjunkce proběhla již v jiném místě dráhy.

Oproti tomu ale nevíme, do jakých konfigurací (v případě více těles,..) vývoj vede, v jakých musí skončit, existují-li konečné konfigurace vždy apod.

Nevíme ani, jak přesně máme vzájemného působení těles chápat: Zatímco gravitační síly působí vždy na spojnicích zúčastněných těles, působí odpuzování v okamžiku konjunkcí spíše ve směru tečen k příslušným oběžným drahám. Takové odpudivé síly mohou docela jistě ovlivnit umístění (vzájemný fázový posun) těles na drahách s pevně danými charakteristikami.

Otázkou ale je, zda 'odpudivé síly' nemohou působit i změny samotných orbitálních charakteristik (vzdálenost od centra, excentricita, sklon, oběžná perioda). Tato otázka má zásadní význam. Z možnosti ovlivnění orbitálních charakteristik by např. mohlo plynout, že tzv. Titus-Bodeova řada, která ukazuje na přibližně exponenciální rozložení vzdáleností planet Sluneční soustavy, nemusí být náhodná.

Pokud bychom připustili, že odpudivé síly jsou reálné a působí na spojnicích těles, museli bychom je započítat do pohybových rovnic.

Např. Mějme 2 tělesa pohybující se okolo centra. Mezi tělesy působí nepřetržitě odpudivé síly I₀₁(t), I₀₂(t) a I₁₂(t) závislé na čase t. Pro jednoduchost odhlédněme od proměnlivosti těchto sil a nahraďme je jejich průměrnými hodnotami I₀₁, I₀₂ a I₁₂. Pro každou oběžnici napíšeme podmínku rovnováhy dostředivé (F_d) a odstředivé síly (F_o):

· F_d1-F_o1+I₁₂-I₀₁ =0

· F_d2-F_o2+I₁₂-I₀₂ =0

Oběžná rychlost tělesa (1) pak vyjde o něco větší a tělesa (2) o něco menší než v případě bez uvažování odpudivých sil.

Akční funkce

Funkci, jejíž (průměrná) hodnota má nabývat extrému, nazveme akční funkcí.

Example

Představme si, že jsme ve svém bytě a potřebujeme se dostat na nádraží na druhém konci města. Máme na výběr 4 možnosti:

    Cesta                     Hledisko      
    ------------------------------------------- 
    1/ Pěšky přes park      nejlevnější cesta
    2/ Autobusem            levná rychlá cesta
    3/ Taxikem              nejrychlejší cesta
    4/ Vrtulníkem           nejkratší cesta

Jakou cestu zvolíme záleží na hledisku, tj. na naší "akční funkci".

Ovendenův princip je založen na předpokladu, že akční funkcí je potenciální energie. Pokusme se ověřit i jiné možnosti, např. funkce, v nichž figurují mocniny vzdálenosti r_ij^k (k=2,3,1/2,...) nebo logaritmické funkce hmotností ln(m_i∙m_j) apod. Akční funkce (tj. obecně funkce f(m_i,m_j,r_ij))) značíme malým písmenem f().

Rozlišíme 3 varianty funkcí podle zacházení se vzdálenostmi:

· Funkce závislé na vzdálenosti (lineárně, kvadraticky, obecnou mocninou,..)
Jsou-li r1 a r₂ vzdálenosti oběžnic P₁ a P₂ od centra S a φ₁₂ jejich úhlová vzdálenost v daném okamžiku, je aktuální vzdálenost:
r₁₂ = r(1,2) = sqrt(r₁²+r₂²-2r₁r₂ cos φ₁₂) (tj. kosinová věta v trojúhelníku SP₁P₂)

· Funkce nezávislé na vzdálenosti ,
tj. funkce, jejichž hodnota se mění jen s úhlem φ₁₂=φ₁-φ₂, např. f() = m_i∙m_j/g(φ₁₂). V takovém případě ale musí funkce g() odstranit singularitu při konjunkci těles (tj. pro φ₁₂=0); např. g()=sin(φ₁₂/2),g()=1+cos(φ₁₂), apod.)

· Funkce deformující vzdálenosti (logaritmicky,...)
Povšimneme-li si rozvrstvení hmoty v prostoru mezi Sluncem a Jupiterem, získáme dojem, že má-li mít Slunce i Jupiter vliv nepřímo úměrný vzdálenosti, nelze nijak zdůvodnit, proč jsou planety Venuše a Země tak blízko Slunci. Zdá se, že akční funkce pro Slunce se nějak musí lišit od akční funkce pro Jupiter. Nebo musíme použít jiné předpoklady k měření vzdálenosti ve Sluneční soustavě: Kdybychom například všechny vzdálenosti od centra nahradili jejich logaritmy, dostali bychom Venuši i Zemi - v číselném světě logaritmů - blíže k Jupiteru.

Závislost na hmotnosti - Lineární, logaritmická ...

Centrální těleso

Jakkoli se může zdá interakce jen věcí oběžnic, bude zřejmě nutné (přinejmenším v určitých případech) počítat akční funkce i pro vztah mezi centrálním tělesem a oběžnicí. Opačný případ totiž může vést k výsledku, kdy jako optimální konfigurace n těles se ukáže taková, která má n-1 těles v těsné blízkosti centrálního tělesa. (V případě, že centrální těleso vynecháme z výpočtů, chybí totiž 'síla', která by tělesa donutila zdržovat se od centra dále...)

Integrály akční funkcí

Zajímá nás součet všech hodnot akčních funkcí během určitého intervalu. Integrály akční funkcí (tj. funkcionály) budeme značit velkým písmenem F(), průměrné hodnoty akčních funkcí označíme (). Průměrnou hodnotu ‹f›() akční funkce f() získáme dělením integrálu F() šířkou intervalu integrování w (zpravidla w=2π): ‹f›()= ∫ f()/w = F()/w

f	‹f›=(1/2π) ∫ f	Poznámka
1/r₁₂	ln((r₁+r₂)/\|r₂-r1\|)/2/min(r₁,r2)	‹r₁₂›=2r1/ln((r₁+r₂)/(r₂-r₁), pro r₁<r₂
1/r₁₂²	1/\|r₂²-r₁²\|	‹r₁₂²›=\|r₂²-r₁²\|

Náhrada za integrály

Integrací akčních funkcí můžeme dostat obecně velmi složité funkce. K dalším výpočtům budeme proto užívat i některých jednodušších funkcí F(), které sice nevznikly integrací, ale jsou v jistém smyslu analogické se složitějšími funkcemi. Tyto náhradní funkce musí být (stejně tak jako integrály) symetrické vzhledem k odpovídajícím si proměnným jednotlivých oběžnic.
Např. funkce F=1/|r₁^k-r₂ ^k | je symetrická vzhledem k r₁ a r₂, kεR.

Optimální konfigurace

Extrémy akčních integrálů

Předpokládejme soustavu n těles s centrem 0 a (n-1) oběžnicemi 1,2,..,n-1. Hledáme takové konfigurace těles, při kterých nabývá integrál akční funkce extrému. Podle hledaných parametrů určujících konfiguraci rozlišíme následující případy:

· Polohy na dráze
Jsou dány dráhy všech těles, ale polohy na dráze jen u jednoho nebo několika vybraných těles. Hledají se vhodné polohy (fázové posuny) těles ostatních.

· Vzdálenosti těles
Je dána dráha (vzdálenost od centra) jednoho nebo několika těles. Hledají se vhodné dráhy těles ostatních.

Při pohybu po eliptických drahách akční funkce kolísají v závislosti na aktuálních hodnotách r_ij. Místo hledání extrému průměrné akční funkce by pak mohlo dávat smysl např. hledat, za jakých okolností průměrná akční funkce nejméně kolísá.

Největší plocha

Vyřešíme nejprve jednodušší problém, který má povahu podobnou hledání poloh (fázových posunů) těles na dráze.
Budeme hledat pro jaký fázový posun φ je křivkami sin(x) a sin(x-φ) vymezena největší plocha (v intervalu 0-2π). Vertikální vzdálenost křivek je určena akční funkcí f(x,φ)=|sin(x)-sin(x-φ)|. Integrálem této funkce je plocha a my hledáme pro kterou hodnotu φ je hodnota integrálu extrémní.

Řešení: Nejprve najdeme souřadnice bodů P₁ a P₂ (jsou vždy nejvýše dva), kde se dané křivky protínají, tj. kde sin(x)=sin(x-φ). Řešením je: x=(φ+;π+2kπ)/2. Celkový obsah je součtem tří ploch, tj. tří integrálů akční funkce v intervalech (0,(φ+π)/2),((φ+π)/2,(φ+3π)/2) a (φ+3π)/2,2π).
Po integraci a úpravě dostaneme: F() = S₁+S₂+S₃ = 4∙[cos((φ-π)/2)-cos((φ+π)/2)]
Tato funkce nabývá extrému pro: dF()/dφ = 0, tj. pro sin((φ-π)/2)-sin((φ+π)/2) = 0.
Křivky vymezí extrémní plochu v případě φ=k∙π.

Zobecnění

V předchozím příkladu měly obě funkce stejnou periodu. Uvažujme nyní funkce sin(n₁.x) a sin(n₂.x-φ) (tj. funkce s periodami 2π/n₁ resp. 2π/n₂). Získáme tak (n₁+n₂) průsečíků členících celou plochu na (n₁+n2+1) částí. Souřadnice průsečíků: x=(φ+;π+2kπ)/(n₁+n₂).
Např. planety Jupiter a Saturn, n₁:n₂≈5:2, n₁+n₂ =7. Celý (synodický) cyklus (2π) trvá průměrně (J,S)=19.859 let. V případě φ=0 dostaneme následujících 7 bodů: π/7( 1.418 let), 3π/7( 4.255 let), 5π/7( 7.092 let), 7π/7( 9.930 let), 9π/7(12.766 let), 11π/7(15.603 let),13π/7(18.440 let)

(π/7 = 1.418 let = 517.93 dní činí přibližně 2 Mayské cykly tzolkin, tj 2∙260 dní).

Numerické integrování

Některé akční funkce je obtížné integrovat, nebo je integrál tak komplikovaný, že je těžké hledat jeho extrém. V takovém případě můžeme řešení odhadnout numericky (počítačovým programem).

Uvažujme např. 2 oběžnice pohybující se s oběžnými periodami T₁, T₂ po excentrických kružnicích se vzdáleností středů Dx₁₂ (Dy₁₂=0). Poloměry drah nechť ve vztahu k oběžným periodám respektují Keplerův 3.zákon, tj.: r³/T² = konst.

Pro daný počáteční fázový posun Fi₁₂ se počítá celková hodnota (integrál) sumF akční funkce f()=1/r₁₂ v průběhu časového intervalu Time.

Program

        #define cDIVISION 100
        #define c23 0.66666666667
        float numIntg(float aTime, float aT1, float aT2, float aFi12, float
        aDx12) {
           int i;
           float sumF=0;
           float r1 = pow(aT1,c23);   /* Kepler */
           float r2 = pow(aT2,c23);   /* Kepler */
           float limit = aTime*cDIVISION;
           for (i=0;i<limit;i++) {
           float t = (float)i/cDIVISION;
           float angle1 = 2*pi*(t/aT1);
           float angle2 = 2*pi*(t/aT2+aFi12);
           float
        f1x=r1*cos(angle1);  float
        f1y=r1*sin(angle1);
           float
        f2x=r2*cos(angle2)+aDx12;  float f2y=r2*sin(angle2);
           float dx12 =
        fabs(f2x-f1x);  float dy12 = fabs(f2y-f1y);
           float r12 =
        sqrt(dx12*dx12+dy12*dy12);
           if (r12!=0)
            
        sumF=sumF+(1.0/r12);
             }
             return F;
        }

Numerickou integraci provedeme opakovaně pro různé hodnoty počátečního fázového posunu φ₁₂ a vyhledáme pro které φ₁₂ nastává extrém.

Dvě tělesa okolo centra

Funkce typu 1/r₁₂^k

Nechť F() = 1/(r₂^k-r₁^k) +1/r₁^k + 1/r₂ ^k, r₁!= Z rovnice dF()/dr₁ = k.r₁^k-1/(r₂^k -r₁ ^k)²- k/r₁^k+1 =0, dostáváme r1=r₂/2^1/k.
Např. pro r₂=100:

k	1/2	1	3/2	2	3
r1	25.0	50.0	63.0	70.7	79.4

Funkce typu 1/r₁₂

Nechť F()=ln((r₁+r₂)/(r₁-r₂))/2/r₁ +1/r₁+ 1/r₂, r₁ Označme q=r₁/r₂. Pak (r₁+r₂)/(r₂-r₁)=(1+q)/(1-q) a ln((1+q)/(1-q))= 2 argtgh q.

Přepíšeme funkci na F()=(argtgh(r₁/r₂)+1)/r₁ + 1/r₂.

Z rovnice dF()/dr₁=0 plyne q/(1-q²)-argtgh(q)-1 = 0 (*).

Funkce argtgh(q)=q+q³/3+q⁵/5+...; v prvním přiblížení argtgh(q)=q a rovnice (*) přejde do tvaru q³+q²-1 = 0.

Numericky zjistíme, že funkce F() nabývá minima pro q≈0.7865; tj. pro r1=100 je r₂≈78.7.

Tři tělesa okolo centra

Funkce typu 1/r₁₂^k

Nechť F() = ∑∑ 1/(r_j ^k -r_i ^k) + ∑ 1/r_i^k, r₁<R₂. Numerické řešení, např. pro r₃=100:

k	1/2	1	2	3
r1	10	32	57	68
r2	46	68	83	88

Tyto hodnoty jsou bez ohledu na hmotnosti těles, tj. za předpokladu, že hmotnost centra je stejná jako hmotnost oběžnice.

Mějme nyní: F() = ∑∑ m_im_j/(r_j^k -r_i ^k) + ∑ m₀m_i/r_i^k. V případě m₀ = 10, m₁=m₂=m₃=1 dostáváme

K	½	1	2	3
R1	37	61	78	85
R2	69	83	91	94

Čím je větší hmotnost centra, tím jsou oběžnice tlačeny dále od centra, tj. jinými slovy, čím jsou oběžnice (relativně k centru) lehčí, tím se shlukují blíže k sobě.

Případ k=1

Nechť F() = 1/(r₂-r₁)+1/(r₃-r₂)+1/(r₃-r1)+1/r1+1/r₂+1/r₃, r1<r₂
Z rovnic
dF()/dr1 = 1/(r₂-r₁)²+1/(r₃-r₁)²-1/r₁² = 0, dF()/dr2 = -1/(r₂-r₁)²+1/(r₃-r₂) ²-1/r₂² = 0
plyne:
1/(r₃-r₁) ² + 1/(r₃-r₂)² = 1/r₁² + 1/r₂². Rovnici vyhovuje r₁+r₂ = r₃. Označme q=r₁/r₂. Odtud musí platit (1-q²)(1-q) ² = q², tj. q⁴-2q³+q²+2q-1=0.

Numericky dostáváme řešení q=0.47 (tj.32/68, viz předchozí tabulku).

Nyní rovnice ještě zjednodušíme.
Předpokládejme, že má platit: [dF()/dr₁ =] 1/(r₂-r₁)+1/(r₃-r₁)-1/r₁ = 0, [dF()/dr₂ =] -1/(r₂-r1)+1/(r₃-r₂)-1/r₂ = 0.
Odtud 1/(r₃-r₁) + 1/(r₃-r₂) = 1/r₁ + 1/r₂. Obdobně i zde rovnici vyhovuje r₁+r₂ = r3. Z první rovnice je 1/(r₂-r₁) = 1/r₁-1/r2, tj. r₁²-3r₁r₂+r₂². Při označení q=r₁/r₂: q²-3q+1=0. Odtud q=0.382 (=((√5-1)/2) ².

Znázornění rovnic

Uvedené rovnice připomínají v principu Kirchofovy zákony známé z elektřiny. Také k nim existuje jednoduché grafické znázornění. f(r1,r2)+f(r1,r3)-f(r1) = 0

          0           1               2            3
          *- f(r1)---→*←-- f(r1,r2) --* 
                      *←----------- f(r1,r3) ------+

f(r2,r3)-f(r1,r2)-f(r2)=0

          0            1              2             3
          *            *---f(r1,r2)--→*←--f(r2,r3)--* 
          *------------- f(r2)-------→*

Geometrický průměr period

Uvažujme funkci F() = ∑(m_i∙(x+r_i)/(x-r_i), i=1,2 a hledejme takové x=r₃, aby platilo dF()/dx= 0. Dostáváme rovnici m₁.r₁/(x²-r₁²) + m₂.r₂/(x²-r₂²) = 0.

Jejím řešením je:

x=r₃ = √(r₁r₂ (r₁m₂+r₂m1)/(r₁m1+r₂m₂)), speciálně pro m₁=m₂=1: x=r3 = √(r₁r₂).
Ve Sluneční soustavě najdeme např. tyto analogické vztahy:

· T(Europa)=3.5518 dní ≈ √(Tio∙Tganymed) = 3.5577 dní

· 4∙S = 117.83 let ≈ √(U∙N) = 117.67 let

· 4∙M_r = 234.6 dní ≈ √(V∙V_r) = 233.7 dní (≈ 2∙(V,E)/5 = 233.6 dní)

Variační principy

Variační počet

Aplikace v astronomii

Akční funkce

Centrální těleso

Integrály akční funkcí

Náhrada za integrály

Optimální konfigurace

Extrémy akčních integrálů

Numerické integrování

Dvě tělesa okolo centra

Funkce typu 1/r12k

Funkce typu 1/r12

Tři tělesa okolo centra

Funkce typu 1/r12k

Případ k=1

Funkce typu 1/r₁₂^k

Funkce typu 1/r₁₂

Funkce typu 1/r₁₂^k