Informație

Estimarea parametrilor din curba epidemiei: cum se procedează?


Încerc să construiesc un model de epidemie bazat pe modelul SIRD, dar trebuie să estimez parametrii pentru acest model (α = rata infecției, β = rata de recuperare și γ = rata mortalității).

Care este procedura de estimare a acestor parametri direct din datele epidemiei? De exemplu, am încercat să obțin γ din rata cumulativă a mortalității pentru COVID-19 în China; Am constatat că funcția Holling tip III (y = ax² / b²x²) arată mai mult ca datele:

Ca parametri de pornire, am folosit maximul curbei cumulative pentruAși un număr subiectiv pentrub.

Cum pot găsi cei mai buni parametri de potrivire pentru această funcție pe baza datelor? Există o procedură în R?

De asemenea: dacă această abordare este corectă, ar fi parametrulbcorespunde cuγ? Pot face același lucru pentruαșiβ?

Și: pot aplica acest tip de regresie pe datele brute în locul curbelor cumulative?

Mulțumesc


Explicarea modelelor de răspândire a epidemiei

Într-un eveniment ca o epidemie, factorii de decizie politică sunt dornici să știe cum se va răspândi boala. De exemplu, ar putea fi dornici să afle câte persoane sunt susceptibile să fie infectate în viitor. Acest lucru îi va ajuta să ia decizii și să aloce resurse pentru controlul bolilor, cum ar fi numărul de ICU-uri sau ventilatoare necesare într-o regiune. Acestea și alte câteva predicții privind răspândirea bolii sunt realizate folosind modele matematice de epidemiologie.

Modelele matematice ne ajută să ne facem modelele mentale mai cantitative. Modelele nu sunt realitate, însă studiile din științele naturale și fizice au arătat importanța modelelor în înțelegerea naturii. Spune, trebuie să trimitem o navă spațială pe Lună. Pentru a afla câtă viteză are nevoie o navă spațială pentru a scăpa de gravitația Pământului, nu am proiecta sute de nave spațiale și nu le vom lansa la viteze diferite pentru a vedea care ajunge la Lună, nu? În schimb, ne bazăm pe ecuații matematice care prezic clar viteza și toate celelalte caracteristici pe care ar trebui să le aibă o navă spațială pentru a ajunge pe Lună.

Acestea fiind spuse, modelele nu sunt întotdeauna reprezentări exacte și vin cu limitări. Pentru a extinde analogia navei spațiale concepute pentru a ajunge pe Lună, dacă ar ajunge la Jupiter, modelul nostru ar avea nevoie de câteva modificări pentru ao ajunge acolo. Este important să înțelegem ipotezele din spatele unui model și domeniul său de aplicare înainte de a-l utiliza pentru a face predicții și politici.

Modelele sunt folosite pentru a prezice viitorul sistemului în studiu. Și în cazul epidemiilor, avem nevoie de modelare matematică pentru a înțelege modul în care boala este cel mai probabil să se răspândească și unde este mai probabil să se răspândească. Poate fi privit ca o comandă rapidă, în loc să implementăm multe presupuneri despre cum să facem față răspândirii unei boli, putem vedea ce ar însemna punerea în aplicare a fiecăreia dintre aceste presupuneri, folosind câteva ecuații inteligente, și luăm decizii mai bine informate. Chiar în timp ce citiți acest lucru, modelarea matematică a fost în centrul mai multor decizii politice la nivel mondial în ceea ce privește răspunsul la CoVID-19.

Unele aspecte ale modelelor matematice

Deci, întrebarea este, cum sunt dezvoltate și utilizate modelele? De obicei, modelele sunt construite pe baza unor ipoteze rezonabile. De exemplu, pentru a construi un model pentru epidemii, trebuie să faceți câteva presupuneri cu privire la modul de răspândire a bolii. Rujeola sau Covid19 se răspândesc atunci când persoanele infectate intră în contact cu cele sănătoase. Pe de altă parte, malaria are nevoie atât de țânțari, cât și de oameni infectați. Un model pentru malarie ar trebui să ia în considerare atât populația de țânțari, cât și cea a oamenilor și ar diferi foarte mult de un model pentru rujeolă. Pentru a da un alt exemplu de ipoteză care intră în formularea modelului, s-ar putea postula o infectivitate dependentă de vârstă, adică că probabilitatea de a fi infectat la contact este dependentă de vârsta persoanei, persoanele în vârstă fiind mai susceptibile de a contracta infecția. . În mod similar, s-ar putea postula ceva despre recuperare (& # 8220 tinerii se recuperează mai repede & # 8221) sau reinfecție (& # 8220 o persoană care se recuperează este imună la reinfecție pentru o perioadă de doi ani & # 8221). Toate aceste ipoteze pot fi încorporate în mod explicit în modele. Aceste ipoteze se bazează pe biologia bolii, adică pe ceea ce știm despre agentul patogen și corpul uman. Sunt posibile mai multe modele diferite pentru aceeași boală, fiecare diferind prin detaliile mai fine pe care le încorporează printre ipotezele sale. Inutil să spun că modelele sunt la fel de bune ca și ipotezele pe care se bazează.

Toate modelele au parametri și numere # 8211 care pot fi reglate pentru a se potrivi contextului particular la care se aplică modelul. De exemplu, luați în considerare măsurile de control, cum ar fi distanțarea fizică. În condiții normale, oamenii tind să fie fizic aproape unul de celălalt, ceea ce duce la o probabilitate mai mare de a fi infectați la contact proximal. Când se impune distanțarea fizică, această probabilitate scade. Probabilitatea de infecție la contact este astfel un parametru atunci când este ales să fie mic, surprinde situația în care se aplică distanțarea fizică și, atunci când este ales mare, surprinde scenariul normal. În mod similar, datele demografice variază în funcție de țară, stat sau regiune. Dacă infectivitatea dependentă de vârstă face parte din ipoteza modelului nostru, am avea nevoie de parametri care să țină evidența proporției populației din fiecare grupă de vârstă. Acești parametri ar avea valori semnificativ diferite pentru India și SUA, de exemplu Populația indiană este predominant tânără, în timp ce cea a SUA este mai uniform răspândită de-a lungul vârstelor. Ratele de recuperare sau perioadele de imunitate sunt, de asemenea, parametri, care pot fi reglați diferit pentru a modela diferite boli. Astfel, alegerea corespunzătoare a parametrilor permite aplicarea aceluiași model de bază pentru diferite boli, țări sau regiuni diferite, în diferite scenarii de măsură de control etc.

Odată alese ipotezele și parametrii largi, modelul este notat în termeni de ecuații matematice. Acestea sunt de obicei ecuații diferențiale, care pot fi apoi rezolvate pe un computer pentru a obține cantitățile de interes (de exemplu, numărul de persoane infectate) în diferite momente de timp.

La început, nu putem fi siguri că am făcut alegeri bune de parametri. Dar o corectăm încet comparând predicțiile modelului cu datele reale (pe măsură ce devin disponibile) și reglând parametrii noștri astfel încât să existe o potrivire strânsă între acestea. De exemplu, dacă dorim să folosim un nou model pentru a prezice numărul de infecții cu CoVID-19 în Chennai în iunie 2020, îl validăm mai întâi folosind datele despre infecții până acum. Cu alte cuvinte, ne potrivim parametrii noștri astfel încât modelul nostru să poată explica numărul zilnic de infecții până astăzi (16 aprilie 2020). Odată validat modelul, acesta poate fi folosit pentru a prezice comportamentul viitor și pentru a sugera noi experimente pentru a studia populația. Pe măsură ce zilele trec și noi date devin disponibile, este posibil să se testeze predicțiile modelului. În unele cazuri, modelul este îmbunătățit / rafinat pe măsură ce mai multe date devin disponibile și ciclul continuă.

Modele SIR și SEIR de boli infecțioase

Modelele SIR sunt utilizate în mod obișnuit pentru a studia numărul de persoane care au o boală infecțioasă într-o populație. Modelul clasifică fiecare individ din populație într-unul din următoarele trei grupuri:

Susceptibil (e) & # 8211 persoane care nu au fost încă infectate și care ar putea prinde infecția.
Infecțios (I) & # 8211 persoane care sunt infectate în prezent (cazuri active) și care ar putea infecta altele cu care vin în contact.
Recuperat (R) & # 8211 persoane care și-au revenit (sau au murit) din boală și, prin urmare, sunt imune la alte infecții.

Desene animate care prezintă indivizi dintr-o populație clasificată ca S, I, R.

Aceste compartimente conțin un anumit număr de persoane în fiecare zi. Cu toate acestea, acest număr se schimbă de la o zi la alta, pe măsură ce indivizii se deplasează dintr-un compartiment în altul. De exemplu, persoanele din compartiment S se va muta în compartiment Eu, dacă sunt infectați. În mod similar, persoanele infectate, Eu va trece la recuperat R compartiment odată ce se recuperează sau mor din cauza bolii.

Populația totală din cele trei compartimente (S + I + R) se presupune că rămâne același în orice moment. Aceasta este doar populația totală a țării (sau statului / regiunii) pe care o luăm în considerare. Aceasta înseamnă că toată lumea există într-unul din aceste 3 compartimente. Acest lucru ignoră faptul că în cursul natural al lucrurilor (epidemice sau nu), nașterile și decesele se întâmplă în continuare în țară. Dar pentru epidemiile scurte care durează câteva luni, aceasta este o presupunere rezonabilă de făcut! Pentru modelarea altor boli, cum ar fi bolile infecțioase din copilărie, cum ar fi rujeola, care se repetă în mod regulat, va trebui luată în considerare și rata naturală a natalității și a mortalității.

La fel ca în epidemia actuală, din surse autorizate precum ministere, se poate găsi numărul de cazuri active (Eu) și numărul de persoane recuperate sau decedate (R). De asemenea, este raportat numărul total de persoane infectate până în prezent, care, dacă ne gândim la asta, nu este altceva decât suma I + R.

Scopul nostru este de a afla cum se modifică numărul de persoane din fiecare compartiment în timp. Pentru a face acest lucru, facem două ipoteze simple despre ceea ce determină mișcarea oamenilor între aceste compartimente.

Populația împărțită în compartimente, S, I și R ale căror numere se schimbă în timp. Populația totală (suma populațiilor din S, I, R) rămâne aceeași în orice moment.

Prima ipoteză: Să presupunem că nu ați fost infectat în acest moment. Deci, ați aparține S compartiment. Puteți fi expus la virus numai atunci când intrați în contact cu o persoană infectată. Cu cât numărul persoanelor infectate este mai mare în populația generală, cu atât sunt mai mari șansele ca voi să intrați în contact cu o persoană infectată. Același principiu care se aplică în cazul dvs. se aplică în mod egal oricărui alt individ susceptibil din populație. Prin urmare, rata la care persoanele sensibile se infectează, adică rata la care oamenii sunt transferați din S la Eu compartimentele într-o zi dată este proporțională cu dimensiunea Eu compartiment, precum și la dimensiunea S compartiment în acea zi.

A doua ipoteză: Persoanele infectate fie se vor recupera, fie vor muri de boală. În fiecare zi, o anumită parte a persoanelor infectate se va recupera sau va muri. Această fracțiune este considerată o constantă, independentă de numărul de persoane susceptibile, infectate sau recuperate în acea zi dată. Această fracțiune este într-un fel „intrinsecă” pentru agentul patogen specific și captează timpul mediu de recuperare al corpului uman pentru acea boală.

Ceea ce fac modelatorii matematici este să scrieți ipoteza de mai sus în termeni de ecuații matematice care vă spun cum se modifică numărul de persoane sensibile, infectate și recuperate în timp. În limbajul matematicii, astfel de ecuații sunt denumite ecuații diferențiale. Aceste ecuații sunt rezolvate printr-un proces numit integrare, iar aceste soluții ne vor permite să calculăm, de exemplu, numărul de persoane infectate pentru orice moment în viitor.

Pentru boli precum CoVID-19, trebuie să luăm în considerare un alt compartiment numit „Expus” (E). Acesta constă în indivizi care ar putea avea virusul (din cauza călătoriei, direct / indirect cu o persoană deja testată pozitiv), dar nu prezintă niciun simptom. De exemplu, dacă vărul tău a călătorit la Wuhan și s-a întors, ea este mai susceptibilă decât tine & # 8211, deoarece a fost în preajma virusului. Cu alte cuvinte, acestea se află între compartimentele susceptibile și infectate. Cu toate acestea, în ciuda faptului că nu prezintă niciun simptom, acești indivizi (asimptomatici) pot transmite în continuare boala indivizilor sensibili. Se pot adăuga mai multe compartimente, de exemplu, „în carantină” sau „izolat”, pentru a surprinde mai bine măsurile în curs de combatere a bolii. Modelarea se desfășoară în același mod ca și în cazul anterior, cu ipoteze cu privire la ratele la care oamenii se deplasează între aceste compartimente. Soluția ne permite să calculăm numărul de persoane infecțioase în orice moment viitor.

Transmiterea și controlul bolilor

Modelele permit cuantificarea răspândirii bolilor. Rata de răspândire a infecțiilor la o anumită populație este guvernată de o cantitate R0, numită numărul de reproducere de bază. Valoarea R0 poate fi privită ca intensitatea focarului bolii infecțioase. Cu cât valoarea R0 a unei boli este mai mare, cu atât boala se va răspândi mai repede în rândul populației. În termeni simpli, valoarea R0 este egală cu numărul de cazuri nou infectate, în medie, o persoană infectată va cauza. R0 pentru rujeolă variază între 12-18, în funcție de factori precum densitatea populației și speranța de viață. Aceasta arată rujeola care este o boală extrem de infecțioasă. Dacă o persoană o primește, atunci vor urma aproximativ 18. Comparativ cu rujeola, noul virus coronavirus este mai puțin contagios. Deoarece acest virus este nou, nu suntem concludenți, dar din dovezile pe care le avem, R0 variază între 2.2-2.6. Mai mulți factori biologici și sociali intră în joc în determinarea R0. Perioada de incubație, densitatea gazdei, modurile de transmisie - toate afectează R0.

Prezentarea tipică a urmăririi contactului în stadiu incipient care arată numărul de persoane care intră în contact cu fiecare individ infectat. Unele persoane se infectează la contact și se transformă din S în SI. Persoana infectată cel mai de jos este un exemplu de superspanditor. Un exemplu mai realist de urmărire a contactului cazului în Coreea poate fi văzut aici.

Insight-ul cheie este dacă R0 este mai mic de 1, atunci epidemia va dispărea. Astfel, scopul nostru este de a reduce R0. Putem reduce R0 prin punerea în carantină a contactelor persoanelor infectate sau prin vaccinare (dacă este disponibil un vaccin). O altă modalitate importantă de a reduce R0, în special pentru Covid-19, este distanțarea fizică, adică menținerea unei distanțe de 1-2 metri față de alte persoane în orice moment. Studiile arată că noul coronavirus poate călători doar aproximativ un metru în aer, în comparație cu intervalul de 100 de metri pentru o boală aeriană, cum ar fi rujeola. Deci, distanțarea fizică reduce probabilitatea de a detecta o infecție. Cu toate acestea, această valoare R0 este doar o estimare medie și poate fi afectată de evenimente neașteptate, cum ar fi adunările comunității. Aici, o singură persoană infectată poate infecta mai multe persoane și este denumită super-răspânditor. De exemplu, o singură femeie infectată din Coreea de Sud a participat la slujba bisericii și a ajuns să infecteze alte 5176 persoane (începând cu 18 martie). Acesta este motivul pentru care întâlnirile publice sunt interzise, ​​nu vrem să declanșăm nici măcar accidental super-distribuitoarele ascunse.

Aplatizarea Curbei

În stadiile incipiente, boala se răspândește rapid în rândul populației. Aceasta se numește crestere exponentiala fază. Aici, numărul total de persoane infectate (I + R în modelul nostru SIR) se dublează o dată la fiecare „D” zile, unde numărul „D” pentru Covid19 răspândit în India este în jur de 4 (începând cu 6 aprilie). Dacă această rată de dublare continuă neîncetată, numărul total de persoane infectate va crește foarte repede. Chiar dacă doar o mică parte din cei infectați vor avea nevoie de spitalizare, spitalele noastre vor ajunge la capacitate în câteva săptămâni și nu pot servi tuturor celor care au nevoie de îngrijire.

Cu cât numărul de reproducere de bază R0 este mai mare, cu atât se dublează mai repede și cu atât mai repede spitalele noastre vor fi copleșite. Dacă R0 este redus prin măsuri de control (cum ar fi distanțarea fizică), atunci rata de dublare încetinește. În timp ce foarte mulți oameni vor fi încă infectați, acest lucru va avea loc pe o perioadă mai lungă de timp (mai degrabă luni decât săptămâni), iar cererea zilnică de paturi de spital nu va depăși oferta. Această întindere din curba infecției este denumită aplatizând curba.

Pe măsură ce trec zilele, numărul infecțiilor active atinge un vârf, după care răspândirea infecțiilor încetinește, din moment ce tot mai puțini indivizi sensibili rămân în populație. Modelarea matematică poate estima numărul de persoane care vor fi infectate de boală la un moment dat și modul în care aceasta va varia în funcție de măsurile de control impuse. De asemenea, ne oferă o estimare a momentului în care va atinge vârful epidemiei. La rândul său, acest lucru oferă o idee despre numărul de paturi de spital / UCI necesare pentru populație.

Spuneți acum că avem un vaccin împotriva unei epidemii. Aceasta va reduce R0, deoarece numărul de susceptibili va scădea. Pe măsură ce vor fi vaccinați mai mulți oameni, boala va intra sub control. Doi matematicieni scoțieni, Kermack și McKendrick (care au propus pentru prima dată modelul SIR în 1927) au arătat că nu trebuie să vaccinăm întreaga populație pentru ca o epidemie să dispară. Vaccinarea este suficientă doar o fracțiune din populație și această fracție depinde de R0. S-a constatat că această fracțiune pentru noul coronavirus care cauzează COVID-19 este de aproximativ 60%. Acest rezultat este un alt exemplu pentru a arăta modul în care modelarea matematică este extrem de utilă.

Extensii și limitări ale modelelor

Modelele de compartimente (SIR / SEIR) pot fi îmbunătățite în continuare folosind mai multe compartimente, cum ar fi presimptomatice, asimptomatice, infectate-în carantină, infectate-recuperate, moarte, etc. Un exemplu este prezentat mai jos.

Un model mai sofisticat, cu mai multe compartimente, cum ar fi Is = infectat sever simptomatic, Ip = infectat simptomatic, Ia = infectat asimptomatic, Im = infectat ușor simptomatic, H internat, D = mort

În plus, persoanele pot fi, de asemenea, clasificate în funcție de vârstă, deoarece răspunsul lor la tratament în cazul COVID-19 este diferit. Astfel, putem construi modele mult mai bogate pornind de la modelul SIR simplu.

Cu toate acestea, observăm că pentru a afla ratele la care se deplasează oamenii dintr-un compartiment în altul, avem nevoie de anumiți parametri. Un model cu parametri răi nu va da rezultate bune. Cu cât modelul este mai complicat, cu atât există mai mulți parametri. Acești parametri variază în funcție de țări, regiuni diferite din țări diferite. În plus, acestea sunt afectate de diverși factori, cum ar fi migrația și intervenția ned farmaceutică, cum ar fi blocarea, testarea în carantină. Obținerea parametrilor modelului este o provocare, iar strategia generală este de a analiza comportamentul din trecut și de a deduce parametrii. Această procedură, denumită ajustare, este utilizată pe scară largă în modelarea matematică. Cu toate acestea, acești parametri se modifică în timp, astfel încât ceea ce a fost pentru o perioadă anterioară nu este valabil pentru o dată ulterioară.

Deoarece acești parametri reflectă comportamentul oamenilor, aceștia sunt, de asemenea, afectați de percepție și fluxul de informații.De exemplu, dacă există un zvon într-o comunitate despre o transmisie din apropiere, ei vor fi mai conștienți de interacțiunile fizice. În mod similar, mesajele de pe diferite platforme media pot schimba comportamentul oamenilor.

Persoanele infectate acționează diferit. Unii au o mulțime de contacte, în timp ce unii au puține contacte.

În plus față de parametrii modelului, modelele de compartimente au o limitare mai fundamentală, așa cum este ilustrat aici. Într-un model SIR / SEIR, mulți oameni cad în compartimentul susceptibil, dar nu fiecare persoană sensibilă are aceeași șansă de a întâlni un individ infectat. Lucrătorii din domeniul sănătății, de exemplu, au mai multe șanse de a se infecta. Persoanele care aparțin aceleiași rețele (sociale, religioase) au șanse variate de a se infecta în funcție de rețeaua (rețelele) lor. De exemplu, un negustor întâlnește sute de clienți pe zi și, prin urmare, șansa sa de a fi expus este mult mai mare. Astfel, modelele care iau în considerare comportamentul individual spre deosebire de comportamentul unei colecții vor surprinde această variație între indivizi din același compartiment. Aici devin utile modelele bazate pe agenți (ABM), cunoscute și sub numele de modele individuale sau IBM.

Modele individuale sau bazate pe agenți

Modelele bazate pe agenți (ABM), cunoscute și sub numele de modele individuale (IBM), simulează comportamentul agenților autonomi. În timp ce modelează o boală, agenții sunt de obicei persoane individuale. Acest lucru contrastează modelul anterior, care a ținut doar evidența modului în care numărul total de pacienți sensibili, expuși, infecțioși și recuperați variază în funcție de progresul timpului. Astfel, modelul anterior presupune că, deoarece fiecare individ acționează într-un mod similar și va avea o șansă similară de a se infecta sau de a transmite infecții. În schimb, ABM-urile tratează fiecare individ separat, iar comportamentul lor poate fi diferit.

Fiecare agent (individ) are un anumit set de proprietăți. Cea mai relevantă proprietate este legată de starea lor infectată (S, I sau R), dar există și alte câteva proprietăți relevante. De exemplu, vârsta, comorbiditatea, contactele sociale etc. variază de la o persoană la alta și vor fi factori relevanți în răspândirea bolii. Mai mult, pot exista și informații despre locația spațială. La fiecare pas (timp) al modelului, indivizii își pot schimba proprietățile în funcție de vecinii lor. De exemplu, S6 din figură nu are agenți infectați vecini și se va comporta diferit de S1 care este aproape de un agent infectat. În modele mai avansate, stochasticitatea (aleatoritatea) și proprietatea de a învăța din acțiunile din trecut sunt încorporate, pentru a reflecta un comportament mai realist.

Simulațiile ABM, în care agenții individuali decid ce să facă în fiecare etapă, depășesc anumite dezavantaje ale modelelor SIR și ale derivaților săi, cum ar fi presupunerea că populația este omogenă. Este posibil, de exemplu, să existe diferite tipuri de agenți care să reprezinte membrii de diferite grupe de vârstă sau de profesii diferite și să încorporeze fapte precum expunerea mai mare a lucrătorilor din domeniul sănătății la persoanele infectate, ceea ce, la rândul lor, le crește riscul de infecție. Acestea servesc ca modele & # 8220bottom-up & # 8221, în care rezultatul emergent este determinat de comportamentul indivizilor din populație și sunt metode mai realiste de modelare a populațiilor. ABM-urile au fost folosite anterior pentru modelarea bolilor la scări spațiale multiple, de la un oraș la o altă națiune. ABM-urile au fost folosite cu succes pentru modelarea diferitelor epidemii, inclusiv H1N1, diferite tulpini de gripă și Ebola.

Un dezavantaj major al ABM-urilor este că odată cu creșterea numărului de agenți, crește și puterea de calcul necesară pentru a rula simularea. Modelele pe scară largă bazate pe agenți tind să necesite medii de calcul performante pentru implementarea lor. Cu toate acestea, acestea sunt state-of-the-art în ceea ce privește modelarea și pot fi folosite pentru a modela întreaga populație dintr-un oraș de dimensiuni medii de 5 milioane de oameni.


De ce creșterea logistică?

Creșterea logistică este o funcție matematică matematică care poate fi utilizată în mai multe situații. Creșterea logistică se caracterizează printr-o creștere crescută în perioada de început, dar o creștere descrescătoare într-o etapă ulterioară, pe măsură ce vă apropiați de maxim. De exemplu, în cazul Coronavirus, această limită maximă ar fi numărul total de oameni din lume, deoarece atunci când toată lumea este bolnavă, creșterea va scădea în mod necesar.

În alte cazuri de utilizare a creșterii logistice, acest număr ar putea fi dimensiunea unei populații de animale care crește exponențial până în momentul în care mediul lor nu oferă suficientă hrană pentru toate animalele și, prin urmare, creșterea devine mai lentă până la atingerea unei capacități maxime a mediului .

Motivul utilizării creșterii logistice pentru modelarea focarului de coronavirus este că epidemiologii au studiat aceste tipuri de focare și se știe că prima perioadă a unei epidemii urmează creșterii exponențiale și că perioada totală poate fi modelată cu o creștere logistică.


Prisma 3 - Calcularea concentrațiilor „necunoscute” folosind o curbă standard

O curbă standard este un grafic care leagă o cantitate măsurată (radioactivitate, fluorescență sau densitate optică, de exemplu) la concentrația substanței de interes în probele „cunoscute”. Pregătiți și testați eșantioane „cunoscute” care conțin substanța în cantități alese pentru a acoperi gama de concentrații pe care vă așteptați să le găsiți în eșantioanele „necunoscute”. Apoi trageți curba standard trasând cantitatea testată (pe axa Y) față de concentrație (pe axa X). O astfel de curbă poate fi utilizată pentru a determina concentrațiile substanței în probele „necunoscute”. Prisma automatizează acest proces.

Prisma se pot potrivi curbelor standard folosind regresia neliniară (ajustarea curbei), regresia liniară sau o curbă spline cubică (sau LOWESS). Pentru a găsi concentrațiile „necunoscute” folosind o curbă standard, urmați acești pași:

În Bine ați venit la Prism caseta de dialog, selectați Creați un proiect nou și Munca independenta. Alegeți să formatați coloana X ca Numere și pentru a formata coloana Y pentru numărul de replici din datele dvs. Pentru exemplul nostru, alegeți O singură coloană de valori.

Introduceți date pentru curba standard. În exemplul nostru, prezentat mai jos, am introdus concentrații pentru eșantioanele „cunoscute” în coloana X, rândurile 1-5 și rezultatele analizei corespunzătoare în coloana Y. Nu vă faceți griji dacă Prism afișează zerouri finale pe care nu le-ați introdus - vom schimba asta mai târziu. Chiar sub valorile curbei standard, începând cu rândul 6, introduceți rezultatele analizei pentru eșantioanele „necunoscute” în coloana Y, lăsând necompletate celulele X corespunzătoare. Mai târziu, Prism se va potrivi cu curba standard și apoi va raporta concentrațiile de substanță necunoscute folosind acea curbă.

Faceți clic pe A analiza buton. Alege Analiză încorporată. De la Curbele și regresia amplificatorului categorie, selectați Regresie liniara dacă utilizați datele noastre de exemplu (sau dacă analizați date despre care bănuiți că sunt curbilinee, alegeți Regresie neliniară [ajustare curbă]). Pentru un exemplu despre cum să procedați cu date neliniare, consultați exemplul Analizării datelor RIA sau ELISA.

În caseta de dialog Parametri: regresie liniară, bifați caseta etichetată Curba standard X de la Y, pentru că dorim să se furnizeze concentrațiile noastre necunoscute. În Ieșire categoria de opțiuni, selectați Auto opțiuni pentru a determina unde Prism va începe și va termina linia de regresie. Setați numărul de cifre semnificative la 3.

Când faceți clic Bine pentru a părăsi dialogul cu parametrii de regresie liniară, Prism efectuează ajustarea și creează o foaie de rezultate.

Prism afișează rezultatele pe pagini numite vizualizări. Vizualizarea implicită arată parametrii care definesc curba de potrivire optimă.

Găsiți caseta drop-down etichetată „Vizualizați” în al treilea rând al barei de instrumente (nu meniul „Vizualizați” în partea de sus a ecranului). Selectați Valori X interpolate (la începutul lansărilor Prism, aceasta era „Curba standard X din Y”).

Prism raportează valoarea X corespunzătoare pentru fiecare valoare Y nepereche din foaia dvs. de date.

Adăugați necunoscute în grafic

Graficul automat Prism include datele din foaia de date și curba. Pentru a adăuga & quotnecunoscute & quot la grafic:

Treceți la Grafice secțiunea proiectului dvs.

Faceți clic pe Schimbare și apoi selectați Date pe grafic.

Caseta de dialog afișează toate datele și tabelele de rezultate care sunt reprezentate pe grafic. Faceți clic pe Adăuga buton.

Din lista derulantă din partea de sus a Adăugați seturi de date în grafic caseta de dialog, selectați . Regresie liniară: valori X interpolate. Click pe Adăuga, atunci Închide. Lista seturilor de date incluse în grafic ar trebui să arate acum ca fereastra de mai jos.

presa Bine pentru a reveni la grafic.

Dacă doriți ca „cunoscutele” să fie reprezentate ca vârfuri proiectate pe axa X (mai degrabă decât puncte de date), faceți clic pe butonul Modificare și selectați Simboluri și linii. Din lista derulantă „Set de date”, selectați. Regresie liniară: valori X interpolate. Schimbați forma simbolului cu una dintre ultimele 4 opțiuni (vârfuri) și setați dimensiunea la 0.

Rezultate curbe standard - Necunoscute sunt reprezentate ca vârfuri pe grafic rezultatele numerice sunt raportate ca un tabel încorporat. Ilustrația include câteva modificări de formatare care nu sunt discutate aici.


Estimarea ratei de răspândire în actuala epidemie de ebola

Am scris acum câteva articole despre focarul de ebola din Africa de Vest (vezi de exemplu aici, aici, aici și aici). De data aceasta vreau să devin mai analitică, descriind modul în care am estimat rata de reproducere de bază Ebola Ro (& # 8220R zero & # 8221), adică rata de răspândire a infecției. Aproape sigur, diverse persoane fac aceste estimări, dar eu nu am văzut încă niciunul, inclusiv pe site-urile web ale OMS și CDC sau în puținele articole care au apărut până în prezent.

Mai întâi ceva. Ro este un parametru fundamental în epidemiologie, similar din punct de vedere conceptual cu r, & # 8220 rata intrinsecă de creștere & # 8221, în biologia populației. În epidemiologie, acesta este definit ca numărul (mediu) de cazuri de boală secundară care apar dintr-un caz primar. Atunci când o persoană se infectează, el sau ea este un caz secundar față de cazul primar care l-a infectat și, la rândul său, devine un caz primar capabil să răspândească boala la alții. Este o descendență în acest sens și fractală. Mă voi referi la el simplu ca R aici.

Valoarea lui R depinde în mare măsură de biologia virusului și de comportamentul celor infectați. Prin urmare, este mai mult dependent de context decât r parametru al biologiei populației, care este o rată idealizată sau optimă de creștere a populației determinată de parametrii reproductivi intrinseci (de exemplu, vârsta până la maturitatea reproductivă, dimensiunea medie a așternutului, timpul de gestație). Bolile care sunt extrem de contagioase, cum ar fi rujeola, variola și gripa, au valori R cuprinse între 3 și 8 sau chiar mult mai multe, în timp ce cele care necesită schimb direct de fluide corporale, precum HIV, au rate mult mai mici.

Pentru a încetini o epidemie a oricărei boli, este necesar să reduceți valoarea R pentru a o opri complet, R trebuie adus la zero. Orice valoare a R & gt 0,0 indică o boală cu cel puțin o anumită activitate în populația țintă. Când R = 1,0, există o creștere constantă a numărului cumulativ de cazuri, dar nu există nicio modificare a ratei de infecție (cazuri noi pe unitate de timp): fiecare persoană infectată infectează (în medie) exact 1,0 alte persoane înainte de a se recupera sau de a muri . Orice R & gt 1.0 indică o creștere (neapărat exponențială) a ratei de infecție, adică rata de cazuri noi pe unitate de timp (nu doar numărul total de cazuri) este în creștere.

Virusul Ebola poate părea infectat în afara unui corp cald pentru o perioadă de timp și se poate răspândi și prin aerosoli, dar modul de transmisie dominant este (de departe) prin contactul direct cu corpul și fluidul corporal. Acest fapt ar trebui să aibă tendința de a favoriza valorile R mai mici în general. Cu toate acestea, este și o boală foarte nouă, cunoscută abia din 1976 și, în ceea ce privește Africa de Vest, este complet necunoscută și fără 82 de rezistență imună la populația umană. Același lucru s-a întâmplat atunci când a apărut pentru prima dată în Zaire și Uganda, anterior, aparent o nouă boală oriunde a apărut. Prin urmare, s-ar putea aștepta rate de răspândire semnificativ mai mari decât pentru o boală virală care are aceeași biologie de bază, dar cu care populația are o imunitate reziduală.

Deci, pentru a face estimările și considerațiile din acestea. Există patru probleme principale aici: (1) netezirea datelor, (2) alegerea unui model matematic optim, (3) estimarea parametrului (modelilor) modelului și a # 8217s și (4) estimarea R din aceste valori. Îi voi lua pe rând.

O complicație în această situație implică colectarea datelor și raportarea calendarelor, și anume faptul că noile cazuri zilnice raportate și ratele de deces cresc sălbatic de la un raport la altul. Nu există niciun motiv biologic de așteptat acest lucru: se datorează aproape sigur modului în care datele sunt colectate și raportate. Pentru tabelarea numărului total de cazuri, aceasta nu este o problemă majoră, dar cu siguranță pentru estimarea ratelor. Trebuie să netezim aceste fluctuații și am făcut acest lucru folosind loess sau regresie ponderată local. Loess-ul este subiectiv, totuși, pentru că trebuie să alegeți modul în care doriți să fie ponderată regresia.

În ceea ce privește problema (2), cunoaștem două fapte importante: (1) R & gt 1.0 (numărul de cazuri noi și decese pe unitate de timp este în creștere) și (2) R & gt 1.0 implică puternic o funcție exponențială (o o rată de caz care nu crește exponențial este posibilă, dar instabilă și, prin urmare, puțin probabilă pe o perioadă extinsă). Funcțiile exponențiale sunt de forma y = b ^ ax, unde b este o bază aleasă, de obicei e (

2.718) sau 10 și A este singurul parametru estimat.

Problema (3) necesară implică adaptarea modelului la date și, prin urmare, implică potențial problema (1). Ar trebui să potrivim modelul cu datele brute sau cu datele netezite (acestea din urmă fiind mult mai susceptibile să reflecte biologia reală, mai degrabă decât artefacte)? Dacă îl potrivim cu datele brute care sunt foarte afectate de creșteri în rapoartele de caz sau alte probleme, acest lucru va induce o eroare.

Numărul (4) implică matematică foarte simplă în acest caz, convertind pur și simplu o bază la alta ușor (dar critic).

Pe scurt, asta am făcut. În primul rând, am așteptat să apară următorul raport OMS (care conține un vârf de caz mare), presupunând că ori de câte ori este prezentat un vârf atât de mare, acesta este o reflectare exactă a cazurilor totale până în prezent. Apoi am calculat ratele totale ale cazurilor și deceselor din datele prezentate și le-am netezit folosind o funcție de rigidizare relativ rigidă & # 8220loess & # 8221, exact ca în numeroasele grafice pe care le-am arătat anterior. În R limbajul de calcul pe care îl folosesc, rigiditatea netezirii loess rezultate este controlată de argumentul & # 8220span & # 8221, cu valori de

1.0 oferind curbe relativ rigide, care sunt minim influențate de variațiile mari în cazurile raportate.

Globul ocular al liniei a confirmat că a fost concav în ultimele trei luni și, prin urmare, că un model de creștere exponențială era într-adevăr adecvat. Modul standard de procedare ar fi să se potrivească apoi un model exponențial la date, dar în R programul se face folosind nlm sau optim funcții, niciuna dintre ele nu pare să funcționeze bine (și pe care nu am avut nici o dispoziție pentru această dată, dacă vreodată). Așa că am lucrat în jurul acesteia folosind o abordare a forței brute, dar care are și alte avantaje, cum ar fi capacitatea de a evalua funcția loess și performanța # 8217s.

Deci, ceea ce am făcut a fost să:
(1) luați noua rată estimată de loess din ultimul raport OMS (22 august),
(2) calculați rata de creștere pe zi care ar fi necesară pentru a atinge acea valoare în ultimul

trei luni și, (3) au folosit acea valoare ca punct de plecare pentru căutările sistematice de valori, oferind estimări chiar mai bune (așa cum sunt evaluate prin sumele reziduale de pătrate).

Un punct cheie în pasul (2) este că parametrul estimat (în modelul y = b ^ ax) este nu de fapt a, ci mai degrabă baza b. Este mai ușor (și mai informativ) să se estimeze b, rata de creștere pe zi a persoanelor infectate din populație, ca b = y ^ (1 / x), unde y se obține din pasul (1), a este setat la 1.0 și x reprezintă numărul de zile de la identificarea cazurilor primare. Conversia de la rata de creștere a populației, b, la rata de spread pe persoană, R, este simplu dacă știm puțin despre progresia bolii Ebola, ceea ce facem.

Cu o estimare a punctului de plecare de b, ceea ce, din privirea oculară, am încredere este rezonabil, apoi calculez sumele pătratelor pentru toate valorile lui b între 0,5b și 1,5b, în ​​200 trepte (partea forței brute). Alegerea celei mai potrivite valori a b, Apoi îl convertesc la o estimare a lui R în următoarea logică. Valoarea lui R este independentă de timp, total numărul de cazuri secundare care rezultă dintr-un set de cazuri primare. Prin urmare, trebuie să știu cât timp sunt infectați pacienții cu ebola și rata zilnică de creștere a infecției cu ebola. Din ceea ce am citit, pacienții sunt infecțioși timp de aproximativ 6 până la 12 zile, înainte de a muri sau de a-și reveni (se presupune că sunt dezinfectioși (sau cam așa) înainte de acest moment, dar păstrează o anumită infecțiozitate după recuperare). În absența unor date mai bune, R este, prin urmare, estimat pur și simplu de R = b ^ d, unde d variază între 6-12 zile.

Deci, în cele din urmă, iată rezultatele, în toate cazurile din toate țările, folosind un timp zero de la jumătatea lunii mai (acea dată când focarul inițial din martie / aprilie a dispărut, înainte de a crește din iunie până acum). Am presupus că acuratețea identificării cazurilor este ridicată, adică cazurile & # 8220probabile & # 8221 și & # 8220suspecționate & # 8221 sunt în mare măsură corecte. De asemenea, am presupus că răspândirea de la orice vector animal la oameni nu este o componentă importantă a epidemiei, odată ce a început.

Estimarea inițială a b a fost 1,042. Rata de (probabilitate maximă) obținută din pasul (3) de mai sus a fost foarte apropiată de aceasta: 1,043, ceea ce înseamnă că pentru aceste date, alegerea unui parametru relativ rigid de netezire a datelor loess (span = 1,0) a dat o reprezentare foarte precisă a subiacentului rata de crestere. În cele din urmă, estimarea R, rata de transmitere a bolii pe cap de locuitor, variază astfel de la 1,29 la 1,66 pentru d = 6 și respectiv 12, calculată din datele din ultimele

3 luni. Va fi interesant să vedem cum se modifică aceste rate în timp și cum se compară cu estimările epidemiilor din trecut, dacă au fost făcute și, de asemenea, între cele trei țări din acest focar.


Modelarea COVID-19

Pandemia globală a COVID-19 a ridicat profilul modelării matematice, o abordare epidemiologică de bază pentru investigarea dinamicii de transmitere a bolilor infecțioase. Modelarea bolilor infecțioase a fost prezentată în briefing-uri de rutină de către grupul de lucru federal COVID, inclusiv proiecții ale viitoarelor cazuri de COVID, spitalizări și decese. Modele au fost, de asemenea, acoperite în știri, cu povești despre cercetarea de modelare care a furnizat informații despre povara bolilor în Statele Unite și la nivel global. Odată cu această acoperire a apărut și interesul și criticile pentru modelare, inclusiv surse comune de intrări de date și ipoteze structurale.

În această postare, descriu elementele de bază ale modelării matematice, modul în care a fost folosit pentru a înțelege COVID-19 și impactul său asupra luării deciziilor în domeniul sănătății publice. Aceasta rezumă materialul în care am discutat pe larg o discuție recentă invitată despre modelarea pandemiei globale COVID-19.

Ce sunt modelele?

O mare parte din epidemiologie (cu multe excepții) se concentrează pe relația dintre expunerile la nivel individual (de exemplu, consumul anumitor alimente) și rezultatele la nivel individual (de exemplu, cancerele incidente). Studierea bolilor infecțioase încalcă multe dintre aceste reguli, datorită interesului de a cuantifica nu doar achiziția bolii, ci și transmiterea bolii. Transmiterea implică înțelegerea efectelor expunerilor cuiva asupra rezultatelor altor persoane. Acest lucru se întâmplă deoarece bolile infecțioase sunt contagioase. Sir Ronald Ross, un medic și epidemiolog britanic care a caracterizat tiparele de transmitere a malariei la începutul secolului al XX-lea, a numit aceste „întâmplări dependente”.

Evenimentele dependente sunt conduse de o buclă de feedback epidemic, prin care riscul individual de boală este o funcție a prevalenței actuale a bolii. Pe măsură ce prevalența crește, crește probabilitatea expunerii la o persoană infectată. Și prevalența crește odată cu infecțiile incidente, iar acest lucru este determinat de riscul individual legat de expunere.

Aceste dependențe creează neliniarități în timp, așa cum se arată în panoul din dreapta de mai sus. La începutul unui focar de boală infecțioasă, există o curbă de creștere exponențială. Acest lucru poate fi caracterizat pe baza timpului de dublare a numărului de cazuri cumulative. Potențialul epidemic poate fi, de asemenea, cuantificat cu R0, care este numărul mediu de transmisii rezultând un individ infectat într-o populație complet sensibilă. 0 în R0 se referă la momentul 0 într-o epidemie când acest lucru ar fi cazul colocvial, oamenii folosesc și R0 pentru a discuta despre potențialul epidemiei în momentele ulterioare. Prin urmare, R0 s-ar putea micșora în timp pe măsură ce populația sensibilă se epuizează sau pe măsură ce sunt implementate diferite intervenții comportamentale sau biologice.

Modelele matematice pentru epidemii iau parametri precum R0 ca intrări. Modelele construiesc apoi mecanismele pentru a ajunge de la nivel micro (biologie la nivel individual, comportament și demografie) la nivel macro (incidența și prevalența bolii populației). Această construcție depinde în mare măsură de teorie, adesea susținută de mai multe domenii ale științei empirice, care oferă o perspectivă asupra modului în care mecanismele (uneltele din diagrama de mai jos) se potrivesc individual și împreună în sistem.

Datorită complexității acestor sisteme și a gamei largi de mecanisme încorporate, modelele sintetizează de obicei mai multe fluxuri de date din domenii științifice interdisciplinare. Flexibilitatea cu datele introduse este, de asemenea, importantă în timpul focarelor de boală, când disponibilitatea unor studii de cohortă mari sau a studiilor clinice pentru a explica etiologia bolii sau intervențiile cu precizie poate fi limitată.

Din fericire, există mai multe metode statistice pentru evaluarea consistenței modelului ipotezat față de natură. Metode de calibrare a modelului care testează valorile parametrilor modelului (de exemplu, valorile lui R0) sunt mai mult sau mai puțin conforme cu datele (de exemplu, supravegherea cazurilor cazurilor diagnosticate). Analizele de sensibilitate cuantifică cât de mult depind proiecțiile finale ale unui model (de exemplu, efectul unei intervenții de boli infecțioase) de intrările modelului inițial.

Punând laolaltă aceste piese, modelele oferă un laborator virtual pentru a testa diferite ipoteze despre relațiile deseori complexe și contraintuitive între intrări și ieșiri. Acest laborator virtual permite nu numai estimarea rezultatelor viitoare proiectate, ci și testarea scenariilor contrafactual pentru care s-ar putea să nu fie disponibile date complete.

Cum sunt construite și analizate modelele?

Există multe clase de modele matematice utilizate în epidemiologie. Trei categorii largi sunt: ​​modele compartimentale deterministe (DCM), modele bazate pe agenți (ABM) și modele de rețea. DCM împart populația în grupuri definite, cel puțin, de posibilele stări de boală în care s-ar putea afla în timp. ABM-urile și modelele de rețea reprezintă și simulează mai degrabă indivizi decât grupuri și oferă o serie de avantaje în reprezentarea proceselor de contact care generează expuneri la boli. DCM sunt baza epidemiologiei matematice și oferă o introducere directă a modului în care sunt construite modelele.

Luați exemplul din figura de mai jos a unei boli imunizante, cum ar fi gripa sau rujeola, care poate fi caracterizată prin stările de boală sensibile (compartimentul S), infectate (compartimentul I) și recuperate (compartimentul R). Persoanele încep în S la naștere, apoi se deplasează la I și apoi la R. Diagrama de flux, cam ca un DAG, definește tipurile de tranziție care sunt presupuse a fi posibile (și prin omiterea săgeților, care sunt ipotezate nu). Mișcarea de la S la I corespunde transmiterii bolii, iar mișcarea de la I la R corespunde recuperării. Pot exista și intrări și ieșiri exogene suplimentare, precum cele prezentate în diagramă, care corespund nașterilor și deceselor.

Viteza la care are loc transmisia și recuperarea în timp este controlată de parametrii modelului. Aceste diagrame de flux sunt traduse în ecuații matematice care definesc formal această structură a modelului și parametrii modelului. Următorul set de ecuații care corespund acestei figuri. Acestea sunt ecuații diferențiale care specifică, în partea stângă, cât de repede se schimbă dimensiunile compartimentelor (numeratorii) în timp (numitorul). În partea dreaptă sunt definiția setului de fluxuri în și din fiecare compartiment.

Un flux, de la compartimentul S la I, include parametrul λ (lambda) care definește „forța infecției”. Aceasta este rata de transmitere a bolii care variază în timp. Acesta variază în timp, din motivele prezentate în diagrama buclei de feedback a epidemiei, prezentată mai sus și formalizată în ecuația de mai jos. Rata de transmitere a bolii pe unitate de timp poate fi definită ca rata de contact pe timp, c, ori probabilitatea ca fiecare contact să conducă la un eveniment de transmisie, t, ori probabilitatea ca orice contact să fie cu o persoană infectată. Ultimul termen este un alt mod de exprimare a prevalenței bolii, aceasta este caracteristica buclei de feedback care se schimbă în timp pe măsură ce epidemia se desfășoară.

Prin urmare, dimensiunea totală a tranzițiilor este o funcție a acestor parametri ai modelului și a dimensiunii totale a compartimentelor la care se aplică parametrii. În cazul transmiterii bolii, parametrii se aplică persoanelor care ar putea fi infectate sau persoanelor din compartimentul S. Odată ce toate ecuațiile sunt construite, acestea sunt programate într-un computer, cum ar fi instrumentul software pentru modelare pe care l-am construit EpiModel. Pentru a experimenta un model DCM simplu, verificați aplicația noastră Shiny.

Modele mai complexe construiesc posibilele stări de boală, de exemplu, prin adăugarea unei etape infectate latent, dar neinfecțioase (numite modele SEIR). Sau adaugă o altă tranziție, adăugând o săgeată de la R înapoi la S în cazul în care imunitatea este temporară (numite modele SIRS). Sau adaugă stratificări suplimentare, cum ar fi grupele de vârstă, atunci când acele straturi sunt relevante pentru transmiterea bolii sau procesul de recuperare. Prin adăugarea acestor stratificări, sunt posibile presupuneri diferite despre procesul de contact, de exemplu, prin simularea unei rate de contact mai mari pentru persoanele mai tinere sau concentrarea majorității contactelor tinerilor cu alți tineri. Aceste structuri suplimentare de model ar trebui să se bazeze pe o bună teorie, susținută de date empirice.

Cum au fost utilizate modelele pentru a înțelege COVID-19?

Modelele matematice au fost utilizate pe scară largă în două moduri în actuala pandemie globală COVID-19: 1) înțelegerea a ceea ce tocmai s-a întâmplat cu lumea sau a ceea ce se va întâmpla în curând 2) stabilirea a ce să facem în legătură cu aceasta.

În prima categorie, mai multe modele au estimat povara bolilor (cazuri, spitalizări, decese) împotriva capacității de asistență medicală. Cel mai faimos dintre aceste modele este modelul „Colegiul Imperial”, condus de anchetatorii de la acea instituție și publicat online pe 16 martie. Acesta este un model bazat pe agenți care a proiectat mai întâi numărul de decese și spitalizări ale COVID în Marea Britanie și SUA împotriva capacității actuale de îngrijire critică în diferite scenarii. În scenariul „nu face nimic”, în care nu au existat modificări ale comportamentului, modelul a proiectat 2,2 milioane de decese ar avea loc în SUA și peste 500.000 în Marea Britanie.

Modelul a inclus, de asemenea, scenarii de schimbare comportamentală la scară largă (un exemplu al celei de-a doua categorii de utilizare, ce să facem în legătură cu aceasta), în care s-au impus măsuri diferite de izolare și „distanțare socială” (o nouă adăugire la lexicon). În aceste scenarii, am putea „aplatiza curba”, ceea ce însemna reducerea incidenței maxime a bolii în raport cu capacitatea sistemului de sănătate. Aceste modificări au fost implementate în model prin modificarea parametrilor modelului legați de ratele de contact în acest caz, structura modelului și ratele de contact au fost stratificate în funcție de locația contactelor (acasă, locul de muncă, școală, comunitate) și grupa de vârstă.

După lansarea acestor modele, guvernul federal american a schimbat substanțial recomandările sale legate de distanțarea socială la nivel național. S-a discutat ulterior despre cât timp au fost puse în aplicare aceste măsuri de distanțare, din cauza uriașelor perturbări sociale și economice pe care le-au presupus aceste schimbări. O întrebare de politică importantă a fost dacă aceste schimbări ar putea fi relaxate de Paști la mijlocul lunii aprilie sau poate la începutul verii.

Modelul Colegiului Imperial sugerează că de îndată ce măsurile de distanțare socială sunt relaxate (în banda purpurie) va exista o reapariție a cazurilor noi. Acest al doilea val de infecție a fost determinat de faptul că focarul va continua în absența oricărei terapii clinice, fie pentru a preveni dobândirea bolii (de exemplu, un vaccin), fie pentru a reduce severitatea acestuia (de exemplu, un tratament terapeutic). Deosebit de îngrijorător cu aceste politici de distanțare incrementală ar fi dacă al doilea val s-ar produce în lunile de iarnă de la sfârșitul acestui an, care ar coincide cu gripa sezonieră.

O actualizare a modelului Imperial College a fost lansată pe 30 martie. Acest model a proiectat un număr mult mai mic de decese în Marea Britanie (aproximativ 20.000 de cazuri, comparativ cu peste 500.000 în modelul anterior). Acest lucru a fost interpretat de unele știri ca o eroare în modelul anterior. În schimb, acest model revizuit a încorporat schimbările sociale masive care au fost implementate în Marea Britanie și în alte țări europene în luna martie, așa cum se arată în figura de mai jos. Respectarea acestor politici s-a estimat că a prevenit aproape 60.000 de decese în luna martie.

Acesta este doar unul dintre multele modele matematice pentru COVID. Mai multe alte exemple de interes sunt incluse în lista de resurse de mai jos. De la izbucnirea inițială din Wuhan, China, la începutul lunii ianuarie, a existat o explozie de cercetare de modelare a COVID. Acest lucru a fost facilitat de partajarea ușoară a hârtiei pre-tipărite, împreună cu pragul relativ scăzut în construirea de modele simple de epidemie. Odată cu această explozie de cercetare, o mare parte a lumii a devenit interesată de cercetarea de modelare, deoarece proiecțiile modelului sunt foarte relevante pentru viața de zi cu zi și completează în prealabil lacuna în acoperirea știrilor cu progrese clinice în testarea, tratamentul și tehnologiile de vaccinare. Deoarece pre-tipăririle nu au fost verificate în mod oficial în evaluarea inter pares, poate fi o provocare pentru non-modelatori (inclusiv reporteri de știri și factori de decizie în domeniul sănătății publice) să evalueze calitatea proiecțiilor de modelare. Am văzut deja câteva cazuri în care descoperirile de modelare nuanțate au fost interpretate greșit sau suprainterpretate în știri.

După cum spune zicala lui George Box: toate modelele sunt greșite, dar unele sunt utile. Acest lucru se aplică și modelelor matematice pentru epidemii, inclusiv celor pentru COVID-19. Modelele utile sunt informate de date bune, iar această colectare de date necesită de obicei timp. Aceste date de intrare pentru modele se pot schimba rapid și ele, așa cum a fost cazul modelului actualizat al colegiului Imperial, astfel încât proiecțiile anterioare ale modelului pot fi depășite. Aceasta nu înseamnă că modelul anterior a fost greșit. Într-un sens, modelele își dovedesc utilitatea în absența unor vești proaste dacă stimulează acțiunea publică spre prevenire, care poate avea un efect asupra formei viitoarei curbe epidemice. Pe termen scurt, consumatorii publici de modele ar putea să nu poată determina pe deplin calitatea tehnică a cercetării respective. Dar este important să înțelegem că prioritățile ziarelor și politicienilor și ceea ce consideră utile în unele modele pot diferi substanțial de principiile științifice puternice.

Resurse

Există multe resurse pentru a afla mai multe despre modelare, inclusiv cursul meu de primăvară la RSPH, EPI 570 (Dinamica bolilor infecțioase: teorie și modele). Folosim manualul, O introducere în modelarea bolilor infecțioase, de Emilia Vynnycky & amp Richard White, care oferă o imagine de ansamblu excelentă asupra elementelor de bază ale modelării. De asemenea, avem disponibile materiale deschise pentru atelierul nostru de vară, Modelare de rețea pentru epidemii, care se concentrează în mod special pe modele de rețea stocastice.

În plus, iată o scurtă listă de studii de modelare COVID interesante și bine realizate:

  • Modelul original al Colegiului Imperial: https://www.imperial.ac.uk/media/imperial-college/medicine/sph/ide/gida-fellowships/Imperial-College-COVID19-NPI-modelling-16-03-2020.pdf
  • Modelul actualizat al Colegiului Imperial: https://www.imperial.ac.uk/media/imperial-college/medicine/mrc-gida/2020-03-30-COVID19-Report-13.pdf
  • Model de distanțare socială în Wuhan: https://www.thelancet.com/journals/lanpub/article/PIIS2468-2667(20)30073-6/fulltext
  • Model de distanțare socială pentru măsuri repetate de distanțare episodică: https://dash.harvard.edu/handle/1/42638988
  • Model interactiv pe NY Times: https://www.nytimes.com/interactive/2020/03/25/opinion/coronavirus-trump-reopen-america.html
  • Profilul de vârstă al epidemiei COVID: https://dash.harvard.edu/handle/1/42639493
  • Model de focar pe nava de croazieră Diamond Princess: https://academic.oup.com/jtm/advance-article/doi/10.1093/jtm/taaa030/5766334

Samuel Jenness, dr. Este profesor asistent în cadrul Departamentului de epidemiologie la Școala Rollins de Sănătate Publică de la Universitatea Emory. El este investigatorul principal al laboratorului de cercetare EpiModel, unde cercetarea se concentrează pe dezvoltarea metodelor și instrumentelor software pentru modelarea bolilor infecțioase. Aplicațiile noastre principale sunt axate pe înțelegerea transmiterii HIV și ITS în Statele Unite și la nivel global, precum și pe intersecția dintre epidemiologia bolilor infecțioase și știința rețelei.


Estimarea parametrilor din curba epidemiei: cum se procedează? - Biologie

În capitolele anterioare, au fost analizate mai multe modele utilizate în evaluarea stocului, parametrii respectivi fiind definiți. În exercițiile corespunzătoare, nu a fost necesar să se estimeze valorile parametrilor, deoarece acestea au fost date. În acest capitol, vor fi analizate mai multe metode de estimare a parametrilor. Pentru a estima parametrii, este necesar să cunoaștem teoria eșantionării și inferența statistică.

Acest manual va utiliza una dintre metodele generale cele mai frecvent utilizate în estimarea parametrilor - metoda celor mai mici pătrate. În multe cazuri această metodă utilizează procese iterative, care necesită adoptarea valorilor inițiale. Prin urmare, vor fi prezentate și metode particulare, care obțin estimări apropiate de valorile reale ale parametrilor. În multe situații, aceste estimări inițiale au, de asemenea, un interes practic. Aceste metode vor fi ilustrate cu estimarea parametrilor de creștere și a relației S-R stoc-recrutare.

Metoda celor mai mici pătrate este prezentată sub formele de regresie liniară simplă, model liniar multiplu și modele neliniare (metoda lui Gauss-Newton).

Subiecte precum analiza reziduală, distribuția prin eșantionare a estimatorilor (Bookstrap asimptotic sau empiric și jacknife), limitele și intervalele de încredere etc. sunt importante. Cu toate acestea, aceste chestiuni ar necesita un curs mai extins.

7.1 REGRESIUNE LINEARĂ SIMPLĂ - METODA CELOR MICI PĂTRATE

Luați în considerare următoarele variabile și parametri:

Răspuns sau variabilă dependentă

Variabilă auxiliară sau independentă

Variabila de răspuns este liniară cu parametrii

Y = A + BX

Obiectivul metodei este estimarea parametrilor modelului, pe baza perechilor de valori observate și aplicarea unei anumite funcții de criteriu (perechile de valori observate sunt constituite din valorile selectate ale variabilei auxiliare și de valorile observate corespunzătoare ale variabilă de răspuns), adică:

x i și y i pentru fiecare pereche i, unde i = 1,2. eu. n

A și B și (Y 1, Y 2. Y i. Y n) pentru n perechi de valori observate

Funcția obiect (sau funcția criterium)

În metoda celor mai mici pătrate, estimatorii sunt valorile lui A și B care minimizează funcția obiectului. Astfel, trebuie calculat derivatele & # 8706 & # 934 / & # 8706A e & # 8706 & # 934 / & # 8706B, echivalează-le cu zero și rezolvă sistemul de ecuații din A și B.

Soluția sistemului poate fi prezentată ca:

Observați că valorile observate y, pentru același set de valori selectate ale lui X, depind de eșantionul colectat. Din acest motiv, problema regresiei liniare simple este de obicei prezentată sub forma:

unde & # 949 este o variabilă aleatorie cu valoare așteptată egală cu zero și varianță egală cu & # 963 2.

Deci, valoarea așteptată a lui y va fi Y sau A + BX, iar varianța lui y va fi egală cu varianța lui & # 949.

Termenii deviație și rezidual vor fi folosiți în următoarele moduri:

Abaterea este diferența dintre y observată și y medie () adică abaterea = (y-)

Rezidual este diferența dintre y observat și Y estimat (), adică rezidual =.

Pentru a analiza ajustarea modelului la datele observate, este necesar să se ia în considerare următoarele caracteristici:

Suma pătratelor reziduale:

Această cantitate indică variația reziduală a valorilor observate în raport cu valorile estimate ale variabilei de răspuns a modelului, care poate fi considerată ca fiind variația valorilor observate care nu este explicată de model.

Suma pătratelor abaterilor valorilor estimate ale variabilei de răspuns a modelului:

Această cantitate indică variația valorilor estimate ale variabilei de răspuns a modelului în raport cu media sa, adică variația variabilei de răspuns explicată de model.

Suma totală a pătratelor abaterilor valorilor observate egale cu:

Această cantitate indică variația totală a valorilor observate în raport cu media

Este ușor să verificați următoarea relație:

SQ total = model SQ + SQ rezidual

r 2 (coeficientul de determinare) este procentul din variația totală care este explicat de model și

1-r 2 este procentul din variația totală care nu este explicat de model.

7.2 REGRESIUNE LINEARĂ MULTIPLĂ - METODA PĂRĂTORILOR MICI

Luați în considerare următoarele variabile și parametri:

Răspuns sau variabilă dependentă

Variabile auxiliare sau independente

Variabila de răspuns este liniară cu parametrii

Y = B 1 X 1 + B 2 X 2 +. + B k X k = & # 931 B j X j

Obiectivul metodei este de a estima parametrii modelului, pe baza seturilor de valori observate și prin aplicarea unei anumite funcții de criteriu (seturile de valori observate sunt constituite din valorile selectate ale variabilei auxiliare și de valorile observate corespunzătoare variabilei de răspuns), adică:

Valorile observate x 1, i x 2, i. , x j, i. , x k, i și y i pentru fiecare mulțime i, unde i = 1,2. eu. n

Valori care trebuie estimate B 1, B 2. B j . B k et (Y 1, Y 2. Y i. Y n)

Valorile estimate pot fi reprezentate prin:

Funcția obiect (sau funcția criterium)

În metoda celor mai mici pătrate, estimatorii sunt valorile lui B j care minimizează funcția obiectului.

Ca și în cazul modelului liniar simplu, procedura de minimizare necesită echivalarea derivatelor parțiale de & # 934 la zero pentru fiecare parametru, B j, unde j = 1, 2. k. Sistemul este de preferință rezolvat folosind calculul matricial.

Matricea X (n, k) = Matricea celor n valori observate ale fiecărei k variabile auxiliare
Vector y (n, 1) = Vectorul celor n valori observate ale variabilei de răspuns
Vectorul Y (n, 1) = Vectorul valorilor variabilei de răspuns date de model (necunoscut)
Vectorul B (k, 1) = Vectorul parametrilor
Vector sau b (k, 1) = Vector al estimatorilor parametrilor

Pentru a calcula estimatorii celor mai mici pătrate va fi suficient să puneți derivata d & # 934 / dB a & # 934 pentru a vectoriza B, egal cu zero. d & # 934 / dB este un vector cu componente & # 8706 & # 934 / & # 8706B 1, & # 8706 & # 934 / & # 8706B 2. & # 8706 & # 934 / & # 8706B k. Prin urmare:

d & # 934 / dB (k, 1) = -2.X T. (y-X.B) = 0

sau X T y - (X T .X). B = 0

și b = = (X T .X) -1. X T y

Rezultatele pot fi scrise ca:

b (k, 1) = (X T .X) -1 .X T y

= X.b sau = X (X T .X) -1 .X T y

reziduuri (n, 1) = (y-)

În analiza statistică este convenabil să scrieți estimatorii și sumele pătratelor folosind matrici idempotente. Apoi matricile idempotente L, (I - L) și (I - M) cu L (n, n) = X (X T. X) -1. Se folosesc X T, I = matrice de unitate și M (n, n) = matrice medie (n, 1) = 1 / n [1] unde [1] este o matrice cu toate elementele sale egale cu unul.

De asemenea, este important să se ia în considerare distribuțiile de eșantionare ale estimatorilor, presupunând că variabilele & # 949 i sunt independente și au o distribuție normală.

Este prezentat un rezumat al principalelor proprietăți ale valorii așteptate și ale varianței estimatorilor:

Variabila de răspuns observată y

Estimatorul Y al modelului

6.1 - Suma reziduală de pătrate = SQ rezidual (1.1) = (y-) T (y-) = y T (I-L) y

Această cantitate indică variația reziduală a valorilor observate în raport cu valorile estimate ale modelului, adică variația care nu este explicată de model.

6.2 - Suma pătratelor abaterii modelului = model SQ (1.1) = (-) T (-) = y T (L-M) y

Această cantitate indică variația valorilor de răspuns estimate ale modelului în raport cu media, adică variația explicată de model.

6.3 - Suma totală a pătratelor abaterilor = SQ total (1.1) = (y-) T (y-) = y T (I-M) y

Această cantitate indică variația totală a valorilor observate în raport cu media.

Este ușor să verificați următoarea relație:

SQ total = model SQ + SQ rezidual sau

sau 1 = R 2 + (1 - R 2)

R 2 este procentul din variația totală explicată de model. În termeni matriciali va fi:

R2 = [y T (L - M) y]. [(Y T (I - M) y] -1

1-R 2 este procentul din variația totală care nu este explicat de model.

Rangurile matricilor (I-L), (I-M) și (L-M) egale cu (n-k), (n-1) și (k-1), sunt gradele de libertate asociate cu sumele respective de pătrate.

7.3 MODEL neliniar - METODA GAUSS-NEWTON - METODA MICULUI PĂTRATE

Luați în considerare următoarele variabile și parametri:

Răspuns sau variabilă dependentă

Variabilă auxiliară sau independentă

Variabila de răspuns este neliniară cu parametrii

Y = f (XB) unde B este un vector cu componentele B 1, B 2. B j . B k

Obiectivul metodei este estimarea parametrilor modelului, pe baza celor n perechi de valori observate și prin aplicarea unei anumite funcții de criteriu (seturile de valori observate sunt constituite din valorile selectate ale variabilei auxiliare și de valorile observate corespunzătoare variabilei de răspuns), adică:

Valorile observate x i și y i pentru fiecare pereche i, unde i = 1,2. eu. n

Valori care trebuie estimate B 1, B 2. B j . B k și (Y 1, Y 2. Y i. Y n) formează n perechi de valori observate.

(Estimări = sau b 1, b 2. B j. B k și)

Funcția obiect sau funcția criterium

Estimatorii vor fi valorile lui B j pentru care funcția obiect este minimă.

(Acest criteriu se numește metoda celor mai mici pătrate).

Este convenabil să prezentați problema folosind matrici.

Vectorul X (n, 1) = Vectorul valorilor observate ale variabilei auxiliare
Vector y (n, 1) = Vectorul valorilor observate ale variabilei de răspuns
Vectorul Y (n, 1) = Vectorul valorilor variabilei de răspuns date de model
Vectorul B (k, 1) = Vectorul parametrilor
Vectorul b (k, 1) = Vectorul estimatorilor parametrilor

În cazul modelului neliniar, nu este ușor de rezolvat sistemul de ecuații care rezultă din echivalarea derivatei funcției & # 934 în ordinea vectorului B, la zero. Estimarea prin metoda celor mai mici pătrate poate, pe baza expansiunii seriei Taylor a funcției Y, utiliza metode iterative.

Revizuirea extinderii unei funcții din seria Taylor

Iată un exemplu de extindere a unei funcții din seria Taylor în cazul unei funcții cu o singură variabilă.

Aproximarea lui Taylor înseamnă extinderea unei funcții Y = f (x) în jurul unui punct selectat, x 0, într-o serie de puteri de x:

Y = f (x) = f (x 0) + (x-x 0) .f & # 8217 (x 0) / 1! + (x-x 0) 2 f & # 8217 & # 8217 (x 0) / 2! +. + (x- x 0) i f (i) (x 0) / i! +.

f (i) (x 0) = i derivate ale lui f (x) pentru a x, în punctul x 0.

Extinderea poate fi aproximată la puterea dorită a lui x. Când expansiunea este aproximată la puterea 1 se numește aproximare liniară, adică

Extinderea Taylor poate fi aplicată funcțiilor cu mai multe variabile. De exemplu, pentru o funcție Y = f (x 1, x 2) a două variabile, expansiunea liniară ar fi:

care poate fi scris, în notație matricială, ca

unde Y (0) este valoarea funcției la punctul x (0), cu componentele x 1 (0) și x 2 (0), iar A (0) este matricea derivatelor ale căror elemente sunt egale cu cea parțială derivate ale lui f (x 1, x 2) pentru a x 1, x 2 în punctul (x 1 (0), x 2 (0)).

Pentru a estima parametrii, extinderea funcției Y din seria Taylor se face în funcție de parametrii B și nu de vectorul X.

De exemplu, expansiunea liniară a lui Y = f (x, B) în B 1, B 2. B k, ar fi:

Y = f (xB) = f (x B (0)) + (B 1 -B 1 (0)) f / B 1 (xB (0)) +. +
(B 2 -B 2 (0)) f / B 2 (xB (0)) +. +. + (B k -B k (0)) f / B k (xB (0))

sau, în notație matricială, ar fi:

A = matrice de ordin (n, k) a derivatelor parțiale ale matricei f (xB) pentru vectorul B în punctul B (0) și

Apoi, funcția obiect va fi:

Pentru a obține minimul acestei funcții, este mai convenabil să se diferențieze & # 934 pentru vectorul & # 916B decât în ​​raport cu vectorul B și să îl puneți egal cu zero. Prin urmare:

Dacă & # 916B (0) este „egal cu zero”, atunci estimarea lui B este egală cu B (0).

(În practică, atunci când spunem „egal cu zero” în acest proces, înțelegem cu adevărat mai mic decât vectorul de aproximare pe care trebuie să-l definim în prealabil).

Dacă & # 916B (0) nu este „egal cu zero” atunci vectorul B (0) va fi înlocuit cu:

Și procesul va fi repetat, adică va exista o altă iterație cu B (0) înlocuit cu B (1) (și A (0) înlocuit cu A (1)). Procesul iterativ va continua până când se atinge convergența la nivelul dorit de aproximare.

1. Nu este garantat faptul că procesul converge întotdeauna. Uneori nu, alteori este prea lent (chiar și pentru computere!) Și alteori converge la altă limită !!

2. Metoda descrisă mai sus este metoda Gauss-Newton care stă la baza multor alte metode. Unele dintre aceste metode introduc modificări pentru a obține o convergență mai rapidă precum metoda Marquardt (1963), care este frecvent utilizată în cercetarea în domeniul pescuitului. Alte metode folosesc expansiunea Taylor de ordinul doi (metoda Newton-Raphson), în căutarea unei aproximări mai bune. Unele altele, combină cele două modificări.

3. Aceste metode necesită calcularea derivatelor funcțiilor. Unele programe de calculator necesită introducerea expresiilor matematice ale derivatelor, în timp ce altele utilizează subrutine cu aproximări numerice ale derivatelor.

4. În cercetarea în domeniul pescuitului, există metode de calcul al valorilor inițiale ale parametrilor, de exemplu în analize de creștere, mortalitate, selectivitate sau maturitate.

5. Este important să subliniem că convergența metodelor iterative este mai rapidă și mai probabilă să se apropie de limita adevărată atunci când valoarea inițială a vectorului B (0) este apropiată de valoarea reală.

7.4 ESTIMAREA PARAMETRILOR DE CREȘTERE

Metoda celor mai mici pătrate (regresie neliniară) permite estimarea parametrilor K, L & # 8734 și t o ale ecuațiilor de creștere individuale.

Valorile inițiale ale lui K, L & # 8734 și t 0 pentru procesul iterativ de estimare pot fi obținute prin regresie liniară simplă folosind următoarele metode:

Metode Ford-Walford (1933-1946) și Gulland și Holt (1959)

Expresiile Ford-Walford și Gulland și Holt, care au fost prezentate în secțiunea 3.4, sunt deja în forma lor liniară, permițând estimarea K și L & # 8734 cu metode de regresie liniară simplă pe L i și T i observate. Expresia Gulland și Holt permite estimarea lui K și L & # 8734 chiar și atunci când intervalele de timp T i nu sunt constante. În acest caz, este convenabil să rescrieți expresia ca:

Metoda Stamatopoulos și Caddy (1989)

Acești autori prezintă, de asemenea, o metodă de estimare a K, L & # 8734 și t o (sau L o) utilizând regresia liniară simplă. În acest caz, ecuația von Bertalanffy ar trebui să fie exprimată ca o relație liniară a L t față de e -Kt.

Se consideră n perechi de valori t i, L i unde t i este vârsta și L i lungimea individului i unde i = 1,2. n.

Ecuația von Bertalanffy, în forma sa generală este (așa cum s-a văzut anterior):

Ecuația are forma liniară simplă, y = a + bx, unde:

Dacă se ia L a = 0, atunci t a = t o, dar, dacă se ia în considerare t a = 0, atunci L a = L o.

Parametrii de estimat de la a și b vor fi L & # 8734, t o sau L o.

Autorii propun adoptarea unei valori inițiale K (0), a lui K și estimarea a (0), b (0) și r 2 (0) prin regresie liniară simplă între y (= L t) și x (= ek (0) )). Procedura poate fi repetată pentru mai multe valori ale lui K, adică K (1) K (2). Se poate adopta apoi regresia care are ca rezultat valoarea mai mare a r 2, căreia îi corespund K max, a max și b max. Din valorile a max, b max și K max se pot obține valorile parametrilor rămași.

Un proces practic pentru găsirea K max poate fi:

(i). Pentru a selecta două valori extreme ale lui K care includ valoarea necesară, de exemplu K = 0 și K = 2 (pentru dificultăți practice, utilizați K = 0,00001 în loc de K = 0).

(ii). Calculați cele 10 regresii pentru valori la distanțe egale ale K între aceste două valori la intervale regulate.

(iii). Cele 10 valori corespunzătoare ale lui r2 vor permite să selectați două noi valori ale lui K care determină un alt interval, mai mic decât cel din (i), conținând o altă valoare maximă a lui r2.

(iv). Etapele (ii) și (iii) pot fi repetate până când se obține un interval de valori ale lui K cu aproximarea dorită. În general, pașii nu au nevoie de multe repetări.

7.5 ESTIMAREA COEFICIENTULUI M - MORTALITATE NATURALĂ

Au fost propuse mai multe metode pentru estimarea M și se bazează pe asocierea lui M cu alți parametri biologici ai resursei. Aceste metode pot produce rezultate aproximative.

7.5.1 RELAȚIA M CU LONGEVITATEA,

Longevitate: vârsta medie maximă t & # 955 a indivizilor dintr-o populație neexploatată.

Durata vieții exploatabile: t & # 955 - t r = & # 955 (Figura 7.1)

Figura 7.1 Durata vieții exploatabile

Tanaka (1960) propune curbele de supraviețuire „NATURALE” (Figura 7.2) pentru a obține valorile lui M din longevitate.

O cohortă dispare practic când supraviețuiește doar o fracțiune, p, din indivizii recrutați. În acest caz, N & # 955 = R & # 183 e -M & # 183 & # 955 și se poate scrie:

Diferite valori ale fracției de supraviețuire produc diferite curbe de supraviețuire ale M în funcție de & # 955.

Figura 7.2 Curbele de supraviețuire de Tanaka

Orice valoare a lui p poate fi aleasă, de exemplu, p = 5% (adică unul din fiecare douăzeci de recruți supraviețuiește până la vârsta t & # 955) ca valoare variabilă a curbelor de supraviețuire.

7.5.2 RELAȚIA ÎNTRE M ȘI CREȘTERE

Metoda Beverton și Holt (1959)

Gulland (1969) menționează că Beverton și Holt au verificat că speciile cu o rată a mortalității mai mare M au prezentat și valori mai mari ale K. Căutând o relație simplă între acești doi parametri, au concluzionat aproximativ că:

Pe baza următoarelor considerații:

1. Resursele cu o rată ridicată a mortalității nu pot avea o dimensiune maximă foarte mare
2. În apele mai calde, metabolismul este accelerat, astfel încât indivizii pot crește până la o dimensiune mai mare și pot atinge dimensiunea maximă mai repede decât în ​​apele mai reci.

Pe baza datelor din 175 de specii, Pauly a ajustat regresiile liniare multiple ale valorilor transformate ale lui M față de valorile transformate corespunzătoare ale K, L & # 8734 și ale temperaturii, T și a selectat una care a fost considerată a avea o ajustare mai bună, adică următoarea relație empirică:

cu parametrii exprimați în următoarele unități:

M = anul -1
L & # 8734 = cm lungime totală
K = anul -1
T & # 176 = temperatura de suprafață a apelor în & # 176C

Pauly subliniază aplicarea acestei expresii la peștii pelagici mici și la crustacee. Relația Pauly folosește logaritmi zecimali pentru a prezenta primul coeficient diferit de valoarea -0.0152 care a fost dată în expresia anterioară, scrisă cu logaritmi naturali.

7.5.3 RELAȚIA ÎNTRE M ȘI REPRODUCERE

Metoda Rikhter și Efanov (1976)

Acești autori au analizat dependența dintre M și vârsta primei (sau 50 la sută) maturitate. Au folosit date de la specii de viață scurtă, medie și lungă și au sugerat următoarea relație a lui M cu, t mat, vârsta de 1 maturitate:

Pe baza presupunerii că rata mortalității naturale ar trebui să fie legată de investiția peștilor în reproducere, dincolo de influența altor factori, Gundersson a stabilit mai multe relații între M și acei factori.

El a propus, cu toate acestea, următoarea relație empirică simplă, utilizând indicele gonadosomatic (IGE) (estimat pentru femelele mature în perioada de reproducere) pentru a calcula M:

7.5.4 CUNOAȘTEREA STRUCTURII DE VÂRSTĂ, LA ÎNCEPUT ȘI LA SFÂRȘITUL ANULUI, ȘI PRINZĂ ÎN NUMĂR, PE VÂRSTĂ, ÎN TIMPUL ANULUI

Coeficienții naturali de mortalitate M i, la vârsta i, pot fi calculați din captură, C i, în numere, și numerele de supraviețuire, N i și N i + 1 la începutul și sfârșitul unui an, urmând pașii:

Cele câteva valori ale M obținute în fiecare vârstă ar putea fi combinate pentru a calcula o valoare constantă, M, pentru toate vârstele.

Să luăm în considerare presupunerea că F i este proporțional cu f i timp de câțiva ani i, adică

Deci, regresia liniară dintre Z i și f i are o pantă b = q și o interceptare a = M.

7.6 ESTIMAREA Z - COEFICIENTUL TOTAL AL ​​MORTALITĂȚII

Există mai multe metode de estimare a coeficientului total de mortalitate, Z, presupus a fi constant pe parcursul unui anumit interval de vârste sau ani.

Este convenabil să grupați metodele, în funcție de datele de bază, în cele care folosesc vârste sau cele care utilizează lungimi.

7.6.1 METODE FOLOSIND DATE DE VÂRSTĂ

Diferitele metode se bazează pe expresia generală a numărului de supraviețuitori ai unei cohorte, la momentul t, supuși mortalității totale, Z, într-un interval de timp, adică:

Z se presupune a fi constant în intervalul de timp (t a, t b).

Luând logaritmi și rearanjând termenii, expresia va fi:

unde Cte ​​este o constantă (= ln N a + Zt a).

Această expresie arată că logaritmul numărului de supraviețuitori este liniar cu vârsta, fiind panta egală cu -Z.

Orice expresie constantă care nu afectează determinarea lui Z va fi denumită Cte.

1. Dacă Z poate fi considerat constant în intervalul (ta, tb) și, având date disponibile despre abundență, N i sau indici de abundență în număr, U i în mai multe vârste, i, atunci, aplicarea regresiei liniare simple permite estimarea coeficientului total de mortalitate Z.

Regresia liniară simplă dintre și t i permite estimarea lui Z (observați că constanta, Cte este diferită de cea anterioară. În acest caz contează doar panta pentru a estima Z).

2. Dacă vârstele nu sunt la intervale constante, expresia ar putea fi aproximată și exprimată în termeni t centrali. Pentru variabila T i, aceasta va fi:

ln N i & # 8776 Cte - Z. t centrali

3. Când se utilizează indicii U i, situația este similară deoarece U i = q. N i, cu q constantă, și apoi, de asemenea:

Regresia liniară simplă între și t i permite estimarea lui Z.

4. Dacă intervalele nu sunt constante, expresia trebuie modificată astfel:

Regresia liniară simplă poate fi aplicată pentru a obține Z, din capturi, C i și vârste, t i, presupunând că F i este constant.

și așa, când T i este constant. Asa de:

5. Dacă intervalele nu sunt constante, expresia trebuie modificată astfel:

6. Fie V i captura cumulativă de la t i până la sfârșitul vieții, apoi:

Unde suma merge de la ultima vârstă până la vârsta I,

Deoarece F k și Z k ar trebui să fie constante & # 931N kcum = N i / Z și așa:

7. După Beverton și Holt (1956), Z poate fi exprimat ca:

Apoi, este posibil să se estimeze Z de la vârsta medie t

Această expresie a fost derivată, considerând intervalul (t a, t b) ca (t a, & # 8734).

7.6.2 METODE FOLOSIND DATELE DE LUNGIME

Când există date disponibile pe clase de lungime în loc de vârstă, metodele menționate anterior pot fi aplicate în continuare. În acest scop, este convenabil să se definească vârsta relativă.

Folosind ecuația von Bertalanffy se poate obține vârsta t în funcție de lungime, ca:

(expresia este scrisă în forma generală în raport cu t a și nu cu t 0)

(Această ecuație este denumită de unii autori drept ecuația inversă a lui Bertalanffy).

Diferența t-ta se numește vârstă relativă, t *,.

Deci: t * = - (1 / K) .ln [(L & # 8734 - L t) / (L & # 8734 - L a)] sau t * = - (1 / K) ln [1- (L t -L a) / (L & # 8734 - L a)]

t * se numește vârstă relativă, deoarece vârstele absolute, t, sunt legate de o vârstă constantă, t a.

În acest fel, durata intervalului T i poate fi calculată fie prin diferența vârstelor absolute, fie prin diferența vârstelor relative la extremele intervalului:

T i = t i + 1 -t i = t * i +1 - t * i

Deci, expresiile anterioare rămân valabile atunci când vârstele absolute sunt înlocuite cu vârstele relative:

ln N i = Cte - Z. t * centrali
ln U i = Cte - Z. t * centrali
ln V i = Cte - Z. t * i
ln C i / T i = Cte - Z. t * centrali

În cele din urmă, expresia ar fi, de asemenea,:

Beverton și Holt (1957) au demonstrat că:

trebuie calculată ca medie a lungimilor ponderate cu abundențe (sau cu indicii lor) sau cu capturile în număr.

1. Aplicarea oricăreia dintre aceste metode trebuie să fie precedată de reprezentarea grafică a datelor corespunzătoare, pentru a verifica dacă ipotezele metodelor sunt acceptabile sau nu și pentru a determina intervalul adecvat, (t a, t b).

2. Aceste formule sunt dovedite cu indicațiile care au fost prezentate, dar este un exercițiu bun să dezvolți demonstrațiile pe măsură ce clarifică metodele.

3. Este util să se estimeze o constantă Z, chiar și atunci când nu este acceptabilă, deoarece oferă o orientare generală cu privire la dimensiunea valorilor la care ne putem aștepta.

4. Metodele sunt uneori menționate prin numele autorilor. De exemplu, expresia ln V i = Cte - Z.t * i se numește metoda Jones și van Zalinge (1981).

5. Vârsta medie, precum și lungimea medie în captură pot fi calculate din următoarele expresii:

cu C i = captură în număr în clasa de vârstă i

unde C i = captură în număr în clasa de lungime i

cu C i = captură în număr în clasa de vârstă.

Vârsta relativă ar trebui să fie t * = - (1 / K) .ln [(L & # 8734 - L t) / (L & # 8734 - L a)]

Rezumatul metodelor de estimare a coeficientului total de mortalitate, Z

Presupunere: Z este constant în intervalul de vârste, (t a, t b)

(t b = & # 8734) (ecuația lui Beverton și Holt a lui Z)

Presupunere: Z este constant în intervalul de lungimi, (L a, L b)

(Ecuația Gulland și Holt)

(Ecuația lui Jones și van Zalinge)

(Ecuația lui Beverton și Holt a lui Z)

7.7 ESTIMAREA PARAMETRILOR RELAȚIEI STOC-RECRUTAMENT (S-R)

Metoda celor mai mici pătrate (model neliniar) poate fi utilizată pentru a estima parametrii, & # 945 și k, ai oricăruia dintre modelele S-R.

Valorile inițiale ale modelului Beverton și Holt (1957) pot fi obținute prin rescrierea ecuației ca:

și estimarea regresiei liniare simple între y (= S / R) și x (= S) care va da estimările 1 / & # 945 și 1 / (& # 945k). Din aceste valori, va fi posibil să se estimeze parametrii & # 945 și k. Aceste valori pot fi considerate drept valorile inițiale în aplicarea modelului neliniar.

În modelul Ricker (1954) parametrii pot fi obținuți prin rescrierea ecuației ca:

și aplicarea regresiei liniare simple între y (= ln R / S) și x (= S) pentru a estima ln & # 945 și (-1 / k). Din aceste valori, va fi posibil să se estimeze parametrii (& # 945 și k) ai modelului, care pot fi considerați ca valorile inițiale în aplicarea modelului neliniar.

Este util să se reprezinte graficul lui y față de x pentru a verifica dacă punctele marcate sunt ajustabile la o linie dreaptă înainte de a aplica regresia liniară în oricare dintre aceste modele.

În modelele cu parametrul flexibil, c, de exemplu, modelul Deriso (1980), ecuația poate fi rescrisă ca:

Pentru o valoare dată a lui c regresia liniară între y (= (R / S) c) și x (= S) permite estimarea parametrilor & # 945 și k.

Se pot încerca mai multe valori ale lui c pentru a verifica care va avea o ajustare mai bună cu linia y față de x, de exemplu, valorile lui c între -1 și 1.

Valorile astfel obținute pentru & # 945, k și c, pot fi considerate valori inițiale în aplicarea metodei iterative, pentru a estima parametrii & # 945, k și c ai modelului Deriso neliniar.

7.8 ESTIMAREA MATRICEI [F] ȘI A MATRICEI [N] -ANALIZA COORTĂ - AC ȘI LCA

7.8.1 ANALIZA COHORTULUI PE VÂRSTĂ (AC)

Analiza cohortei este o metodă de estimare a coeficienților de mortalitate la pescuit, F i, și a numărului de supraviețuitori, N i, la începutul fiecărei vârste, din structurile anuale ale stocului de capturi, în număr, pe o perioadă de ani.

Mai precis, luați în considerare un stoc în care sunt cunoscute următoarele:

vârsta, i, unde i = 1,2. k
an, j, unde j = 1,2. n
Matricea capturilor [C] cu
C i, j = Captură anuală, în număr, a indivizilor cu vârsta i și în cursul anului j
Matricea mortalității naturale [M] cu
M i, j = coeficientul natural de mortalitate, la vârsta i și în anul j.
Vectorul [T] unde
T i = Dimensiunea intervalului de vârstă i (în general, T i = T = 1 an)

În rezolvarea acestei probleme, este convenabil să se ia în considerare aceste estimări separat un interval de vârstă i (partea 1) toate vârstele din timpul vieții unei cohorte (partea 2) și, în cele din urmă, toate vârstele și anii (partea 3).

Să considerăm că sunt cunoscute următoarele caracteristici ale unei cohorte, într-un interval T i:

C i = Captarea numărului
M i = Coeficientul natural de mortalitate
T i = Dimensiunea intervalului

Adoptând o valoare F i, este posibil apoi să se estimeze numărul de supraviețuitori la început, N i, iar la sfârșit, N i + 1, a intervalului.

De fapt, din expresia:

se poate calcula N i care este singura variabilă necunoscută din expresie.

Pentru a calcula N i + 1 se poate utiliza expresia în care valorile N i, F i și M i au fost obținute anterior.

Să presupunem acum că sunt cunoscute capturile C i ale fiecărei vârste i, ale unei cohorte în timpul vieții sale, valorile lui M i și mărimile intervalului T i.

Adoptând o anumită valoare, F finală, pentru coeficientul de mortalitate prin pescuit în ultima clasă de vârstă, este posibil, așa cum s-a menționat în partea 1, să se estimeze toți parametrii (legați de numere) din acea ultimă grupă de vârstă. În acest fel, se va cunoaște numărul de supraviețuitori la începutul și sfârșitul ultimei epoci.

Numărul de la începutul ultimei clase de vârstă este, de asemenea, numărul N ultimul la sfârșitul clasei anterioare, adică N final este numărul inițial de supraviețuitori ai clasei înainte de ultima.

Folosind expresia C i, rezultată din combinația celor două expresii de mai sus:

se poate estima F i în clasa anterioară, care este singura variabilă necunoscută din expresie. Estimarea poate necesita metode iterative sau metode de încercare și eroare.

În cele din urmă, pentru a estima numărul N i de supraviețuitori la începutul clasei i, se poate utiliza următoarea expresie:

Repetând acest proces pentru toate clasele anterioare, se vor obține succesiv parametrii la toate vârstele, până la prima vârstă.

În cazul unei cohorte complet capturate, numărul de la sfârșitul ultimei clase este zero și captura C trebuie exprimată ca:

Pope (1972) a prezentat o metodă simplă de estimare a numărului de supraviețuitori la începutul fiecărei epoci a vieții de cohortă, începând cu ultima epocă.

Este suficient să aplicați succesiv într-un mod invers, expresia:

Papa indică faptul că aproximarea este bună atunci când MT & # 8804 0,6

Se obține expresia lui Pope & # 8217, presupunând că captura se face exact în punctul central al intervalului T i (Figura 7.3).

Figura 7.3 Numărul de supraviețuitori în intervalul T i = t i + 1 - t i cu captura extrasă în punctul central al intervalului

Procedând de la sfârșit până la început, se calculează succesiv:

înlocuind N & # 8217 cu N "+ C i, expresia va fi:

În cele din urmă, înlocuind N "cu N i + 1 .e + MTi / 2, acesta va fi:

Să presupunem acum că matricea Catch [C], matricea naturală a mortalității [M] și dimensiunea vectorială a intervalelor [T] sunt cunoscute pentru o perioadă de ani.

Să presupunem, de asemenea, că au fost adoptate valorile lui F în ultima vârstă a tuturor anilor reprezentați în matrice și valorile lui F din toate vârstele anului trecut. Aceste valori vor fi desemnate de terminalul F (Figura 7.4)

Figura 7.4 Matrice de captură, [C], cu terminal F în ultima linie și în ultima coloană a matricei C. Zonele umbrite exemplifică capturile unei cohorte

Observați că în această matrice elementele diagonalei corespund valorilor aceleiași cohorte, deoarece un element de o anumită vârstă și un anumit an va fi urmat, în diagonală, de elementul care este cu un an mai vechi.

Din părțile 1 și 2 va fi posibil apoi să se estimeze succesiv Fs și Ns pentru toate cohortele prezente în matricea de captură.

1. Valorile lui M i, j sunt considerate constante și egale cu M, atunci când nu există informații pentru a adopta alte valori.

2. Când datele sunt referite la vârste, valorile T i vor fi egale cu 1 an.

3. Ultima grupă de vârstă a fiecărui an este, uneori vârste grupate (+). Capturile corespunzătoare sunt compuse din indivizi capturați în acei ani, cu mai multe vârste. Deci, valorile cumulative nu aparțin acelorași cohorte, ci sunt supraviețuitori ai mai multor cohorte anterioare cu recrutări diferite și supuși unor modele de pescuit diferite. Nu ar fi potrivit să se utilizeze captura unui grup (+) și să se aplice analiza cohortei. În ciuda acestui fapt, grupul (+) este important pentru a calcula totalurile anuale ale capturilor în greutate, Y, a biomasei totale, B și a biomasei stocului de reproducere. Deci, este obișnuit să începeți cu analiza cohortei la vârsta imediat înainte de grup (+) și să utilizați grupul (+) numai pentru a calcula anualele Y, B și (SP). Valoarea F din acel grup (+) în fiecare an, poate fi estimată ca fiind același coeficient de mortalitate prin pescuit ca vârsta anterioară sau, în unele cazuri, ca fiind o valoare rezonabilă în raport cu valorile F i din an asta se ia în considerare.

4. O dificultate în aplicația tehnică apare atunci când numărul de vârste este mic sau când anii sunt puțini. De fapt, în aceste cazuri, cohortele au puține clase de vârstă reprezentate în Matrice [C] și estimările vor fi foarte dependente de valorile adoptate ale terminalelor F.

5. Analiza cohortei (CA) a fost, de asemenea, desemnată ca: VPA (Analiza populației virtuale), metoda Derzhavin, metoda Murphy, metoda Gulland, metoda Pope, analiza secvențială etc. Uneori, CA este menționată atunci când formula Pope și VPA sunt utilizate în alte cazuri. Megrey (1989) prezintă o revizuire foarte completă a analizelor de cohortă.

6. De asemenea, este posibil să se estimeze parametrii rămași într-o vârstă i, legată de numere, adică N cumi, N i, D i, Z i și E i. Când sunt disponibile informațiile despre matricile inițiale individuale sau de greutate medie [w] sau [w], se pot calcula și matricile de captură anuală în greutate [Y], de biomasă la începutul anilor, [B] și de biomasa medie pe parcursul anilor [B]. Dacă există informații despre ogivele de maturitate în fiecare an, de exemplu la începutul anului, pot fi calculate și biomasele de reproducere [SP]. De obicei, se estimează numai capturile totale Y, biomasele stoc (total și reproducere) la început și biomasele medii ale stocului (total și reproducere) în fiecare an.

7. Elementele de pe prima linie a matricei [N] pot fi considerate estimări ale recrutării în sectorul piscicol în fiecare an.

8. Faptul că sunt adoptate terminalele F și că aceste valori influențează matricea [F] și matricea [N] rezultate, obligă selecția valorilor terminalelor F să fie aproape de cele reale. Acordul dintre estimările parametrilor menționați la punctele 6. și 7. și alte date sau indici independenți (de exemplu, estimări prin metode acustice de recrutare sau biomasă, estimări ale indicilor de abundență sau CPU & # 180, ale eforturilor de pescuit etc.) ) trebuie analizate.

9. Ipoteza că modelul de exploatare este constant de la an la an, înseamnă că nivelul de pescuit și modelul de exploatare pot fi separate, sau F sepi = F j x s i. Această ipoteză poate fi testată pe baza matricei [F] obținută din analiza cohortei.

Este obișnuit să numim această separare VPA-Separable (SVPA).

Atunci, dacă F ij = F j .s i se poate dovedi asta.

Dacă valorile estimate ale lui F ij sunt aceleași cu Fsep ij = F j .s i anterior, atunci se verifică ipoteza. Această comparație poate fi realizată în două moduri diferite, cel mai simplu este să calculați coeficienții Fsep ij / F ij. Dacă ipoteza este adevărată, acest coeficient este egal cu unul. Dacă ipoteza nu este verificată, este întotdeauna posibil să se ia în considerare alte ipoteze cu vectorul [s] anual constant în câțiva ani, în principal în ultimii ani.

10. Este obișnuit să se ia în considerare un interval de vârstă, în care se poate presupune că indivizii prinși sunt „complet recrutați”. În acest caz, intervalul de vârstă corespunde constantului modelului de exploatare (pentru vârstele rămase, care nu sunt complet recrutați, modelul de exploatare ar trebui să fie mai mic). Pentru acel interval de vârste, se calculează apoi valorile lui F i, j în fiecare an. Aceste mijloace, F j, sunt considerate niveluri de pescuit în anii respectivi. Modelul de exploatare din fiecare celulă ar fi atunci raportul F i, j / F j. S i, pentru perioada de ani luată în considerare, poate fi luată ca medie a modelului relativ de exploatare calculat anterior. Alternativ, ele pot fi luate ca referindu-se la s i a unei vârste alese ca referință.

7.8.2 ANALIZA COHORTULUI DE LUNGIME - (LCA)

Tehnica ansalizei cohortei, aplicată structurii capturilor unei cohorte în timpul vieții sale, poate fi realizată cu intervale de timp neconstante, T i,. Aceasta înseamnă că structura claselor de lungime a capturilor unei cohorte în timpul vieții sale, poate fi, de asemenea, analizată.

Metodele de analiză a cohortei în aceste cazuri se numesc LCA (L ength C ohort A nalysis). Aceleași tehnici metoda Pope, metoda iterativă, etc, a AC pentru vârste, pot fi aplicate analizei LCA (intervalele T i & # 180s pot fi calculate din vârstele relative).

O modalitate de a aplica LCA compozițiilor anuale de capturi de lungime va fi: gruparea capturilor din clasele de lungime aparținând aceluiași interval de vârstă în fiecare an. Tehnica CA poate fi apoi aplicată direct compoziției de vârstă rezultate a capturilor după vârsta matricei [C]. Această tehnică este cunoscută sub numele de „feliere” a compozițiilor de lungime. Pentru a „tăia”, de obicei se inversează ecuația de creștere a lungimii von Bertalanffy și se estimează vârsta t i pentru fiecare lungime L i (uneori folosind vârstele relative t * i) (Figura 7.5). Este posibil ca atunci când grupați clasele de lungime ale intervalului de vârstă respectiv, să existe clase de lungime compuse din elemente care aparțin a două grupe de vârstă consecutive. În aceste cazuri, va fi necesar să „rupem” captura acestor clase extreme în două părți și să le distribuim fiecărei acele vârste. În exemplul din Figura 7.5, capturile clasei de lungime (24-26] aparțin vârstei 0 și vârstei 1. Deci, este necesar să distribuiți captura celor două vârste. O metodă simplă este de a atribui vârsta 0 fracția (1,00 - 0,98) / (1,06 - 0,98) = 0,25 din captura anuală a acelei clase de lungime și la vârsta de 1 fracția (1,06 - 1,00) / (1,06 - 0,98) = 0,75. Metoda poate să nu fie cea mai adecvat, deoarece se bazează pe presupunerea că, în clasele de lungime, distribuția indivizilor după lungime este uniformă. Prin urmare, este necesar să se utilizeze cel mai mic interval posibil de clase de lungime, atunci când se aplică această tehnică de distribuție.

O altă modalitate de a face analiza cohortei de lungime este folosirea capturilor în clasele de lungime din aceeași grupă de vârstă. Este posibil să urmăriți cohortele din matrice [C], prin clasele de lungime aparținând aceleiași vârste, într-un anumit an, cu clasele de lungime ale vârstei următoare, în anul următor etc. În acest fel, diferite cohorte existente în matrice vor fi separate și evoluția fiecăreia dintre ele va fi pe clase de lungime, nu pe vârstă (vezi Figura 7.5).

Figura 7.5 Exemplu de matrice [C] cu capturile cohortei umbrite, scrise cu caractere aldine, recrutate în anul 2000, „tăiate” pe clase de lungime,


Proiectați mișcări la sol

Inginerii ar trebui să utilizeze de obicei instrumentele de mai jos pentru proiectarea seismică, valorile parametrilor pe care le furnizează nu sunt de obicei identice cu cele din instrumentele de pericol disponibile în altă parte pe site-ul USGS.

USGS colaborează cu organizații care dezvoltă coduri de construcție (pentru clădiri, poduri și alte structuri) pentru a pune la dispoziția inginerilor valorile parametrilor de proiectare seismică. Dezvoltatorii de coduri de proiectare decid mai întâi cum ar trebui aplicate informațiile despre pericolul cutremurului USGS în practica de proiectare. Apoi, USGS calculează valorile parametrilor de proiectare seismică pe baza valorilor de pericol USGS și în conformitate cu procedurile codului de proiectare.

Servicii Web Hărți Seismice din SUA

Datorită resurselor insuficiente și dezvoltării recente a unor instrumente web similare de către terți, USGS și-a înlocuit fostele aplicații web din SUA Seismic Design Maps cu servicii web care pot fi utilizate prin instrumente terțe. Opțiunile dvs. pentru utilizarea serviciilor web de înlocuire USGS, care oferă în continuare valori de parametri seismici de proiectare din numeroase ediții de coduri de proiectare, sunt:

Interfețe grafice de utilizator terțe (GUI)

Majoritatea utilizatorilor obțin valori ale parametrilor de proiectare seismică din serviciile web USGS prin interfețe grafice terțe, cum ar fi următoarele:

Servicii Web USGS SUA Design Hărți Seismice

Este posibil, dar mai puțin convenabil, să se obțină valori ale parametrilor de proiectare seismică direct din serviciile web USGS:

Calculator de mișcare la sol orientat spre risc

Acest instrument web calculează valorile mișcării la sol orientate spre risc din curbele probabilistice de pericol seismic în conformitate cu procedurile de mișcare la sol specifice locului definite în „Metoda 2” (Secțiunea 21.2.1.2) din ASCE / SEI 7-10 și 7-16 standarde. Marea majoritate a proiectelor de inginerie din SUA vor necesita utilizarea Servicii Web Hărți Seismice din SUA (vezi mai sus) mai degrabă decât aceasta Calculator de mișcare la sol orientat spre risc.

Seturi de date de proiectare seismică (format fișier text)

Hărți de proiectare seismică (format PDF)

Hărțile de proiectare seismică din diverse documente de referință ale codului de proiectare sunt disponibile mai jos ca fișiere PDF.


Se pare că există trei întrebări aici:

Distribuția efectivă a cazurilor este gaussiană? Nu.

Curbele sunt date în graficul Gaussian? Nu chiar. Cred că cel roșu este puțin înclinat, iar cel albastru este cu siguranță înclinat.

Pot fi considerate parcele cu valoare în funcție de timp gaussiene? Da.

În matematică, o funcție gaussiană, denumită pur și simplu ca gaussiană, este o funcție de forma $ f (x) = ae ^ <- < frac <(xb) ^ <2>> <2c ^ <2>> >> $ pentru constante reale arbitrare a, b și non zero c.

Nu există nicio cerință ca aceasta să fie o distribuție de probabilitate.

Nu în sensul unui gaussian probabilitate distribuție: curba clopotului unei distribuții normale (gaussiene) este a histogramă (o hartă a densității probabilității în raport cu valorile unei singure variabile), dar curbele pe care le citați sunt (după cum observați) o hartă a valorilor unei variabile (cazuri noi) în raport cu o a doua variabilă (timp). (@Accumulation și @TobyBartels subliniază că curbele Gauss sunt constructe matematice care ar putea să nu aibă legătură cu distribuțiile de probabilitate având în vedere că puneți această întrebare în statistica SE, am presupus că abordarea Gaussian distribuție a fost o parte importantă a răspunsului la întrebare.)

Valorile posibile dintr-o distribuție normală se extind de la $ - infty $ la $ infty $, dar an curba epidemiei nu poate avea valori negative pe y axa și călătorind suficient de departe la stânga sau la dreapta pe X ax, veți rămâne fără cazuri, fie pentru că boala nu există, fie pentru că Homo sapiens nu exista.

Distribuțiile normale sunt continue, dar fenomenele măsurate de curbele epidemiilor sunt de fapt discret nu continuu: reprezintă cazuri noi în timpul fiecărei unități discrete de timp. Deși putem împărți timpul în unități semnificative mai mici (într-o anumită măsură), ajungem în cele din urmă la faptul că indivizii cu infecții noi sunt date de numărare (discrete).

Distribuțiile normale sunt simetrice în ceea ce privește media lor, dar, în ciuda desenului animat care transmite un mesaj util de sănătate publică despre necesitatea aplatizării curbei, curbele epidemice reale sunt frecvent înclinate spre dreapta, cu cozile lungi și subțiri, așa cum se arată mai jos.

Distribuțiile normale sunt unimodale, dar curbele epidemice reale pot prezenta una sau mai multe denivelări (adică pot fi multimodale, pot chiar, ca în răspunsul @SextusEmpiricus, să fie endemice unde se întorc ciclic).

În cele din urmă, iată o curbă epidemică pentru COVID-19 în China, puteți vedea că curba diferă în general de curba Gaussiană (desigur, există probleme cu fiabilitatea datelor, dat fiind că multe cazuri nu au fost numărate):


Puteți utiliza scipy.optimize.curve_fit: Această metodă nu returnează numai valorile optime estimate ale parametrilor, ci și matricea de covarianță corespunzătoare:

Valori optime pentru parametri, astfel încât suma reziduurilor pătrate ale f (xdata, * popt) - ydata să fie redusă la minimum

Covarianța estimată a poptului. Diagonalele oferă varianța estimării parametrilor. Pentru a calcula o eroare de deviere standard pe parametri utilizați perr = np.sqrt (np.diag (pcov)).

Modul în care parametrul sigma afectează covarianța estimată depinde de argumentul absolute_sigma, așa cum este descris mai sus.

Dacă matricea iacobiană a soluției nu are un rang complet, atunci metoda „lm” returnează o matrice umplută cu np.inf, pe de altă parte metodele „trf” și „dogbox” folosesc pseudoinversa Moore-Penrose pentru a calcula covarianța matrice.

Puteți calcula erorile de deviație standard ale parametrilor din rădăcinile pătrate ale elementelor diagonale ale matricei de covarianță după cum urmează:


Priveste filmarea: SEE2 - P01- Definire curbe de sarcina in Power Factory (Ianuarie 2022).