Wednesday, October 26, 2016

Moving Average In Tydreeksanalise

Wat is 'n bewegende gemiddelde Die eerste bewegende gemiddelde is 4310, wat is die waarde van die eerste waarneming. (In tydreeksanalise, die eerste getal in die reeks bewegende gemiddeldes is nie bereken is dit 'n vermiste waarde.) Die volgende bewegende gemiddelde is die gemiddeld van die eerste twee waarnemings, (4310 4400) / 2 4355. Die derde bewegende gemiddelde is die gemiddelde van waarneming 2 en 3, (4400 4000) / 2 4200, en so aan. As jy wil 'n bewegende gemiddelde lengte 3 gebruik, is drie waardes gemiddeld in plaas van twee. Kopiereg 2016 Minitab Inc.. Deur die gebruik van hierdie webwerf stem jy in om die gebruik van koekies vir analise en persoonlike inhoud. Lees ons policySmoothing data verwyder ewekansige variasie en programme tendense en sikliese komponente Inherent in die versameling van data geneem met verloop van tyd is 'n vorm van ewekansige variasie. Daar bestaan ​​metodes vir die vermindering van van die kansellasie van die effek as gevolg van ewekansige variasie. 'N dikwels gebruikte tegniek in bedryf is glad. Hierdie tegniek, wanneer dit behoorlik toegepas word, blyk duidelik die onderliggende tendens, seisoenale en sikliese komponente. Daar is twee afsonderlike groepe glad metodes Berekening van gemiddelde metodes Eksponensiële Smoothing Metodes Neem gemiddeldes is die eenvoudigste manier om data te stryk Ons sal eers ondersoek sommige gemiddelde metodes, soos die eenvoudige gemiddeld van al die afgelope data. 'N Bestuurder van 'n pakhuis wil weet hoeveel 'n tipiese verskaffer lewer in 1000 dollar eenhede. Hy / sy neem 'n monster van 12 verskaffers, na willekeur, die verkryging van die volgende resultate: Die berekende gemiddelde of gemiddeld van die data 10. Die bestuurder besluit om dit te gebruik as die skatting vir uitgawes van 'n tipiese verskaffer. Is dit 'n goeie of slegte skat Gemiddelde kwadraat fout is 'n manier om te oordeel hoe goed 'n model is Ons sal bereken die gemiddelde kwadraat fout. Die fout ware bedrag wat minus die beraamde bedrag. Die fout vierkant is die fout hierbo, vierkantig. Die SSE is die som van die gekwadreerde foute. Die MSE is die gemiddeld van die kwadraat foute. MSE lei byvoorbeeld Die uitslae is: Fout en gekwadreerde foute Die raming 10 Die vraag ontstaan: kan ons gebruik maak van die gemiddelde inkomste voorspel as ons vermoed dat 'n tendens 'n blik op die grafiek hieronder toon duidelik dat ons nie dit sou doen. Gemiddeld weeg al verlede Waarnemings ewe In opsomming, ons verklaar dat die eenvoudige gemiddelde of gemiddeld van al verlede waarnemings is net 'n nuttige skatting vir vooruitskatting wanneer daar geen tendense. As daar tendense, gebruik verskillende skattings dat die tendens in ag neem. Die gemiddelde weeg al verlede Waarnemings ewe. Byvoorbeeld, die gemiddelde van die waardes 3, 4, 5 is 4. Ons weet natuurlik dat 'n gemiddelde word bereken deur die toevoeging van al die waardes en die som te deel deur die aantal waardes. Nog 'n manier van berekening van die gemiddelde is deur die byvoeging van elke waarde gedeel deur die aantal waardes, of 3/3 4/3 5/3 1 1,3333 1,6667 4. Die vermenigvuldiger 1/3 is die gewig genoem. In die algemeen: bar frac som links (frac regs) x1 links (frac regs) x2,. ,, Links (frac regs) xn. Die (links (frac regs)) is die gewigte en, natuurlik, hulle vat om 1.Wanneer berekening 'n lopende bewegende gemiddelde, die plasing van die gemiddelde in die middel tydperk sinvol in die vorige voorbeeld het ons bereken die gemiddeld van die eerste 3 tydperke en sit dit langs tydperk 3. Ons kan die gemiddelde in die middel van die tyd interval van drie periodes geplaas, dit is, langs tydperk 2. dit werk goed met vreemde tydperke, maar nie so goed vir nog tyd tydperke. So waar sou ons plaas die eerste bewegende gemiddelde wanneer M 4 Tegnies, sou die bewegende gemiddelde op t 2.5, 3.5 val. Om hierdie probleem wat ons glad Mas using 2. So glad ons die stryk waardes As ons gemiddeld 'n gelyke getal terme te vermy, moet ons die stryk waardes glad Die volgende tabel toon die resultate met behulp van M 4.Moving Gemiddeld - MA afbreek bewegende gemiddelde - MA As SMA voorbeeld, kyk na 'n sekuriteit met die volgende sluitingsdatum pryse meer as 15 dae: Week 1 (5 dae) 20, 22, 24, 25, 23 Week 2 (5 dae) 26, 28, 26, 29, 27 Week 3 (5 dae) 28, 30, 27, 29, 28 A 10-dag MA sou gemiddeld uit die sluitingsdatum pryse vir die eerste 10 dae as die eerste data punt. Die volgende data punt sal daal die vroegste prys, voeg die prys op dag 11 en neem die gemiddelde, en so aan, soos hieronder getoon. Soos voorheen verduidelik, MA lag huidige prys aksie omdat dit gebaseer is op vorige pryse hoe langer die tydperk vir die MA, hoe groter is die lag. So sal 'n 200-dag MA 'n veel groter mate van lag as 'n 20-dag MA het omdat dit pryse vir die afgelope 200 dae bevat. Die lengte van die MA om te gebruik, hang af van die handel doelwitte, met korter MA gebruik vir 'n kort termyn handel en langer termyn MA meer geskik vir 'n lang termyn beleggers. Die 200-dag MA word wyd gevolg deur beleggers en handelaars, met onderbrekings bo en onder hierdie bewegende gemiddelde beskou as belangrike handel seine wees. MA ook mee belangrik handel seine op hul eie, of wanneer twee gemiddeldes kruis. 'N stygende MA dui daarop dat die sekuriteit is in 'n uptrend. terwyl 'n dalende MA dui daarop dat dit in 'n verslechtering neiging. Net so, is opwaartse momentum bevestig met 'n lomp crossover. wat gebeur wanneer 'n korttermyn-MA kruisies bo 'n langer termyn MA. Afwaartse momentum bevestig met 'n lomp crossover, wat plaasvind wanneer 'n kort termyn MA kruisies onder 'n langer termyn MA. Moving gemiddeldes bewegende gemiddeldes Met konvensionele datastelle die gemiddelde waarde is dikwels die eerste, en een van die mees bruikbare, opsommingstatistiek te bereken. Wanneer data in die vorm van 'n tydreeks, die reeks beteken is 'n nuttige maatstaf, maar nie die dinamiese aard van die data weerspieël. Gemiddelde waardes bereken oor kortsluiting periodes, hetsy voor die huidige tydperk of gesentreer op die huidige tydperk, is dikwels meer nuttig. Omdat so 'n gemiddelde waardes sal wissel, of beweeg, soos die huidige tydperk beweeg van tyd t 2, t 3. ens staan ​​hulle bekend as bewegende gemiddeldes (Mas). 'N Eenvoudige bewegende gemiddelde is (tipies) die ongeweegde gemiddelde van k voor waardes. 'N eksponensieel geweeg bewegende gemiddelde is in wese dieselfde as 'n eenvoudige bewegende gemiddelde, maar met bydraes tot die gemiddelde geweegde deur hul nabyheid aan die huidige tyd. Want daar is nie een nie, maar 'n hele reeks bewegende gemiddeldes vir enige gegewe reeks, die stel van Mas kan hulself getrek word op grafieke, ontleed as 'n reeks, en gebruik in die modellering en voorspelling. 'N verskeidenheid van modelle kan gebou word met behulp van bewegende gemiddeldes, en dit is bekend as MA modelle. As sulke modelle word gekombineer met outoregressiewe (AR) modelle die gevolglike saamgestelde modelle is bekend as ARMA of ARIMA modelle (die Ek is vir geïntegreerde). Eenvoudige bewegende gemiddeldes Sedert 'n tydreeks kan as 'n stel waardes beskou word,, t 1,2,3,4, N die gemiddeld van hierdie waardes kan bereken word. As ons aanvaar dat N is nogal groot, en ons kies 'n heelgetal k wat is veel kleiner as n. kan ons 'n stel van blok gemiddeldes, of eenvoudig bewegende gemiddeldes (van orde k) bereken: Elke maat verteenwoordig die gemiddelde van al die datawaardes oor 'n interval van k waarnemings. Let daarop dat die eerste moontlike MA van orde k gt0 is dat vir t k. Meer in die algemeen kan ons die ekstra onderskrif val in die uitdrukkings bo en skryf: Dit bepaal dat die geskatte gemiddelde op tydstip t is die eenvoudige gemiddelde van die waargeneem waarde op tydstip t en die voorafgaande k -1 tyd stappe. As gewigte word toegepas wat die bydrae van waarnemings wat verder weg in die tyd is verminder, is die bewegende gemiddelde gesê eksponensieel word stryk. Bewegende gemiddeldes word dikwels gebruik as 'n vorm van vooruitskatting, waardeur die beraamde waarde vir 'n reeks op tydstip t 1, S T1. geneem word as die MA vir die tydperk tot en met tyd t. bv vandag se skatting is gebaseer op 'n gemiddelde van vorige aangeteken waardes tot en met gister se (vir daaglikse data). Eenvoudige bewegende gemiddeldes kan gesien word as 'n vorm van gladstryking. In die onderstaande diagram getoon word byvoorbeeld het die lugbesoedeling dataset getoon in die inleiding tot hierdie onderwerp is aangevul deur 'n 7-daagse bewegende gemiddelde (MA) reël, hier in rooi. Soos gesien kan word, die MA lyn glad uit die pieke en trôe in die data en kan baie nuttig wees in die identifisering van tendense wees. Die standaard toekomsgerigte berekening formule beteken dat die eerste k -1 datapunte het geen MA waarde, maar daarna berekeninge uit te brei na die finale data punt in die reeks. PM10 daaglikse gemiddelde waardes, Greenwich bron: London Luggehalte Network, www. londonair. org. uk Een rede vir die berekening van eenvoudige bewegende gemiddeldes op die voorgeskrewe wyse, is dat dit in staat stel om waardes te bereken vir alle tydgleuwe van tyd tk tot op hede en as 'n nuwe meting verkry vir tyd t 1, die MA vir tyd t 1 kan die reeds bereken stel bygevoeg. Dit bied 'n eenvoudige prosedure vir 'n dinamiese datastelle. Daar is egter 'n paar probleme met hierdie benadering. Dit is redelik om te argumenteer dat die gemiddelde waarde van die afgelope 3 periodes, sê, moet geleë wees op tyd t -1, nie tyd t. en vir 'n MA oor 'n gelyke getal periodes miskien is dit moet geleë wees by die middelpunt tussen twee tyd intervalle. 'N oplossing vir hierdie probleem is om gesentreer MA berekeninge, waarin die MA op tydstip t is die gemiddeld van 'n simmetriese stel waardes rondom t gebruik. Ten spyte van die ooglopende meriete, is hierdie benadering nie oor die algemeen gebruik word, want dit vereis dat data is beskikbaar vir toekomstige gebeure, wat nie die geval mag wees. In gevalle waar analise is geheel en al van 'n bestaande reeks, kan die gebruik van gesentreer Mas beter wees. Eenvoudige bewegende gemiddeldes kan beskou word as 'n vorm van gladstryking, die verwydering van 'n paar hoë frekwensie komponente van 'n tydreeks en beklemtoon (maar nie die verwydering van) tendense in 'n soortgelyke wyse as die algemene opvatting van digitale filter. Inderdaad, bewegende gemiddeldes is 'n vorm van lineêre filter. Dit is moontlik om 'n bewegende gemiddelde berekening van toepassing op 'n reeks wat reeds stryk, dit wil sê glad of filter 'n reeds stryk reeks. Byvoorbeeld, met 'n bewegende gemiddelde van orde 2, ons kan dit beskou as synde bereken met behulp van gewigte, sodat die MA by x 2 0.5 x 1 0.5 x 2. Net so, die MA by x 3 0.5 x 2 0.5 x 3. As ons dien 'n tweede vlak van gladstryking of filter, ons het 0,5 x 2 0.5 x 3 0.5 (0.5 x 1 0.5 x 2) 0.5 (0.5 x 2 0.5 x 3) 0.25 x 1 0.5 x 2 0,25 x 3 dws die 2-stadium filter proses (of konvolusie) het 'n wisselvallig geweegde simmetriese bewegende gemiddelde, met gewigte vervaardig. Veelvuldige konvolusie kan ingewikkeld geweegde bewegende gemiddeldes, waarvan sommige is gevind veral gebruik in gespesialiseerde velde, soos in lewensversekering berekeninge te produseer. Bewegende gemiddeldes gebruik kan word om periodieke effekte verwyder indien bereken met die lengte van die periodisiteit as 'n bekende. Byvoorbeeld, met 'n maandelikse data seisoenale variasies dikwels verwyder kan word (indien dit die doel) deur toe te pas 'n simmetriese 12 maande bewegende gemiddelde met al maande gelyke gewigte, behalwe die eerste en laaste wat geweeg deur 1/2. Dit is omdat daar sal 13 maande in die simmetriese model (huidige tyd, t / -. 6 maande). Die totale is gedeel deur 12. Soortgelyke prosedures kan vir enige goed gedefinieerde periodisiteit word aangeneem. Eksponensieel geweeg bewegende gemiddeldes (EWMA) Met die eenvoudige bewegende gemiddelde formule: alle waarnemings is ewe geweegde. As ons noem hulle die gelyke gewigte, Alpha t. elk van die k gewigte sou gelyk 1 / k. sodat die som van die gewigte sal wees 1, en die formule sou wees: Ons het reeds gesien dat verskeie programme van hierdie proses lei tot die gewigte wissel. Met eksponensieel geweeg bewegende gemiddeldes die bydrae tot die gemiddelde waarde van waarnemings wat meer verwyder betyds beraadslaag verminder, en sodoende meer onlangse (plaaslike) gebeure beklemtoon. In wese 'n glad parameter, 0lt Alpha LT1, is bekend gestel, en die formule hersien om 'n simmetriese weergawe van hierdie formule van die vorm sal wees: As die gewigte in die simmetriese model is gekies as die terme van die bepalings van die binomiale uitbreiding, (1/21/2) 2S. hulle sal vat om 1, en as Q groot word, sal die normaalverdeling benader. Dit is 'n vorm van kern gewig, met die Binomiale optree as die kern funksie. Die twee stadium konvolusie in die vorige subartikel beskryf is juis hierdie reëling, met Q 1, opbrengs die gewigte. In eksponensiële gladstryking is dit nodig om 'n stel gewigte gebruik wat som tot 1 en wat verminder in grootte meetkundig. Die gewigte gebruik is tipies van die vorm: Om te wys dat hierdie gewigte op te som tot 1, oorweeg die uitbreiding van 1 / as 'n reeks. Ons kan skryf en die uitdrukking in hakies gebruik te maak van die binomiale formule (1- x) p brei. waar x (1-) en p -1, wat gee: Dit bied dan 'n vorm van geweegde bewegende gemiddelde van die vorm: Hierdie opsomming kan geskryf word as 'n herhaling verhouding: wat berekening grootliks vereenvoudig, en vermy die probleem wat die gewig regime moet streng oneindige wees vir die gewigte op te som tot 1 (vir klein waardes van alfa. hierdie is tipies nie die geval). Die notasie wat gebruik word deur verskillende skrywers wissel. Sommige gebruik die letter S aan te dui dat die formule is in wese 'n reëlmatige veranderlike, en skryf: terwyl die beheerteorie literatuur gebruik dikwels Z eerder as S vir die eksponensieel geweeg of glad waardes (sien, byvoorbeeld, Lucas en Saccucci, 1990, LUC1 , en die NIST webwerf vir meer besonderhede en uitgewerkte voorbeelde). Bogenoemde aangehaal formules uit die werk van Roberts (1959 ROB1), maar Hunter (1986, HUN1) gebruik 'n uitdrukking van die vorm: wat meer geskik is vir gebruik in 'n paar prosedures kan wees. Met alfa 1 die gemiddelde skatting is eenvoudig sy gemeet waarde (of die waarde van die vorige data-item). Met 0,5 die skatting is die eenvoudige bewegende gemiddelde van die huidige en vorige metings. In voorspellingsmodelle die waarde, S t. word dikwels gebruik as die skatting of voorspelling waarde vir die volgende tydperk, dit wil sê as die skatting vir x op tydstip t 1. So ons het: Dit dui aan dat die voorspelling waarde op tydstip t 1 is 'n kombinasie van die vorige eksponensieel geweeg bewegende gemiddelde plus 'n komponent wat die geweegde voorspelling fout, Epsilon verteenwoordig. op tyd t. Die aanvaarding van 'n tydreeks gegee en 'n voorspelling is nodig, word 'n waarde vir Alpha vereis. Dit kan geskat word van die bestaande data deur die evaluering van die som van 'n vierkant voorspelling foute te kry met wisselende waardes van Alpha vir elke T 2,3. die opstel van die eerste skatting van die eerste waargenome data waarde wees, x 1. In beheer aansoeke ter waarde van Alpha is belangrik in wat gebruik word in die bepaling van die boonste en onderste beheer perke, en raak die gemiddelde duur lank (ARL) verwag voor hierdie beheer perke is gebreek (onder die aanname dat die tyd reeks verteenwoordig 'n stel van ewekansige, identies verdeelde onafhanklike veranderlikes met 'n gemeenskaplike variansie). Onder hierdie omstandighede die variansie van die beheer statistiek: is (Lucas en Saccucci, 1990): beheer perke word gewoonlik gestel as vaste veelvoude van hierdie asimptotiese variansie, bv / - 3 keer die standaardafwyking. 1,134 en die proses sal een of ander perk in 500 bereik - As alfa 0,25, byvoorbeeld, en die data wat gemonitor word aangeneem dat 'n normale verspreiding, N (0,1) het, terwyl dit in beheer, die beheer perke sal / kan stappe op die gemiddelde. Lucas en Saccucci (1990 LUC1) lei die ARLs vir 'n wye verskeidenheid van alfa waardes en onder verskillende aannames met behulp van Markov Chain prosedures. Hulle tabuleer die resultate, insluitend die verskaffing van ARLs wanneer die gemiddelde van die beheerproses is verskuif deur sommige verskeie van die standaardafwyking. Byvoorbeeld, met 'n 0.5 verskuiwing met alfa 0,25 die ARL is minder as 50 keer stappe. Die hierbo beskryf benaderings staan ​​bekend as een eksponensiële gladstryking. as die prosedures wat eenmaal aan die tydreeks toegepas en dan ontleed of beheer prosesse uit op die gevolglike stryk dataset gedra. As die dataset sluit 'n tendens en / of seisoenale komponente, twee - of drie-fase eksponensiële gladstryking kan hieronder toegedien word as 'n middel van die verwydering (uitdruklik modellering) hierdie effekte (sien verder, die afdeling oor vooruitskatting., En die NIST uitgewerkte voorbeeld ). CHA1 Chat Field C (1975) die ontleding van Times Reeks: teorie en praktyk. Chapman en Hall, Londen HUN1 Hunter J S (1986) Die eksponensieel geweeg bewegende gemiddelde. J van kwaliteit Tegnologie, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) eksponensieel Geweegde Moving Gemiddelde beheer Skemas: Properties en verbeteringe. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) beheer Chart Toetse Op grond van Meetkundige bewegende gemiddeldes. Technometrics, 1, 239-250


No comments:

Post a Comment