Sunday, 12 November 2017

Glidande medelvärde utjämning stata


Prognoser genom utjämningstekniker Den här webbplatsen är en del av JavaScript E-labs lärande objekt för beslutsfattande. Annan JavaScript i denna serie kategoriseras under olika tillämpningsområden i avsnittet MENU på den här sidan. En tidsserie är en följd av observationer som beställs i tid. Inherent i insamlingen av data som tagits över tiden är någon form av slumpmässig variation. Det finns metoder för att minska avbrytandet av effekten på grund av slumpmässig variation. Bredt använda tekniker är utjämning. Dessa tekniker, när de tillämpas korrekt, avslöjar tydligare de underliggande trenderna. Ange tidsserierna Row-wise i följd, från början till vänster och parametrarna, och klicka sedan på knappen Beräkna för att få fram en prognos för en period framåt. Blanka rutor ingår inte i beräkningarna utan nollor är. När du matar in data för att flytta från cell till cell i datmatrisen använder du inte knappen Tab eller pilar in. Funktioner av tidsserier, som kan avslöjas genom att granska dess graf. med de prognostiserade värdena och residualbeteendet, förutsatt prognosmodellering. Flyttande medelvärden: Flytta medelvärden rang bland de mest populära teknikerna för förbehandling av tidsserier. De används för att filtrera slumpmässigt vitt brus från data, för att göra tidsserierna mjukare eller till och med för att betona vissa informationskomponenter i tidsserierna. Exponentiell utjämning: Detta är ett mycket populärt schema för att producera en slät Time Series. Medan i rörliga medelvärden viktas de senaste observationerna, exponentiell utjämning tilldelar exponentiellt minskande vikter som observationen blir äldre. Med andra ord ges de senaste observationerna relativt större vikt vid prognosen än de äldre observationerna. Dubbel exponentiell utjämning är bättre vid hantering av trender. Trippel exponentiell utjämning är bättre vid hantering av paraboltrender. Ett exponentiellt vägat glidande medelvärde med en utjämningskonstant a. motsvarar ungefär ett enkelt rörligt medelvärde av längd (dvs period) n, där a och n är relaterade av: a 2 (n1) ORn (2-a) a. Således skulle exempelvis ett exponentiellt vägt glidmedel med en utjämningskonstant lika med 0,1 motsvara ungefär ett 19 dagars glidande medelvärde. Och ett 40-dagars enkelt glidande medelvärde skulle motsvara ungefär ett exponentiellt vägt glidmedel med en utjämningskonstant lika med 0,04878. Håller linjär exponentiell utjämning: Antag att tidsserierna är säsongsbetonade men visar visningstendens. Holts metod beräknar både nuvarande nivå och nuvarande trend. Observera att det enkla glidande medlet är speciellt fall av exponentiell utjämning genom att ställa in perioden för glidande medelvärde till heltalet av (2-alfa) alfa. För de flesta företagsdata är en Alpha-parameter som är mindre än 0,40 ofta effektiv. Man kan emellertid utföra en nätverkssökning av parameterutrymmet, med 0,1 till 0,9, med steg om 0,1. Då har den bästa alfas det minsta genomsnittliga absoluta felet (MA-fel). Hur man jämför flera utjämningsmetoder: Även om det finns numeriska indikatorer för bedömning av prognosteknikens noggrannhet, är det mest använda sättet att använda en visuell jämförelse av flera prognoser för att bedöma deras noggrannhet och välja mellan olika prognosmetoder. I detta tillvägagångssätt måste man plotta (med hjälp av exempelvis Excel) på samma graf de ursprungliga värdena för en tidsserievariabel och de förutspådda värdena från flera olika prognosmetoder, vilket underlättar en visuell jämförelse. Du kanske gillar att använda tidigare prognoser med utjämningstekniker JavaScript för att få tidigare prognosvärden baserade på utjämningstekniker som endast använder en parameter. Holt - och Winters-metoderna använder sig av två respektive tre parametrar, därför är det inte en lätt uppgift att välja de optimala eller till och med nära optimala värden genom försök och fel för parametrarna. Den enskilda exponentiella utjämningen betonar det korta perspektivet som ställer nivån till den sista observationen och baseras på villkoret att det inte finns någon trend. Den linjära regressionen, som passar en minsta kvadrera linje till historiska data (eller transformerade historiska data), representerar det långa intervallet, vilket är konditionerat för den grundläggande trenden. Hålen linjär exponentiell utjämning fångar information om den senaste trenden. Parametrarna i Holts-modellen är nivåparametrar som bör minskas när mängden datavariation är stor och trenderparametern bör ökas om den senaste trendriktningen stöds av orsaksfaktorerna. Kortsiktiga prognoser: Observera att varje JavaScript på denna sida ger en enstegs prognos. För att få en tvåstegs-prognos. Lägg helt enkelt till det prognostiserade värdet till slutet av din tidsseriedata och klicka sedan på samma Calculate-knapp. Du kan upprepa denna process några gånger för att erhålla de nödvändiga kortsiktiga prognoserna. Tidsseriemetoder Tidsseriemetoder är statistiska tekniker som utnyttjar historiska data som samlats över en tidsperiod. Tidsseriemetoder antar att det som inträffat i det förflutna kommer att fortsätta att ske i framtiden. Som namnetidsserierna föreslår, beräknar dessa metoder prognosen till endast en faktor - tid. De innefattar bland annat glidande medelvärde, exponentiell utjämning och linjär trendlinje och de är bland de mest populära metoderna för prognoser för kortdistans mellan service - och tillverkningsföretag. Dessa metoder antar att identifierbara historiska mönster eller trender för efterfrågan över tid kommer att upprepa sig. Flytta genomsnittet En prognos för tidsserier kan vara så enkel som att använda efterfrågan under den aktuella perioden för att förutsäga efterfrågan under nästa period. Detta kallas ibland en naiv eller intuitiv prognos. 4 Till exempel, om efterfrågan är 100 enheter i veckan, är prognosen för nästa veckors efterfrågan 100 enheter om efterfrågan visar sig vara 90 enheter istället, då efterfrågan på följande veckor är 90 enheter, och så vidare. Denna typ av prognostiseringsmetod tar inte hänsyn till historiskt efterfrågan beteende som det endast bygger på efterfrågan under den aktuella perioden. Det reagerar direkt på de normala, slumpmässiga rörelserna i efterfrågan. Den enkla glidande metoden använder flera efterfrågningsvärden under det senaste förflutet för att utveckla en prognos. Detta tenderar att dämpa eller släta ut de slumpmässiga ökningarna och minskningarna av en prognos som endast använder en period. Det enkla glidande medlet är användbart för att förutse efterfrågan som är stabil och visar inte något uttalat efterfrågan beteende, såsom en trend eller ett säsongsmönster. Flyttande medelvärden beräknas för specifika perioder, till exempel tre månader eller fem månader, beroende på hur mycket prognosen önskar släta efterfrågningsdata. Ju längre den rörliga genomsnittliga perioden, desto smidigare blir det. Formeln för att beräkna det enkla rörliga genomsnittet är att beräkna ett enkelt rörligt medelvärde. Instant Paper Clip Office Supply Company säljer och levererar kontorsmaterial till företag, skolor och byråer inom en 50-mils radie av sitt lager. Kontorsleveransverksamheten är konkurrenskraftig, och möjligheten att leverera order snabbt är en faktor för att få nya kunder och hålla gamla. (Kontor beställer vanligtvis inte när de är låga på leveranser, men när de slutar helt. Därför behöver de sina beställningar omedelbart.) Företagets chef vill vara säker med tillräckligt många förare och fordon är tillgängliga för att snabbt kunna leverera order och De har tillräcklig inventering i lager. Därför vill chefen kunna förutse antalet order som kommer att inträffa under nästa månad (dvs. att förutse efterfrågan på leveranser). Från register över leveransorder har ledningen ackumulerat följande data under de senaste 10 månaderna, från vilken man vill beräkna 3- och 5-månaders glidande medelvärden. Låt oss anta att det är slutet av oktober. Prognosen som följer av antingen 3- eller 5-månaders glidande medelvärde är typiskt för nästa månad i sekvensen, vilket i det här fallet är november. Det glidande medelvärdet beräknas från efterfrågan på order under de föregående 3 månaderna i sekvensen enligt följande formel: 5-månaders glidande medelvärde beräknas från de föregående 5 månaderna av efterfrågningsdata enligt följande: 3- och 5-månaders Flytta genomsnittliga prognoser för alla månader av efterfrågadata visas i följande tabell. Faktum är att endast prognosen för november baserat på den senaste månatliga efterfrågan skulle användas av chefen. De tidigare prognoserna för tidigare månader tillåter oss emellertid att jämföra prognosen med den faktiska efterfrågan för att se hur exakt prognosmetoden är - det vill säga hur bra det gör. Tre - och femmånadersgenomsnitt Både glidande genomsnittliga prognoser i tabellen ovan tenderar att släta ut variabiliteten i de faktiska data. Denna utjämningseffekt kan observeras i följande figur där 3-månads - och 5-månadsgenomsnittet har överlagts på ett diagram över de ursprungliga dataen: Det 5-månaders glidande genomsnittet i föregående figur släpper ut fluktuationerna i större utsträckning än 3 månaders glidande medelvärde. Det 3-månadersgenomsnittet återspeglar emellertid närmare de senaste uppgifterna som finns tillgängliga för kontorsleverantören. I allmänhet är prognoser som använder det längre glidande genomsnittet långsammare att reagera på de senaste förändringarna i efterfrågan än vad som gjordes med hjälp av kortare glidande medelvärden. De extra dataperioderna dämpar den hastighet som prognosen svarar på. Att fastställa lämpligt antal perioder att använda i en glidande genomsnittlig prognos kräver ofta en viss mängd försök och felprov. Nackdelen med den glidande genomsnittliga metoden är att den inte reagerar på variationer som uppstår av en orsak, såsom cykler och säsongseffekter. Faktorer som orsakar förändringar ignoreras generellt. Det är i princip en mekanisk metod som speglar historiska data på ett konsekvent sätt. Emellertid har den glidande medelmetoden fördelen att det är lätt att använda, snabbt och relativt billigt. I allmänhet kan denna metod ge en bra prognos på kort sikt, men det bör inte skjutas för långt in i framtiden. Viktat rörligt medelvärde Den glidande genomsnittliga metoden kan justeras för att bättre reflektera fluktuationer i data. I den viktade glidande genomsnittsmetoden tilldelas vikter till de senaste data enligt följande formel: Efterfrågningsdata för PM Computer Services (visad i tabellen för Exempel 10.3) verkar följa en ökande linjär trend. Företaget vill beräkna en linjär trendlinje för att se om den är mer exakt än exponentiella utjämning och justerade exponentiella utjämningsprognoser som utvecklats i exempel 10.3 och 10.4. De värden som krävs för minsta kvadratberäkningarna är följande: Med dessa värden beräknas parametrarna för linjär trendlinje enligt följande: Därför är linjär trendlinjekvation Att beräkna en prognos för period 13, låt x 13 i linjär trendlinje: Nedanstående diagram visar linjär trendlinje jämfört med aktuella data. Trendslinjen verkar tydligt reflektera de faktiska uppgifterna - det vill säga vara en bra passform - och skulle därmed vara en bra prognosmodell för detta problem. En nackdel med den linjära trenderlinjen är emellertid att den inte kommer att anpassas till en förändring i trenden, eftersom de exponentiella utjämningsprognosmetoderna kommer att det antas att alla framtida prognoser kommer att följa en rak linje. Detta begränsar användningen av denna metod till en kortare tidsram där du kan vara relativt säker på att trenden inte kommer att förändras. Säsongsjusteringar Ett säsongsmönster är en repetitiv ökning och minskning av efterfrågan. Många efterfrågevaror uppvisar säsongsbeteende. Klädförsäljningen följer årliga säsongsmönster, med efterfrågan på varma kläder ökar på hösten och vintern och sjunker under våren och sommaren då efterfrågan på svalare kläder ökar. Efterfrågan på många detaljhandelsvaror, inklusive leksaker, sportutrustning, kläder, elektroniska apparater, skinka, kalkoner, vin och frukt, ökar under semesterperioden. Efterfrågan på hälsokort ökar i samband med speciella dagar som Alla hjärtans dag och mors dag. Säsongsmönster kan också ske varje månad, veckovis eller till och med dagligen. Vissa restauranger har högre efterfrågan på kvällen än vid lunch eller på helgerna i motsats till vardagar. Trafik - därmed försäljning - på köpcentra hämtar på fredag ​​och lördag. Det finns flera metoder för att reflektera säsongsmönster i en prognos för tidsserier. Vi beskriver en av de enklare metoderna med en säsongsfaktor. En säsongsfaktor är ett numeriskt värde som multipliceras med den normala prognosen för att få en säsongrensad prognos. En metod för att utveckla en efterfrågan på säsongsmässiga faktorer är att dela efterfrågan på varje säsongsperiod efter den totala årliga efterfrågan enligt följande formel: De resulterande säsongsfaktorerna mellan 0 och 1,0 är i själva verket den del av den totala årliga efterfrågan som tilldelas varje säsong. Dessa säsongsfaktorer multipliceras med den årliga prognostiserade efterfrågan för att ge justerade prognoser för varje säsong. Beräkna ett prognos med säsongsjusteringar. Wishbone Farms växer kalkoner för att sälja till köttbearbetningsföretag under hela året. Men högsäsong är uppenbarligen under fjärde kvartalet, från oktober till december. Wishbone Farms har upplevt efterfrågan på kalkoner under de senaste tre åren som visas i följande tabell: Eftersom vi har tre års efterfrågadata kan vi beräkna säsongsfaktorerna genom att dela den totala kvartalsbehovet för de tre åren med total efterfrågan under alla tre år : Sedan vill vi multiplicera den prognostiserade efterfrågan på nästa år, 2000, genom varje säsongsfaktor för att få den prognostiserade efterfrågan för varje kvartal. För att uppnå detta behöver vi en efterfråganprognos för 2000. I det här fallet, eftersom efterfrågadata i tabellen verkar uppvisa en generellt ökande trend, beräknar vi en linjär trendlinje för de tre år av data i tabellen för att få en grov prognosuppskattning: Prognosen för 2000 är således 58,17 eller 58,170 kalkoner. Med hjälp av denna årliga prognosen för efterfrågan jämförs de säsongrensade prognoserna SF i för år 2000 med jämförelse av dessa kvartalsprognoser med de faktiska efterfrågningsvärdena i tabellen, de verkar vara relativt goda prognosberäkningar som återspeglar både säsongsvariationerna i data och den allmänna uppåtgående trenden. 10-12. Hur är den glidande medelmetoden som liknar exponentiell utjämning 10-13. Vilken effekt på exponentiell utjämningsmodell kommer att öka utjämningskonstanten har 10-14. Hur skiljer sig justerad exponentiell utjämning från exponentiell utjämning 10-15. Vad bestämmer valet av utjämningskonstanten för trend i en justerad exponentiell utjämningsmodell 10-16. I kapitelexemplen för tidsseriemetoder antogs startprognosen alltid vara densamma som den faktiska efterfrågan under den första perioden. Föreslå andra sätt att startprognosen kan härledas vid faktisk användning. 10-17. Hur skiljer den linjära trendlinjeprognosmodellen från en linjär regressionsmodell för prognoser 10-18. Av de tidsseriemodeller som presenteras i detta kapitel, inklusive det glidande medelvärdet och det vägda glidande medlet, exponentiell utjämning och justerad exponentiell utjämning och linjär trendlinje, vilken anser du bäst Varför 10-19. Vilka fördelar har justerad exponentiell utjämning över en linjär trendlinje för prognostiserad efterfrågan som uppvisar en trend 4 K. B. Kahn och J. T. Mentzer, prognoser inom konsument - och industrimarknaderna, Journal of Business Forecast 14, nr. 2 (Summer 1995): 21-28.Stata: Dataanalys och statistisk programvara Nicholas J. Cox, Durham University, Storbritannien Christopher Baum, Boston College egen, ma () och dess begränsningar Statarsquos mest uppenbara kommando för beräkning av glidande medelvärden är ma () funktion av egen. Med tanke på ett uttryck skapar det ett periodiskt rörligt medelvärde av det uttrycket. Som standard tas det som 3. måste vara udda. Men som den manuella inmatningen indikerar kan egen, ma () kanske inte kombineras med varlist:. och av den anledningen är det inte tillämpligt på paneldata. I vilket fall som helst står den utanför uppsättningen kommandon som är specifikt skrivna för tidsserier, se tidsserier för detaljer. Alternativa metoder För att beräkna glidmedel för paneldata finns det minst två val. Båda är beroende av att datasetet tidigare har ställts in. Det här är väldigt mycket värt att göra: inte bara kan du spara dig själv upprepade gånger med att ange panelvariabel och tidsvariabel, men Stata beter sig smart med några luckor i data. 1. Skriv din egen definition med hjälp av generering Använda tidsserier som L. och F.. Ge definitionen av det rörliga genomsnittsvärdet som argumentet för ett genererat uttalande. Om du gör det här är du naturligtvis inte begränsad till lika viktiga (obevätade) centrerade glidmedelvärden beräknade av egen ma (). Till exempel skulle lika viktiga treårs glidande medelvärden ges av och vissa vikter kan enkelt specificeras: Du kan givetvis ange ett uttryck som logg (myvar) istället för ett variabelt namn som myvar. En stor fördel med detta tillvägagångssätt är att Stata automatiskt gör det rätta för paneldata: ledande och släpande värden utarbetas inom paneler, precis som logiken dikterar att de borde vara. Den mest anmärkningsvärda nackdelen är att kommandoraden kan bli ganska lång, om det rörliga genomsnittet innefattar flera termer. Ett annat exempel är ett ensidigt rörligt medelvärde baserat endast på tidigare värden. Detta kan vara användbart för att generera en adaptiv förväntning av vilken variabel som kommer att baseras uteslutande på information till dags dato: Vad kan någon förutspå för den aktuella perioden baserat på de fyra senaste värdena, med hjälp av ett fast viktningsschema (en 4-tidsperiod kan vara särskilt vanligt förekommande med kvartalsvisa tidsserier.) 2. Använd eget filter () från SSC Använd det användarskrivna egenfunktionsfiltret () från egenmore-paketet på SSC. I Stata 7 (uppdaterad efter 14 november 2001) kan du installera det här paketet efter vilket hjälp egenmore pekar på detaljer på filteret (). De två ovanstående exemplen skulle göras (I denna jämförelse är genereringsmetoden kanske mer transparent, men vi kommer att se ett exempel på motsatsen i ett ögonblick.) Lags är en numlist. lederna är negativa lags: i det här fallet -11 expanderar till -1 0 1 eller led 1, lag 0, lag 1. Koef-ficienterna, en annan numlist, multiplicera motsvarande släpande eller ledande objekt: i detta fall är dessa föremål F1.myvar . myvar och L1.myvar. Effekten av normaliseringsalternativet är att skala varje koefficient med summan av koefficienterna så att koefficienten (1 1 1) normaliserar motsvarar koefficienterna 13 13 13 och koef (1 2 1) normaliserar motsvarar koefficienterna 14 12 14 Du måste ange inte bara lags men även koefficienterna. Eftersom egen, ma () ger det lika viktiga fallet är huvudmotivet för egen, filter () att stödja det ojämnt viktiga fallet, för vilket du måste ange koefficienter. Man kan också säga att förplikta användarna att ange koefficienter är ett litet extra tryck på dem för att tänka på vilka koefficienter de vill ha. Den huvudsakliga motiveringen för lika vikter är, vi antar, enkelhet, men lika vikter har äckliga frekvensdomänegenskaper, för att bara nämna ett övervägande. Det tredje exemplet ovan kan vara vilket är ungefär lika komplicerat som genereringsmetoden. Det finns fall där eget, filter () ger en enklare formulering än att generera. Om du vill ha ett nio-termins binomialfilter, som klimatologerna tycker är användbara, ser det kanske mindre hemskt ut än, och lättare att få rätt än, precis som med genereringsmetoden, fungerar egen, filter () korrekt med paneldata. Faktum är att det som sagt ovan beror på att datasetet tidigare har ställts in. En grafisk spets Efter att du har beräknat dina glidande medelvärden kommer du förmodligen att vilja se en graf. Det användarskrivna kommandot tsgraph är smart om tsset dataset. Installera det i en aktuell Stata 7 av ssc inst tsgraph. Vad sägs om delning med om ingen av ovanstående exempel använder sig av om begränsningar. Faktum är att egen, ma () inte tillåter om det ska anges. Ibland vill folk använda om man beräknar glidande medelvärden, men användningen är lite mer komplicerad än vad som vanligtvis är. Vad förväntar du dig av ett glidande medelvärde beräknat med if. Låt oss identifiera två möjligheter: Svag tolkning: Jag vill inte se några resultat för de uteslutna observationerna. Stark tolkning: Jag vill inte ens att du ska använda värdena för de uteslutna observationerna. Här är ett konkret exempel. Antag som en följd av vissa om villkor ingår observationer 1-42 men inte observationer 43 på. Men det rörliga genomsnittsvärdet för 42 beror bland annat på värdet för observation 43 om medelvärdet sträcker sig bakåt och framåt och är av längd åtminstone 3, och det kommer också att bero på några av observationerna 44 under vissa omständigheter. Vår gissning är att de flesta skulle gå för den svaga tolkningen, men om det är korrekt, kan inte filter () heller stödja om. Du kan alltid ignorera vad du donrsquot vill eller ens ställa in oönskade värden att missa efteråt med hjälp av ersätt. En anteckning om saknade resultat i slutet av serierna Eftersom rörliga medelvärden är funktioner av lags och leads, produceras egen, ma (), där lags och leads inte existerar, i början och slutet av serien. Ett alternativ nomiss tvingar beräkningen av kortare, ocenterade glidmedel för svansarna. Däremot genererar varken egen eller filter, (), eller tillåter, något speciellt för att undvika att missa resultat. Om något av värdena som behövs för beräkning saknas, saknas det resultatet. Det är upp till användarna att bestämma om och vilken korrigering som krävs för sådana observationer, förmodligen efter att ha tittat på datasetet och med tanke på vilken underliggande vetenskap som kan bäras.

No comments:

Post a Comment