Moving Media Previsione Intervallo
La distinzione tra gli intervalli di confidenza, intervalli di previsione e gli intervalli di tolleranza. FAQ 1506 ultima modifica 1-Luglio-2009, quando si forma un parametro a un modello, l'accuratezza o la precisione può essere espresso come un intervallo di confidenza, un intervallo di previsione o di un intervallo di tolleranza. I tre sono ben distinti. La discussione che segue illustra i tre intervalli diversi per il semplice caso di montaggio di un mezzo per un campione di dati (supponendo campionamento da una distribuzione gaussiana). Gli stessi concetti possono essere applicati a intervalli per ogni parametro best-fit determinata dalla regressione. Gli intervalli di confidenza ti dicono su quanto bene avete determinato la media. Si supponga che i dati realmente sono campionati a caso da una distribuzione gaussiana. Se fate questo molte volte, e calcolare un intervallo di confidenza della media da ciascun campione, you39d aspettare circa 95 di quegli intervalli per includere il vero valore della media della popolazione. Il punto chiave è che l'intervallo di confidenza che si dice circa la posizione probabile del parametro vera popolazione. intervalli di previsione ti dicono dove ci si può aspettare di vedere il successivo punto dati campionati. Si supponga che i dati realmente sono campionati a caso da una distribuzione gaussiana. Raccogliere un campione di dati e calcolare un intervallo di previsione. Poi assaggiare un altro valore da parte della popolazione. Se fate questo molte volte, you39d aspettarsi che il valore accanto si trovano all'interno di tale intervallo di previsione a 95 del punto chiave samples. The è che l'intervallo di previsione vi racconta la distribuzione dei valori, non l'incertezza nel determinare la media della popolazione. intervalli di previsione devono considerare le incertezza conoscendo il valore della media della popolazione, più dispersione dei dati. Quindi un intervallo di previsione è sempre più ampia di un intervallo di confidenza. Prima di passare a intervalli di tolleranza, let39s definire questa parola 39expect39 usata per definire un intervallo di previsione. Esso significa che c'è una possibilità che 50 you39d vedere il valore entro l'intervallo in più di 95 dei campioni, e 50 possibilità che you39d vedere il valore entro l'intervallo in meno di 95 dei campioni. Immaginare di fare un sacco di simulazioni, in modo da sapere il vero valore, e quindi sapere se è nell'intervallo di previsione o meno. È quindi possibile catalogare quale frazione del tempo il valore è racchiuso da l'intervallo. Ripetere con molti set di simulazioni. In media il valore sarà 95, ma potrebbe essere 93 o 98. La metà del tempo sarà inferiore al 95 e la metà del tempo che sarà più di 95. Che cosa succede se si vuole essere sicuri che 95 l'intervallo contiene 95 del i valori o 90 in modo che l'intervallo contiene 99 dei valori queste ultime domande trovano risposta da un intervallo di tolleranza. Per calcolare, o capire, un intervallo di tolleranza è necessario specificare due percentuali diverse. Un esprime come certo di voler essere, e l'altro esprime quale frazione dei valori dell'intervallo conterrà. Se si imposta il primo valore (come sicuro) a 50, poi un intervallo di tolleranza è la stessa di un intervallo di previsione. Se si imposta un valore più alto (ad esempio 90 o 99), poi l'intervallo di tolleranza è più ampio. Hai bisogno di imparare gli intervalli di 72,7 Prediction Prism come discusso nella sezione 17. un intervallo di previsione dà un intervallo entro il quale ci aspettiamo y per giacere con una probabilità specifica. Per esempio, supponendo che il errori di previsione sono scorrelati e normalmente distribuito, quindi un semplice intervallo di 95 previsione per il prossimo osservazione in una serie temporale è 91 cappello pm 1,96 hatsigma, 93 dove hatsigma è una stima della deviazione standard della distribuzione del tempo. In previsione, è comune per calcolare gli intervalli di 80 e 95 intervalli, anche se qualsiasi percentuale può essere utilizzato. Quando previsione un passo avanti, la deviazione standard della distribuzione previsione è quasi la stessa come la deviazione standard dei residui. (In effetti, i due deviazioni standard sono identici se non ci sono parametri da stimare ad esempio con il metodo nave. Per metodi di previsione che comportano parametri da stimare, la deviazione standard della distribuzione previsione è leggermente più grande della deviazione standard del residuo, anche se questa differenza è spesso ignorato.) Ad esempio, si consideri una previsione navata per l'indice Dow-Jones. L'ultimo valore della serie osservata è 3830, in modo che la previsione del prossimo valore del DJI è 3830. La deviazione standard dei residui dal metodo navata centrale è 21.99. Quindi, un intervallo di 95 previsione per il prossimo valore del DJI è 3830 ore 1.96 (21.99) 3787, 3873. Allo stesso modo, un intervallo di 80 previsione è dato da 3830 ore 1.28 (21.99) 3802,3858. Il valore del moltiplicatore (1,96 o 1,28) determina la percentuale dell'intervallo di predizione. La tabella seguente riporta i valori da utilizzare per diverse percentuali. Tabella 2.1: moltiplicatori da utilizzare per intervalli di previsione. L'uso di questa tabella e cappello formula pm k hatsigma (dove k è il moltiplicatore) assume che i residui sono normalmente distribuiti e non correlate. Se una di queste condizioni non regge, allora questo metodo di produzione di un intervallo di previsione non può essere utilizzato. Il valore degli intervalli di previsione è che essi esprimono l'incertezza nelle previsioni. Se produciamo solo previsioni puntuali, non c'è modo di dire come precisa le previsioni sono. Ma se produciamo anche intervalli di previsione, allora è chiaro quanto l'incertezza associata a ogni previsione. Per questo motivo, le previsioni punto può essere di quasi nessun valore senza accompagnamento intervalli di previsione. Per produrre un intervallo di predizione, è necessario avere una stima della deviazione standard della distribuzione previsioni. Per le previsioni di uno stadio di serie temporali, la deviazione standard residua fornisce una buona stima della deviazione standard del tempo. Ma per tutte le altre situazioni, come le previsioni più fasi per le serie temporali, è necessario un metodo più complicato di calcolo. Questi calcoli si realizza con il software di previsione standard e non hanno bisogno di guai il previsore (a meno che lui o lei sta scrivendo il software). Una caratteristica comune di intervalli di previsione è che aumentano di lunghezza all'aumentare previsioni orizzonte. Il più avanti si prevede la più incertezza è associato con il tempo, e così gli intervalli di previsione crescere più ampio. Tuttavia, ci sono alcuni metodi (non lineare) di previsione che non hanno questo attributo. Se è stata utilizzata una trasformazione, l'intervallo di predizione dovrebbe essere calcolato sulla scala trasformata, e gli estremi back-trasformato che invia un intervallo di predizione della scala originale. Questo approccio preserva la copertura probabilità dell'intervallo di previsione, anche se non sarà più simmetrico attorno alle funzionalità forecast. This punto è sperimentale e può essere modificato o rimosso completamente in una versione futura. Elastic vorrà un approccio migliore sforzo per risolvere gli eventuali problemi, ma funzioni sperimentali non sono soggetti alla SLA supporto di funzioni ufficiali GA. Dato una serie ordinata di dati, il Moving aggregazione media scivolerà una finestra attraverso i dati ed emettere il valore medio di tale finestra. Ad esempio, dati i dati di 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 si può calcolare una media mobile semplice, con finestre dimensione del 5 come segue: Le medie mobili sono un metodo semplice per lisciare sequenziale dati. Le medie mobili sono in genere applicati ai dati basati sul tempo, come i prezzi delle azioni o metriche dei server. Il livellamento può essere utilizzato per eliminare le fluttuazioni ad alta frequenza o rumore casuale, che permette le tendenze frequenza più bassa per essere più facilmente visualizzati, come la stagionalità. SyntaxEdit Linearedit Il modello lineare assegna un coefficiente lineare punti in serie, in modo che datapoints grandi (ad esempio quelli all'inizio della finestra) contribuiscono a linearmente meno quantità alla media totale. La ponderazione lineare, contribuisce a ridurre il ritardo dietro i dati significano, dal momento che i punti più anziani hanno meno influenza. Un modello lineare non ha particolari impostazioni da configurare Come il modello semplice, la dimensione della finestra può modificare il comportamento della media mobile. Ad esempio, una piccola finestra (finestra: 10) sarà strettamente monitorare i dati e solo appianare le fluttuazioni della piccola scala: Figura 3. lineare media mobile con finestra di dimensioni 10 Al contrario, lineare media mobile con finestra grande (finestra: 100) sarà appianare tutte le fluttuazioni a più alta frequenza, lasciando solo a bassa frequenza, tendenze a lungo termine. Inoltre tende a restare indietro i dati effettivi di un importo considerevole, anche se in genere meno rispetto al modello semplice: Figura 4. lineare media mobile con finestra di dimensioni 100 moltiplicativi Holt-Wintersedit moltiplicativo viene specificato impostando tipo: mult. Questa varietà è preferito quando influenzano la stagione viene moltiplicato contro i tuoi dati. Per esempio. se l'effetto stagionale è x5 dati, piuttosto che semplicemente aggiungendo ad esso. I valori di default di alfa e gamma sono 0.3, mentre beta è 0.1. Le impostazioni di accettare qualsiasi galleggiante 0-1 compreso. Il valore predefinito del periodo è di 1. Il modello di Holt-Winters moltiplicativo possono essere minimizzate moltiplicativo Holt-Winters lavora dividendo ogni punto di dati per il valore di stagione. Questo è un problema se uno dei tuoi dati è zero, o se ci sono lacune nei dati (poiché questo si traduce in un divId per zero). Per combattere questo, la mult Holt-Winters Tamponi tutti i valori da una piccola quantità (110 -10) in modo che tutti i valori sono non-zero. Questo influenza il risultato, ma solo in minima parte. Se i dati sono non-zero, o se si preferisce vedere NaN quando si incontrano zeri, è possibile disabilitare questo comportamento con pad: true Predictionedit Tutto il modello di media mobile supporta una modalità di previsione, che tenterà di estrapolare nel futuro data l'attuale levigata, media mobile. A seconda del modello e dei parametri, queste previsioni possono o non possono essere precisi. Le previsioni sono abilitati con l'aggiunta di un parametro di prevedere qualsiasi movimento di aggregazione media, specificando il numero di previsioni che vorresti aggiunti alla fine della serie. Queste previsioni saranno distanziati nello stesso intervallo di come i tuoi secchi: La semplice. modelli lineari e EWMA tutti producono previsioni piatte: essi essenzialmente convergono sulla media dell'ultimo valore della serie, la produzione di una TV: Figura 11. media mobile semplice con finestra di dimensioni 10, prevedono 50 Al contrario, il modello di Holt può estrapolare base sulle tendenze costanti locali o globali. Se abbiamo fissato un alto valore di beta, possiamo estrapolare in base alle tendenze costanti locali (in questo caso le previsioni a testa in giù, perché i dati alla fine della serie si stava dirigendo verso il basso): Figura 12. Holt-lineare media mobile con finestra di dimensioni 100, prevedere 20, alpha 0.5, beta 0,8 al contrario, se si sceglie un piccolo beta. le previsioni si basano sulla tendenza costante globale. In questa serie, la tendenza globale è leggermente positivo, quindi la previsione fa una brusca inversione di marcia e inizia una pendenza positiva: Figura 13. Doppio media mobile esponenziale con la finestra di dimensioni 100, prevedere 20, alpha 0.5, beta 0.1 Il modello holtwinters ha il potenziale per fornire i migliori previsioni, dal momento che incorpora anche fluttuazioni stagionali nel modello: Figura 14. Holt-Winters media mobile con finestra di dimensioni 120, prevedere 25, alpha 0.8, beta 0.2, gamma 0.7, periodo 30Moving media Questo esempio ti insegna come calcolare la media mobile di una serie storica in Excel. Una media mobile viene utilizzata per appianare le irregolarità (picchi e valli) di riconoscere facilmente le tendenze. 1. In primo luogo, consente di dare un'occhiata alla nostra serie temporali. 2. Nella scheda dati fare clic su Analisi dati. Nota: non riesci a trovare il pulsante Data Analysis Clicca qui per caricare il componente aggiuntivo Strumenti di analisi. 3. Selezionare media mobile e fare clic su OK. 4. Fare clic nella casella intervallo di input e selezionare l'intervallo B2: M2. 5. Fare clic nella casella Intervallo e digitare 6. 6. Fare clic nella casella Intervallo di output e selezionare cella B3. 8. Tracciare la curva di questi valori. Spiegazione: perché abbiamo impostato l'intervallo di 6, la media mobile è la media degli ultimi 5 punti di dati e il punto di dati corrente. Come risultato, i picchi e le valli si distendono. Il grafico mostra una tendenza all'aumento. Excel non può calcolare la media mobile per i primi 5 punti di dati, perché non ci sono abbastanza punti dati precedenti. 9. Ripetere i passaggi 2-8 per l'intervallo 2 e l'intervallo 4. Conclusione: Il più grande l'intervallo, più i picchi e le valli si distendono. Minore è l'intervallo, più le medie mobili sono i punti dati effettivi.
Comments
Post a Comment