4 Jähriger Mittelwert


Gleitende Mittelwerte Wenn diese Informationen auf einem Diagramm gezeichnet werden, sieht es so aus: Dies zeigt, dass es eine große Variation der Besucherzahl je nach Saison gibt. Es gibt weit weniger im Herbst und Winter als im Frühjahr und Sommer. Wenn wir jedoch einen Trend in der Anzahl der Besucher sehen wollten, könnten wir einen 4-Punkte-Gleitender Durchschnitt berechnen. Wir erreichen dies durch die durchschnittliche Besucherzahl in den vier Quartalen 2005: Dann finden wir die durchschnittliche Besucherzahl in den letzten drei Quartalen 2005 und im ersten Quartal 2006: Dann die letzten beiden Quartale 2005 und die ersten beiden Quartale Von 2006: Das letzte Mittel, das wir finden können, ist für die letzten zwei Quartale von 2006 und die ersten zwei Quartale von 2007. Wir zeichnen die gleitenden Durchschnitte auf einem Diagramm und stellen sicher, dass jeder Durchschnitt in der Mitte der vier Viertel geplottet wird Es deckt: Wir können jetzt sehen, dass es einen sehr leichten Abwärtstrend bei den Besuchern gibt. David, Ja, MapReduce soll mit einer großen Datenmenge arbeiten. Und die Idee ist, dass die Karte im Allgemeinen und Funktionen reduzieren shouldn39t Pflege, wie viele Mapper oder wie viele Reduzierungen gibt es, gerade Optimierung that39s. Wenn Sie sorgfältig über den Algorithmus ich gepostet denken, können Sie sehen, dass es doesn39t Angelegenheit, welche Mapper bekommt, welche Teile der Daten. Jeder Eingabesatz ist für jede reduzierte Operation verfügbar, die es benötigt. Ndash Joe K 18. September um 22:30 Im besten Fall meines Verständnisses gleitende Durchschnitt ist nicht schön Karten MapReduce-Paradigma, da seine Berechnung im Wesentlichen Schiebefenster über sortierte Daten ist, während MR Verarbeitung von nicht geschnittenen Bereichen von sortierten Daten. Lösung, die ich sehe, ist wie folgt: a) Um benutzerdefinierte Partitionierer zu implementieren, um zwei verschiedene Partitionen in zwei Ausführungen zu machen. In jedem Ihrer Reduzierungen laufen verschiedene Bereiche von Daten zu erhalten und zu berechnen Durchschnitt bewegen, wo approprieate werde ich versuchen, zu veranschaulichen: für Reduzierungen Im ersten Lauf Daten sein sollte: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . Hier werden Sie gleitenden Durchschnitt für einige Qs cacluate. Im nächsten Lauf sollten Ihre Reduzierer Daten wie erhalten: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 Und caclulate den Rest der gleitenden Durchschnitte. Dann müssen Sie Ergebnisse zu aggregieren. Idee von benutzerdefinierten Partitionierer, dass es zwei Betriebsarten haben wird - jedes Mal in gleiche Bereiche Teilung aber mit gewissen Veränderungen. In einem Pseudocode sieht es so aus. Partition (keySHIFT) (MAXKEY numOfPartitions) wobei: SHIFT aus der Konfiguration genommen werden. MAXKEY-Maximalwert der Taste. Ich nehme zur Vereinfachung an, dass sie mit Null beginnen. RecordReader, IMHO ist keine Lösung, da es auf bestimmte Split beschränkt ist und kann nicht über Splits Grenze gleiten. Eine weitere Lösung wäre, um benutzerdefinierte Logik der Aufteilung der Eingangsdaten (es ist Teil der InputFormat) zu implementieren. Es kann getan werden, um 2 verschiedene Folien, ähnlich wie die Partitionierung zu tun. Beantwortet Sep 17 12 at 8:59

Comments

Popular posts from this blog

Hat Jemand Wirklich Machen Geld Handel Binäre Optionen

Bollinger Bands Tsco

Apprendre Le Forex Pdf