Friday, 28 July 2017

Arma เฉลี่ยเคลื่อนที่ ตัวอย่างเช่น


ฉันกำลังพยายามจริงๆ แต่ดิ้นรนเพื่อทำความเข้าใจกับการทำงานแบบอัตถิภาวนิยมและค่าเฉลี่ยเคลื่อนที่ ฉันน่ากลัวมากกับพีชคณิตและมองไปที่มันไม่ได้จริงๆปรับปรุงความเข้าใจของฉันบางสิ่งบางอย่าง สิ่งที่ฉันรักจริงๆคือตัวอย่างง่ายๆในการบอกว่ามีการสังเกตการณ์ที่ขึ้นกับเวลา 10 ข้อดังนั้นฉันจึงสามารถเห็นได้ว่าพวกเขาทำงานอย่างไร สมมติว่าคุณมีจุดข้อมูลต่อไปนี้ในราคาทองคำตัวอย่างเช่นในช่วงเวลา 10 ค่าเฉลี่ยเคลื่อนที่ของ Lag 2, MA (2) จะเป็นหรือ MA (1) และ AR (1) หรือ AR (2) ฉันได้เรียนรู้เกี่ยวกับ Moving Average เป็นแบบเดิม ๆ : แต่เมื่อมองไปที่โมเดล ARMA MA ได้อธิบายไว้ในรูปของคำผิดพลาดก่อนหน้านี้ซึ่งฉันไม่สามารถเอาหัวของฉันไปรอบ ๆ ได้ เป็นเพียงวิธี fancier ของการคำนวณสิ่งเดียวกันฉันคิดว่าบทความนี้มีประโยชน์: (วิธีการเข้าใจ SARIMAX สังหรณ์ใจ) แต่ whist พีชคณิตช่วยฉันไม่สามารถมองเห็นสิ่งที่ชัดเจนจริงๆจนกว่าฉันจะเห็นตัวอย่างง่ายของมัน จากข้อมูลราคาทองคำคุณจะต้องประมาณแบบจำลองและดูวิธีการทำงาน (การคาดการณ์การวิเคราะห์การตอบสนองต่อแรงกระตุ้น) บางทีคุณอาจจะ จำกัด คำถามของคุณให้แคบลงเพียงแค่ส่วนที่สอง (และปล่อยให้ประมาณไว้) นั่นคือคุณจะมี AR (1) หรือ MA (1) หรือแบบใดก็ตาม (เช่น xt0.5 x varepsilont) และถามเราว่าแบบจำลองนี้ทำงานอย่างไร ndash Richard Hardy Aug 13 15 at 19:58 สำหรับแบบจำลอง AR (q) วิธีง่ายๆในการประมาณค่าพารามิเตอร์คือการใช้ OLS และเรียกใช้การถดถอยของ pricet beta0 beta1 cdot ราคา dotso betaq cdot ให้ทำเช่นนั้น (ใน R): (เอาล่ะฉันโกงบิตและใช้ฟังก์ชัน arima ใน R แต่ให้ค่าประมาณเดียวกับการถดถอยของ OLS - ลอง) ตอนนี้ให้ดูรูปแบบ MA (1) ขณะนี้รุ่น MA แตกต่างจากรุ่น AR มาก แมสซาชูเซตส์เป็นค่าเฉลี่ยถ่วงน้ำหนักของข้อผิดพลาดในอดีตซึ่งเป็นรูปแบบ AR ใช้ค่าข้อมูลที่แท้จริงของช่วงก่อนหน้า MA (1) คือ pricet mu wt theta1 cdot w ที่ mu เป็นค่าเฉลี่ยและน้ำหนักเป็นข้อผิดพลาด - ไม่ใช่ค่า previoes ของราคา (เช่นเดียวกับในรูปแบบ AR) ตอนนี้อนิจจาเราไม่สามารถประมาณค่าพารามิเตอร์โดยใช้ OLS ได้ง่ายๆ ฉันจะไม่ครอบคลุมวิธีการที่นี่ แต่ R arima ฟังก์ชันใช้ likihood สูงสุด ลองใช้: หวังว่านี่จะช่วยได้ (2) เกี่ยวกับคำถาม MA (1) คุณบอกว่าส่วนที่เหลือคือ 1.0023 สำหรับงวดที่สอง ที่เหมาะสม ความเข้าใจของฉันเกี่ยวกับส่วนที่เหลือคือความแตกต่างระหว่างค่าที่คาดการณ์และค่าที่สังเกตได้ แต่คุณก็บอกว่าค่าที่คาดการณ์ไว้สำหรับงวดที่ 2 คำนวณโดยใช้ส่วนที่เหลือสำหรับช่วงเวลา 2 ค่านี้เป็นค่าที่คาดการณ์ไว้สำหรับช่วงเวลา 2 เพียง (0.54230 4.9977) ndash จะ TE 17/8/15 15 ที่ 11: 24 เอกสารเป็นค่าเฉลี่ยที่ไม่มีเงื่อนไข กระบวนการและ x03C8 (L) เป็นพหุนามที่มีเหตุผล, infinite-lag ล่าช้าดำเนินการ (1 x03C8 1 L x03C8 2 L 2 x 2026) หมายเหตุ: คุณสมบัติ Constant ของออบเจกต์ arima model สอดคล้องกับ c และไม่ใช่ค่าเฉลี่ยที่ไม่มีเงื่อนไข 956 การสลายตัวของ Wolds 1. สมการ 5-12 สอดคล้องกับกระบวนการ stochastic stationary ให้สัมประสิทธิ์ x03C8 i เป็นตัวสรุปได้อย่างชัดเจน เป็นกรณีนี้เมื่อพหุนาม AR, x03D5 (L) มีเสถียรภาพ หมายถึงรากทั้งหมดของมันอยู่นอกวงกลมหน่วย นอกจากนี้กระบวนการนี้เป็นสาเหตุที่ทำให้พหุนามของแมสซาชูเซตส์ไม่สามารถเปลี่ยนแปลงได้ หมายถึงรากทั้งหมดของมันอยู่นอกวงกลมหน่วย Econometrics Toolbox ใช้เสถียรภาพและความไม่แน่นอนของกระบวนการ ARMA เมื่อคุณระบุรูปแบบ ARMA โดยใช้ arima คุณจะได้รับข้อผิดพลาดถ้าคุณป้อนค่าสัมประสิทธิ์ที่ไม่สอดคล้องกับชื่อพหุนาม MA multium หรือ invertible ที่มีเสถียรภาพ ในทำนองเดียวกันการประมาณกำหนดข้อ จำกัด ในการเขียนโปรแกรมและข้อ จำกัด ในการหลีกเลี่ยงได้ระหว่างการประมาณค่า เอกสารอ้างอิง 1 Wold, H. การศึกษาในการวิเคราะห์ชุดเวลาแบบคงที่ Uppsala, Sweden: Almqvist amp Wiksell, 1938. เลือกประเทศของคุณคุณสามารถให้ตัวอย่างชีวิตจริงบางส่วนของซีรีส์เวลาซึ่งเป็นกระบวนการเฉลี่ยถ่วงน้ำหนักของคำสั่ง q คือจำนวนเงินที่รวมอยู่ในใบสั่ง q, varepsilont sim mathcal (0, sigma2) มีเหตุผลเบื้องต้นสำหรับการเป็นแบบอย่างที่ดีอย่างน้อยสำหรับฉันกระบวนการอัตโนมัติดูเหมือนจะง่ายมากที่จะเข้าใจอย่างสังหรณ์ใจในขณะที่กระบวนการ MA ดูเหมือนจะไม่เป็นธรรมชาติอย่างรวดเร็วก่อน โปรดทราบว่าฉันไม่สนใจผลลัพธ์ทางทฤษฎีที่นี่ (เช่น Wolds Theorem หรือ invertibility) เป็นตัวอย่างของสิ่งที่ฉันกำลังมองหาสมมุติว่าคุณมีหุ้นคืนหุ้น rt ข้อความซิม (0, sigma2) จากนั้นรายได้เฉลี่ยต่อสัปดาห์จะมีโครงสร้าง MA (4) เป็นสิ่งประดิษฐ์ทางสถิติอย่างหมดจด ถาม 3 ธ. ค. เวลา 19:02 น. Basj ในสหรัฐอเมริการ้านค้าและผู้ผลิตมักออกคูปองเพื่อแลกรับส่วนลดหรือส่วนลดเมื่อซื้อผลิตภัณฑ์ พวกเขามักจะแพร่กระจายอย่างกว้างขวางผ่านทางจดหมายนิตยสารหนังสือพิมพ์อินเตอร์เน็ตจากผู้ค้าปลีกโดยตรงและโทรศัพท์มือถือเช่นโทรศัพท์มือถือ คูปองส่วนใหญ่มีวันหมดอายุหลังจากที่พวกเขาจะไม่ได้รับเกียรติจากร้านค้าและนี่คือสิ่งที่ผลิต quotvintagesquot คูปองอาจเพิ่มยอดขาย แต่จำนวนที่มีอยู่ออกหรือวิธีการที่ใหญ่ส่วนลดไม่เป็นที่รู้จักกันเสมอไปให้กับนักวิเคราะห์ข้อมูล คุณสามารถคิดถึงข้อผิดพลาดในเชิงบวกได้ ndash Dimitriy V. Masterov 28 ม. ค. 16 เวลา 21:51 น. ในบทความของเราความผันผวนของพอร์ตการลงทุนและการคำนวณความเสี่ยงจากการมีส่วนร่วมความเสี่ยงแบบอนุกรมที่เราวิเคราะห์แบบจำลองหลายตัวแปรของผลตอบแทนของสินทรัพย์ เนื่องจากเวลาปิดที่แตกต่างกันของตลาดหุ้นโครงสร้างการพึ่งพา (โดยความแปรปรวน) จะปรากฏขึ้น การพึ่งพาอาศัยกันนี้มีเพียงหนึ่งช่วงเวลาเท่านั้น ดังนั้นเราจะสร้างโมเดลนี้เป็นเวกเตอร์ที่เคลื่อนที่โดยเฉลี่ยตามลำดับที่ 1 (ดูหน้า 4 และ 5) กระบวนการผลงานที่เกิดขึ้นคือการแปลงเชิงเส้นของกระบวนการ VMA (1) ซึ่งโดยทั่วไปคือกระบวนการ MA (q) กับ qge1 (ดูรายละเอียดในหน้า 15 และ 16) ตอบ 3 ธ. ค. 12 ที่โมเดล 21: 39ARMA และ ARIMA (Box-Jenkins) แบบจำลอง ARMA และ ARIMA (Box-Jenkins) ในส่วนก่อนหน้านี้เราได้เห็นว่าค่าของชุดเวลาที่ไม่เท่ากันในเวลา t x t สามารถจำลองโดยใช้การแสดงออกที่หลากหลายของการเคลื่อนที่ นอกจากนี้เรายังแสดงให้เห็นว่าองค์ประกอบต่างๆเช่นแนวโน้มและระยะเวลาในชุดข้อมูลเวลาสามารถสร้างแบบจำลองได้อย่างชัดเจนและแยกออกจากกันโดยมีข้อมูลถูกสลายตัวออกเป็นองค์ประกอบแนวโน้มและตามฤดูกาล เรายังแสดงให้เห็นในการอภิปรายก่อนหน้านี้เกี่ยวกับความสัมพันธ์ ที่สัมประสิทธิ์ความสัมพันธ์กันเต็มรูปแบบและบางส่วนมีประโยชน์อย่างยิ่งในการระบุและรูปแบบการจัดรูปแบบในชุดเวลา ทั้งสองด้านของการวิเคราะห์และการสร้างแบบจำลองลำดับเวลาสามารถรวมกันในกรอบการสร้างแบบจำลองโดยรวมที่มีประสิทธิภาพและมีประสิทธิภาพมากขึ้น ในรูปแบบพื้นฐานวิธีนี้เป็นที่รู้จักกันในชื่อ ARMA modeling (ค่าเฉลี่ยเคลื่อนที่อัตถิภาวนา) หรือเมื่อ differencing รวมอยู่ในขั้นตอน ARIMA หรือ Box-Jenkins modeling หลังจากที่ผู้เขียนทั้งสองคนเป็นศูนย์กลางในการพัฒนา (ดู Box amp Jenkins, 1968 BOX1 และ Box, Jenkins amp Reinsel, 1994 BOX2) ไม่มีกฎถาวรเกี่ยวกับจำนวนรอบระยะเวลาที่จำเป็นสำหรับการสร้างแบบจำลองที่ประสบความสำเร็จ แต่สำหรับโมเดลที่ซับซ้อนมากขึ้นและเพื่อความมั่นใจมากขึ้นในขั้นตอนการพอดีและการตรวจสอบความถูกต้องมักใช้ชุดที่มี 50 ขั้นตอนเวลา รูปแบบ ARMA รวมวิธีการเชื่อมโยงกัน (AR) และค่าเฉลี่ยเคลื่อนที่ (MA) เข้าด้วยกันเป็นรูปแบบคอมโพสิตของชุดข้อมูลเวลา ก่อนพิจารณาว่ารูปแบบเหล่านี้สามารถรวมกันได้เราจะตรวจสอบแต่ละแบบแยกกัน เราได้เห็นว่าโมเดลค่าเฉลี่ยเคลื่อนที่ (MA) สามารถใช้เพื่อให้พอดีกับชุดข้อมูลบางชุดและรูปแบบต่างๆในโมเดลเหล่านี้ซึ่งเกี่ยวข้องกับการปรับค่าเสี้ยนเป็นทวีคูณให้เป็นคู่หรือสามสามารถจัดการกับส่วนประกอบของแนวโน้มและเป็นระยะ ๆ ในข้อมูลได้ นอกจากนี้แบบจำลองดังกล่าวสามารถใช้เพื่อสร้างการคาดการณ์ที่เลียนแบบพฤติกรรมของงวดก่อนหน้าได้ รูปแบบที่เรียบง่ายของแบบจำลองดังกล่าวซึ่งอิงจากข้อมูลก่อนสามารถเขียนได้ว่า: ในกรณีที่ข้อกำหนดเบต้า i เป็นน้ำหนักที่นำมาใช้กับค่าก่อนหน้าในชุดข้อมูลเวลาและโดยปกติแล้วจะกำหนดค่าเบต้า 1 โดยไม่สูญเสียความเป็นทั่วไป ดังนั้นสำหรับขั้นตอนการสั่งซื้อครั้งแรก q 1 และเรามีรูปแบบ ได้แก่ ค่าเฉลี่ยเคลื่อนที่จะประมาณเป็นค่าเฉลี่ยถ่วงน้ำหนักของค่าในอดีตและในอดีตที่ผ่านมา กระบวนการเฉลี่ยนี้เป็นกลไกในการทำให้เรียบโดยไม่ต้องเชื่อมโยงโดยตรงกับแบบจำลองทางสถิติ อย่างไรก็ตามเราสามารถระบุรูปแบบทางสถิติ (หรือ stochastic) ที่รวบรวมขั้นตอนการย้ายค่าเฉลี่ยร่วมกับกระบวนการสุ่ม ถ้าเราปล่อยให้เป็นชุดของตัวแปรสุ่มแบบกระจายอิสระและสุ่ม (กระบวนการแบบสุ่ม) ที่มีค่าความแปรปรวนคงที่เป็นศูนย์และเป็นที่รู้จักแล้วเราสามารถเขียนกระบวนการนี้เป็นค่าเฉลี่ยเคลื่อนที่ของลำดับ q ในแง่ของ: เห็นได้ชัดว่าค่าที่คาดหวังของ xt ภายใต้ โมเดลนี้มีค่าเป็น 0 ดังนั้นรูปแบบจะถูกต้องถ้า xt ได้รับการปรับค่าให้เป็นศูนย์หรือถ้าค่าคงที่คงที่ (ค่าเฉลี่ยของ xt) จะถูกบวกเข้าไปในยอดรวม นอกจากนี้ยังเห็นได้ชัดว่าความแปรปรวนของ xt เป็นเพียงการวิเคราะห์ข้างต้นสามารถขยายเพื่อประเมินความแปรปรวนร่วม cov (xt. xtk) ซึ่งเราพบว่า yields: โปรดทราบว่าทั้งค่าเฉลี่ยหรือความแปรปรวนร่วม (หรือความแปรปรวนร่วม) ที่ล้าหลัง k เป็นฟังก์ชันของเวลา t ดังนั้นขั้นตอนนี้จึงเป็นลำดับที่สอง นิพจน์ด้านบนช่วยให้เราสามารถหานิพจน์ของฟังก์ชันความสัมพันธ์ (autocorrelation function: acf): ถ้า k 0 rho k 1 และสำหรับ k gt q rho k 0 นอกจากนี้ acf เป็นสมมาตรและ rho k rho - k acf สามารถคำนวณได้จากกระบวนการ MA process แรก: ส่วนประกอบ autoregressive หรือ AR ของรูปแบบ ARMA สามารถเขียนได้ในรูปแบบ: โดยที่เงื่อนไขเป็นค่าสัมประสิทธิ์การคลาดเคลื่อน autocorrelation ที่ lags 1,2 p และ z เป็นระยะเวลาข้อผิดพลาดที่เหลือ โปรดสังเกตว่าคำผิดพลาดนี้เกี่ยวข้องกับช่วงเวลาปัจจุบัน t ดังนั้นสำหรับขั้นตอนการสั่งซื้อครั้งแรก p 1 และเรามีแบบจำลอง: นิพจน์เหล่านี้ระบุว่าค่าประมาณของ x ในเวลา t จะถูกกำหนดโดยค่าก่อนหน้าทันทีของ x (เช่นเวลา t -1) คูณด้วยค่าอัลฟ่า . ของขอบเขตที่ค่าของคู่ของค่าในแต่ละช่วงเวลาที่อยู่ในระยะห่าง 1 นอกเหนือจากนี้มีความสัมพันธ์กัน (ความสัมพันธ์ระหว่างความสัมพันธ์) รวมถึงข้อผิดพลาดที่เหลือ z เวลา t แต่นี่เป็นคำนิยามของกระบวนการมาร์คอฟ ดังนั้นกระบวนการ Markov เป็นกระบวนการอัตโนมัติอันดับแรก ถ้า alpha 1 แบบระบุว่าค่าถัดไปของ x เป็นค่าบวกก่อนหน้าบวกคำผิดพลาดแบบสุ่มและด้วยเหตุนี้การเดินแบบสุ่ม 1D แบบง่ายๆ หากมีเงื่อนไขมากขึ้นโมเดลจะประมาณค่าของ x ณ เวลา t ด้วยผลรวมน้ำหนักของข้อตกลงเหล่านี้บวกกับคอมโพเนนต์ข้อผิดพลาดแบบสุ่ม ถ้าเราเปลี่ยนนิพจน์ที่สองข้างต้นเป็นอันดับแรกเราจะมี: และการประยุกต์ใช้การแทนที่นี้ซ้ำ: ตอนนี้ถ้า alpha lt1 และ k มีขนาดใหญ่การแสดงออกนี้สามารถเขียนในลำดับที่กลับกันโดยมีเงื่อนไขลดลงและมีส่วนร่วมจากคำดังกล่าว ใน x ด้านขวาของการแสดงออกกลายเป็นเล็ก ๆ น้อย ๆ อย่างมากดังนั้นเราจึงมี: เนื่องจากทางด้านขวาของรูปแบบนิพจน์ xt เป็นผลรวมของชุดถ่วงน้ำหนักของค่าก่อนหน้านี้ในกรณีนี้ข้อผิดพลาดแบบสุ่มเป็นที่ชัดเจนว่า แบบจำลอง AR นี้เป็นรูปแบบของ MA และถ้าเราสมมติว่าเงื่อนไขข้อผิดพลาดมีค่าศูนย์และค่าคงที่เป็นศูนย์แล้วเช่นเดียวกับในรูปแบบ MA เรามีค่าที่คาดหวังของแบบจำลองเป็น 0 สมมติว่า xt ได้รับการปรับค่าเป็นศูนย์ด้วยความแปรปรวน: Now as ตราบใดที่ alpha lt1 ผลรวมนี้มี จำกัด และเป็นเพียง 1 (1 - alpha) ดังนั้นเราจึงมี: เช่นเดียวกับแบบจำลอง MA ข้างต้นการวิเคราะห์นี้สามารถขยายเพื่อประเมินความแปรปรวนร่วม, cov (x t. x tk) เป็นครั้งแรก order AR process ซึ่งเราหา yields: สำหรับ alpha lt1 ผลรวมนี้มีจำนวน จำกัด และเป็นเพียง alpha k (1 alpha 2) ดังนั้นเราจึงมี: นี่แสดงให้เห็นว่าสำหรับแบบจำลอง autoregressive อันดับแรกฟังก์ชัน autocorrelation (acf) โดยอำนาจต่อเนื่องของความสัมพันธ์อัตโนมัติลำดับแรกมีเงื่อนไข alpha lt1 สำหรับ alpha gt0 นี่เป็นเพียงแค่การลดกำลังไฟฟ้าอย่างรวดเร็วหรือเส้นโค้งที่มีการอธิบายเป็นศูนย์เท่านั้นหรือสำหรับ lt0 มันเป็นเส้นโค้งการแกว่งตัวลดลงอีกครั้งโดยให้ค่าเป็นศูนย์ หากสมมติฐานว่าชุดเวลาเป็นนิ่งการวิเคราะห์ข้างต้นสามารถขยายไปสู่ลำดับที่สองและสูงขึ้นได้ เพื่อให้พอดีกับรูปแบบ AR เป็นชุดข้อมูลที่สังเกตได้เราจึงพยายามลดผลรวมของข้อผิดพลาดสี่เหลี่ยม (รูปสี่เหลี่ยมผืนผ้าน้อยที่สุด) โดยใช้จำนวนคำที่เล็กที่สุดซึ่งให้ข้อมูลพอดีกับข้อมูลที่น่าพอใจ โมเดลประเภทนี้ถูกอธิบายว่าเป็นแบบอัตโนมัติ และอาจถูกนำไปใช้กับชุดข้อมูลทั้งสองแบบและชุดข้อมูลเชิงพื้นที่ (ดูเพิ่มเติมโมเดลการถดถอยเชิงพื้นที่) แม้ว่าในทางทฤษฎีแบบจำลองอัตถดถอยอาจให้ข้อมูลพอดีกับชุดข้อมูลที่สังเกตได้ แต่ก็มักต้องมีการลบองค์ประกอบแนวโน้มและเป็นระยะ ๆ ก่อนและอาจจำเป็นต้องใช้คำจำนวนมากเพื่อให้เหมาะสมกับข้อมูล อย่างไรก็ตามโดยการรวมรุ่น AR เข้ากับโมเดล MA ทำให้เราสามารถผลิตแบบจำลองผสมผสานของครอบครัวที่สามารถใช้งานได้ในหลากหลายสถานการณ์ โมเดลเหล่านี้เรียกว่า ARMA และ ARIMA และอธิบายไว้ในส่วนย่อยต่อไปนี้ ในสองส่วนย่อยก่อนหน้านี้เราได้แนะนำโหมด MA ของคำสั่ง q: และแบบจำลอง AR ของคำสั่ง p: เราสามารถรวมทั้งสองโมเดลเหล่านี้โดยการรวมกันเป็นรูปแบบของคำสั่ง (p. q) ซึ่งเรามีเงื่อนไข AR AR และ q ข้อกำหนดของ MA: โดยทั่วไปรูปแบบ ARMA แบบรวมนี้สามารถใช้ในการสร้างชุดข้อมูลแบบเวลาโดยมีเงื่อนไขน้อยกว่า MA หรือ AR model ด้วยตัวเอง แสดงค่าประมาณ ณ เวลา t เป็นผลรวมของเงื่อนไข q ซึ่งแสดงถึงการเปลี่ยนแปลงโดยเฉลี่ยของรูปแบบการสุ่มในช่วงก่อนหน้า (ส่วนประกอบ MA) บวกกับผลรวมของเงื่อนไข AR ที่คำนวณค่าปัจจุบันของ x เป็นจำนวนเงินที่ถัวเฉลี่ย ของค่า p ล่าสุด อย่างไรก็ตามรูปแบบของรูปแบบนี้อนุมานว่าชุดข้อมูลเวลาเป็นนิ่งซึ่งไม่ค่อยเกิดขึ้น ในทางปฏิบัติแนวโน้มและระยะเวลาที่มีอยู่ในชุดข้อมูลจำนวนมากดังนั้นจึงจำเป็นต้องเอาลักษณะพิเศษเหล่านี้ออกก่อนที่จะใช้โมเดลดังกล่าว การกำจัดโดยทั่วไปจะดำเนินการโดยรวมอยู่ในรูปแบบของขั้นตอนการเริ่มต้นที่แตกต่างกันโดยทั่วไปครั้งหนึ่งครั้งสองครั้งหรือสามครั้งจนกว่าชุดจะมีอย่างน้อยอย่างน้อยคงที่โดยไม่มีการแสดงแนวโน้มหรือช่วงเวลาที่ชัดเจน เช่นเดียวกับกระบวนการ MA และ AR กระบวนการ differencing จะอธิบายตามลำดับของ differencing ตัวอย่างเช่น 1, 2, 3 โดยรวมทั้งสามองค์ประกอบประกอบกันเป็นสามส่วน: (p. d. q) ซึ่งกำหนดชนิดของแบบจำลองที่ใช้ ในรูปแบบนี้โมเดลจะถูกอธิบายเป็นรูปแบบ ARIMA ตัวอักษร I ใน ARIMA หมายถึงข้อเท็จจริงที่ว่าชุดข้อมูลนั้นมีความแตกต่างกันในตอนแรก (cf. differentiation) และเมื่อการสร้างแบบจำลองเสร็จสิ้นแล้วผลลัพธ์จะต้องรวมหรือสรุปเพื่อสร้างการประมาณและการคาดการณ์ขั้นสุดท้าย แบบจำลอง ARIMA จะกล่าวถึงด้านล่าง ดังที่ได้กล่าวไว้ในหมวดย่อยก่อนหน้าการรวมช่วงเวลาที่ไม่ใช่ stationary กับแบบจำลอง ARMA ทำให้ครอบครัวมีรูปแบบที่มีประสิทธิภาพซึ่งสามารถนำไปใช้ในสถานการณ์ที่หลากหลายได้ การพัฒนารูปแบบการขยายรูปแบบนี้เป็นส่วนใหญ่เนื่องจาก G E P Box และ G M Jenkins และเป็นผลให้ ARIMA เป็นที่รู้จักกันในชื่อ Box-Jenkins models ขั้นตอนแรกในกระบวนการ Box-Jenkins คือการให้ชุดเวลาแตกต่างกันไปจนกว่าจะมีการหยุดนิ่งซึ่งจะช่วยให้แน่ใจได้ว่าแนวโน้มและส่วนประกอบตามฤดูกาลจะถูกลบออก ในหลายกรณีหนึ่งหรือสองขั้นตอน differencing เพียงพอ ชุด differenced จะสั้นกว่าชุดแหล่งที่มาตามขั้นตอนเวลา c ซึ่ง c คือช่วงของ differencing แบบจำลอง ARMA จะพอดีกับชุดเวลาที่เกิดขึ้น เนื่องจากโมเดล ARIMA มีพารามิเตอร์สามตัวจึงมีหลายแบบให้เหมาะกับรูปแบบที่เป็นไปได้ที่สามารถติดตั้งได้ อย่างไรก็ตามการตัดสินใจเกี่ยวกับพารามิเตอร์เหล่านี้ควรเป็นไปตามหลักการพื้นฐานหลายประการ: (i) แบบจำลองควรมีความเรียบง่ายที่สุดเท่าที่จะเป็นไปได้นั่นคือมีเพียงไม่กี่คำเท่าที่จะทำได้ซึ่งจะหมายถึงค่าของ p และ q ควรมีขนาดเล็ก (2) พอดีกับข้อมูลที่มีคุณค่าทางประวัติศาสตร์ควรมีขนาดที่ดีที่สุดเท่าที่จะเป็นไปได้คือขนาดของความแตกต่างระหว่างค่าประมาณที่ช่วงเวลาที่ผ่าน ๆ มาและมูลค่าที่แท้จริงควรจะลดลง (หลักการสแควร์น้อย) - ส่วนที่เหลือ จากรูปแบบที่เลือกสามารถตรวจสอบเพื่อดูว่าส่วนที่เหลือเหลืออยู่อย่างมีนัยสำคัญแตกต่างจาก 0 (ดูเพิ่มเติมด้านล่าง) (iii) autocorrelation บางส่วนที่วัดที่ lags 1,2,3 ควรให้ข้อบ่งชี้ลำดับของส่วนประกอบ AR เช่นค่าที่เลือกสำหรับ q (iv) รูปแบบของฟังก์ชัน autocorrelation function (acf) สามารถแนะนำรูปแบบ ARIMA ที่ต้องการได้ - ตารางด้านล่าง (จาก NIST) ให้คำแนะนำใน การตีความรูปแบบของ acf ในรูปแบบของการเลือก ARIMA การเลือกแบบจำลองโดยใช้ชุดรูปแบบ acf ไม่ใช่แบบคงที่ แบบจำลอง ARIMA มาตรฐานมักอธิบายโดยสามครั้ง: (p. d. q) ตามที่ระบุไว้ด้านบน เหล่านี้กำหนดโครงสร้างของรูปแบบในแง่ของการสั่งซื้อของ AR, differencing และแบบ MA ที่จะใช้ นอกจากนี้ยังสามารถรวมพารามิเตอร์ที่คล้ายคลึงกันสำหรับข้อมูลตามฤดูกาลได้ด้วยแม้ว่าแบบจำลองดังกล่าวจะมีความซับซ้อนมากขึ้นเพื่อให้พอดีและสามารถตีความได้ แต่โดยทั่วไปแล้ว tripe (P. D. Q) มักใช้เพื่อระบุส่วนประกอบแบบจำลองดังกล่าว ในภาพหน้าจอจาก SPSS ที่แสดงไว้ด้านล่างกล่องโต้ตอบสำหรับการเลือกองค์ประกอบโครงสร้างที่ไม่ใช่ฤดูกาลและตามฤดูกาลจะปรากฏขึ้น (สิ่งอำนวยความสะดวกแบบเดียวกันนี้มีอยู่ในแพคเกจแบบรวมเช่น SASETS) สามารถมองเห็นไดอะล็อกนี้ยังช่วยให้สามารถแปลงข้อมูล (โดยปกติจะช่วยในการรักษาเสถียรภาพของตัวแปร) และเพื่อให้ผู้ใช้สามารถใส่ค่าคงที่ในรูปแบบ (ค่าดีฟอลต์) เครื่องมือซอฟต์แวร์พิเศษนี้อนุญาตให้มีการตรวจพบข้อผิดพลาดเมื่อจำเป็นตามขั้นตอนการตรวจจับ แต่ในหลาย ๆ กรณีข้อผิดพลาดจะได้รับการตรวจสอบและปรับเปลี่ยนหรือลบค่าและทดแทนค่าก่อนที่จะมีการวิเคราะห์ดังกล่าว SPSS Time Series Modeler: การสร้างแบบจำลอง ARIMA, โหมดผู้เชี่ยวชาญหลายโมเดล ARIMA สามารถติดตั้งกับข้อมูลด้วยตนเองหรือผ่านขั้นตอนอัตโนมัติ (เช่นขั้นตอน) และหนึ่งหรือหลายมาตรการที่ใช้ในการตัดสินที่ดีที่สุดในแง่ของ พอดีและพาร์ค การเปรียบเทียบแบบนี้มักใช้การคำนวณทางทฤษฎีอย่างน้อยหนึ่งข้อที่ได้อธิบายไว้ก่อนหน้านี้ในคู่มือฉบับนี้ AIC, BIC andor MDL (ฟังก์ชัน R arima () ให้การวัด AIC ในขณะที่ SPSS มีมาตรการที่เหมาะสมรวมถึง รุ่นของสถิติ BIC เครื่องมืออื่น ๆ ที่แตกต่างกันไปในมาตรการที่มีให้ - Minitab ซึ่งมีช่วงของวิธี TSA ไม่รวมถึงสถิติประเภท AICBIC) ในทางปฏิบัติคุณสามารถใช้มาตรการต่างๆ (เช่นนอกเหนือจากมาตรการอื่นที่นอกเหนือจากมาตรการที่ใช้กำลังสองน้อยที่สุด) เพื่อประเมินคุณภาพของรูปแบบตัวอย่างเช่นค่าความผิดพลาดที่แท้จริงและความคลาดเคลื่อนสัมบูรณ์สูงสุดอาจเป็นมาตรการที่เป็นประโยชน์เนื่องจากแม้แต่น้อยที่สุด squares พอดีอาจยังไม่ดีในสถานที่จำนวนชุดซอฟต์แวร์อาจให้วัดโดยรวมของ autocorrelation ที่อาจอยู่ในส่วนที่เหลือหลังจากเหมาะสมรูปแบบสถิติที่ใช้บ่อยคือ Ljung และกล่อง (1978 LJU1) และ มีรูปแบบ: n คือจำนวนตัวอย่าง (ค่าข้อมูล), ri คือความสัมพันธ์ของตัวอย่างที่ lag i. และ k คือจำนวนรวมของความล่าช้าที่คำนวณได้ดำเนินการ Q k มีการกระจายโดยประมาณเป็นไค การแจกแจงแบบสแควร์กับองศาอิสระของ k - m โดยที่ m คือจำนวนพารามิเตอร์ที่ใช้ในการประกอบโมเดลโดยไม่รวมตัวแปรที่มีค่าคงที่หรือตัวทำนาย (กล่าวคือเพียงรวม pd q triples) ถ้าการวัดมีนัยสำคัญทางสถิติ มันบ่งชี้ว่าส่วนที่เหลือยังคงมีนัยสำคัญ autocorrelation หลังจากที่รูปแบบได้รับการติดตั้งแนะนำว่าควรปรับปรุงรูปแบบ ตัวอย่าง: การสร้างแบบจำลองการเติบโตของจำนวนผู้โดยสารสายการบินตัวอย่างต่อไปนี้เป็นตัวอย่างของการติดตั้งแบบอัตโนมัติโดยใช้ SPSS ไปยังข้อมูลการทดสอบของ Box-Jenkins-Reinsel สำหรับสายการบินผู้โดยสาร REI1 ที่ให้ไว้ในคู่มือฉบับนี้ก่อนหน้านี้ ในตอนแรกไม่มีการกำหนดวันที่ที่ระบุเป็นเดือนภายในไม่กี่ปี แบบจำลองที่เลือกโดยกระบวนการอัตโนมัติคือแบบจำลอง ARIMA (0,1,12) นั่นคือกระบวนการระบุได้อย่างถูกต้องว่าชุดข้อมูลจำเป็นต้องใช้ระดับความแตกต่างและใช้โมเดลเฉลี่ยถ่วงน้ำหนักในระดับหนึ่งและมีช่วงเวลาเป็น 12 และไม่มีองค์ประกอบเกี่ยวกับการเทียบเคียงใด ๆ ข้อมูล. โมเดลพอดีมีค่า R 2 เท่ากับ 0.966 ซึ่งสูงมากและมีค่าความผิดพลาดสูงสุด (MAE) เท่ากับ 75 ตัวอย่างแบบจำลองของข้อมูลมีลักษณะที่ยอดเยี่ยม แต่เป็นพล็อตของความสัมพันธ์ที่ตกค้างหลังการติดตั้งและ Ljung ทดสอบกล่องแสดงให้เห็นว่า autocorrelation สำคัญยังคงแสดงให้เห็นว่ารูปแบบที่ดีขึ้นเป็นไปได้ Automated ARIMA พอดีกับผู้โดยสารสายการบินนานาชาติ: Total Tracals ประจำเดือน, 1949-1960 การตรวจสอบนี้เป็นแบบจำลองที่ปรับปรุงแล้วโดยอาศัยข้อมูลจากชุดข้อมูลนี้โดย Box and Jenkins (1968) และฉบับปรับปรุงของ Chatfields (1975 CHA1) book in ซึ่งเขาใช้ Minitab เพื่อแสดงการวิเคราะห์ของเขา (ฉบับที่ 6, 2003) ชุดเวลาได้รับการกำหนดให้มีระยะเวลา 12 เดือนและรุ่น ARIMA มีส่วนประกอบ (0.1,1), (0.1,1) ผลกราฟิกมีลักษณะคล้ายกับแผนภูมิข้างต้น แต่ด้วยแบบจำลองนี้ R-squared เท่ากับ 0.991 MAE41 และสถิติ Ljung-Box ไม่มีนัยสำคัญ (12.6 และ 16 องศาอิสระ) รูปแบบจึงเป็นการปรับปรุงในรูปแบบเดิม (สร้างขึ้นโดยอัตโนมัติ) โดยประกอบด้วย MA ที่ไม่เป็นฤดูกาลและองค์ประกอบของฤดูกาลตามฤดูกาลไม่มีองค์ประกอบที่เป็นอัตรอัตโนมและระดับหนึ่งของความแตกต่างสำหรับโครงสร้างตามฤดูกาลและที่ไม่ใช่ฤดูกาล รูปแบบ ARIMA อาจเป็นกรอบการทำงานที่ดีสำหรับการสร้างแบบจำลองชุดเวลาหรืออาจเป็นไปได้ว่ารูปแบบหรือวิธีการทางเลือกจะให้ผลลัพธ์ที่น่าพอใจมากขึ้น บ่อยครั้งที่มันเป็นเรื่องยากที่จะทราบล่วงหน้าว่ารูปแบบการพยากรณ์ใด ๆ ที่คาดว่าจะได้ผลดีเพียงใดเนื่องจากเป็นเพียงความสามารถในการคาดการณ์ค่าในอนาคตของชุดข้อมูลที่สามารถตัดสินได้อย่างแท้จริง บ่อยครั้งที่กระบวนการนี้เป็นไปในรูปแบบที่เหมาะสมกับข้อมูลที่ผ่านมาโดยไม่รวมช่วงเวลาล่าสุด (เรียกอีกอย่างว่าตัวอย่างการระงับ) และใช้โมเดลเพื่อทำนายเหตุการณ์ในอนาคตที่เป็นที่รู้จักเหล่านี้ แต่แม้ข้อเสนอนี้จะมีความเชื่อมั่น จำกัด ในความถูกต้องในอนาคตเท่านั้น การคาดการณ์ในระยะยาวอาจไม่น่าเชื่อถือมากโดยใช้วิธีการดังกล่าว เห็นได้ชัดว่ารูปแบบสถิติการจราจรทางอากาศระหว่างประเทศที่กล่าวไว้ข้างต้นไม่สามารถทำนายจำนวนผู้โดยสารได้อย่างถูกต้องในช่วงปี 1990 หรือเกินจำนวนเที่ยวบินของสายการบินระหว่างประเทศของสหรัฐฯในช่วง 5 ปีที่โพสต์ 9112001 เช่นเดียวกันรูปแบบ ARIMA สามารถพอดีกับค่าทางประวัติศาสตร์ ของราคาหุ้นหรือดัชนี (เช่นดัชนีของ NYSE หรือ FTSE) และโดยทั่วไปแล้วจะให้ข้อมูลที่ดี (ให้ค่า R-squared ดีกว่า 0.99) แต่มักใช้เพียงเล็กน้อยในการพยากรณ์ค่าในอนาคตของราคาเหล่านี้ หรือดัชนี โดยปกติแล้ว ARIMA จะใช้สำหรับการคาดการณ์โดยเฉพาะอย่างยิ่งในด้านการสร้างแบบจำลองทางเศรษฐกิจมหภาคและเศรษฐกิจมหภาค อย่างไรก็ตามสามารถใช้ในสาขาวิชาต่างๆได้ทั้งในรูปแบบที่อธิบายไว้ในที่นี้หรือเพิ่มตัวแปร predictor เพิ่มเติมซึ่งเชื่อว่าจะช่วยเพิ่มความน่าเชื่อถือของการคาดการณ์ หลังมีความสำคัญเนื่องจากโครงสร้างทั้งหมดของแบบจำลอง ARMA ที่กล่าวถึงข้างต้นจะขึ้นอยู่กับค่าก่อนหน้าและเหตุการณ์สุ่มที่เป็นอิสระตามเวลาไม่ใช่ปัจจัยชี้แจงหรือสาเหตุใด ๆ ดังนั้นรูปแบบ ARIMA จะสะท้อนและขยายรูปแบบที่ผ่านมาเท่านั้นซึ่งอาจจำเป็นต้องแก้ไขในการคาดการณ์โดยปัจจัยต่างๆเช่นสภาพแวดล้อมทางเศรษฐกิจมหภาคการเปลี่ยนแปลงทางเทคโนโลยีหรือการเปลี่ยนแปลงทรัพยากรในระยะยาวหรือการเปลี่ยนแปลงด้านสิ่งแวดล้อม BOX1 กล่อง G E P, Jenkins G M (1968) ความก้าวหน้าบางอย่างในการคาดการณ์และการควบคุม สถิติประยุกต์, 17 (2), 91-109 กล่อง 2 กล่อง, G E P, Jenkins, G M, Reinsel G C (1994) การวิเคราะห์อนุกรมเวลาการคาดการณ์และการควบคุม 3rd ed. Prentice Hall, Englewood Cliffs, NJ CHA1 Chatfield C (1975) การวิเคราะห์ไทม์ซีรี่ส์: ทฤษฎีและการปฏิบัติ แชปแมนและฮอลล์, ลอนดอน (ดูเพิ่มเติม, 6th ed. 2003) LJU1 Ljung G M, กล่อง G E P (1978) เกี่ยวกับการวัดการขาดรูปแบบของซีรีส์ Fit in Time Biometrika, 65, 297303 คู่มืออิเล็กทรอนิกส์ NISTSEMATECH ของระเบียบวิธีทางสถิติ, itl. nist. govdiv898handbook ส่วน 6.4: บทนำเกี่ยวกับชุดข้อมูลเวลา 2010 SPSSPASW 17 (2008) AnalyzeForecasting (ซีรี่ส์ของซีรี่ส์เวลา) REI1 Reinsel G C ชุดข้อมูลสำหรับโมเดลกล่อง Jenkins: stat. wisc. edu

No comments:

Post a Comment