Data Set Information:
In predicting stock prices you collect data over some period of time - day, week, month, etc. But you cannot take advantage of data from a time period until the next increment of the time period. For example, assume you collect data daily. When Monday is over you have all of the data for that day. However you can invest on Monday, because you don't get the data until the end of the day. You can use the data from Monday to invest on Tuesday.
In our research each record (row) is data for a week. Each record also has the percentage of return that stock has in the following week (percent_change_next_weeks_price). Ideally, you want to determine which stock will produce the greatest rate of return in the following week. This can help you train and test your algorithm.
Some of these attributes might not be use used in your research. They were originally added to our database to perform calculations. (Brown, Pelosi & Dirska, 2013) used percent_change_price, percent_change_volume_over_last_wk, days_to_next_dividend, and percent_return_next_dividend. We left the other attributes in the dataset in case you wanted to use any of them. Of course what you want to maximize is percent_change_next_weeks_price.
Training data vs Test data:
In (Brown, Pelosi & Dirska, 2013) we used quarter 1 (Jan-Mar) data for training and quarter 2 (Apr-Jun) data for testing.
Interesting data points:
If you use quarter 2 data for testing, you will notice something interesting in the week ending 5/27/2011 every Dow Jones Index stock lost money.
ข้อมูลชุดข้อมูล:ในการทำนายราคาหุ้น คุณต้องเก็บข้อมูลบางระยะเวลา - วัน สัปดาห์ เดือน เป็นต้น แต่คุณไม่สามารถใช้ประโยชน์จากข้อมูลจากรอบระยะเวลาจนเพิ่มถัดไปของรอบระยะเวลา ตัวอย่าง สมมติว่า คุณเก็บรวบรวมข้อมูลทุกวัน เมื่อวันจันทร์เป็นกว่าได้ข้อมูลทั้งหมดสำหรับวันนั้น แต่คุณสามารถลงทุนในวันจันทร์ เนื่องจากคุณไม่ได้รับข้อมูลจนถึงจุดสิ้นสุดของวัน คุณสามารถใช้ข้อมูลจากวันจันทร์จะลงทุนในวันอังคาร ในการวิจัยของ แต่ละระเบียน (แถว) เป็นข้อมูลสำหรับสัปดาห์ แต่ละระเบียนมีเปอร์เซ็นต์ผลตอบแทนที่มีหุ้นในสัปดาห์ถัดไป (percent_change_next_weeks_price) ดาว คุณต้องการหาหุ้นที่จะสร้างอัตราผลตอบแทนยิ่งใหญ่ที่สุดในสัปดาห์ต่อไปนี้ ซึ่งสามารถช่วยให้คุณฝึก และทดสอบของอัลกอริทึม บางแอตทริบิวต์เหล่านี้อาจไม่ได้ใช้ที่ใช้ในการวิจัยของคุณ พวกเขาเดิมเพิ่มฐานข้อมูลของเราเพื่อทำการคำนวณ (Brown, Pelosi และ Dirska, 2013) ใช้ percent_change_price, percent_change_volume_over_last_wk, days_to_next_dividend และ percent_return_next_dividend เราปล่อยแอททริบิวต์อื่น ๆ ในชุดข้อมูลในกรณีที่คุณต้องการใช้ของพวกเขา แน่นอนสิ่งที่คุณต้องการเพิ่มเป็น percent_change_next_weeks_price เทียบกับข้อมูลในการฝึกอบรมทดสอบข้อมูล: (Brown, Pelosi และ Dirska, 2013) เราใช้ไตรมาส 1 (มกราคมมีนาคม) ข้อมูลการฝึกอบรม และไตรมาส 2 (เมษายนมิถุนายน) ข้อมูลสำหรับการทดสอบ จุดข้อมูลที่น่าสนใจ: ถ้าคุณใช้ข้อมูลไตรมาสที่ 2 สำหรับทดสอบ คุณจะสังเกตเห็นบางสิ่งบางอย่างที่น่าสนใจในสัปดาห์ที่สิ้นสุด 5/27/2011 ทุกดาวโจนส์ดัชนีหุ้นสูญเงิน
การแปล กรุณารอสักครู่..

ข้อมูลชุดข้อมูล: ในการคาดการณ์ราคาหุ้นที่คุณเก็บรวบรวมข้อมูลในช่วงเวลาบาง - วันสัปดาห์เดือน ฯลฯ แต่คุณไม่สามารถใช้ประโยชน์จากข้อมูลที่ได้จากช่วงเวลาจนกระทั่งถึงต่อไปของช่วงเวลา ตัวอย่างเช่นสมมติคุณเก็บข้อมูลทุกวัน เมื่อวันจันทร์เป็นมากกว่าคุณมีข้อมูลทั้งหมดในวันนั้น แต่คุณสามารถลงทุนในวันจันทร์เพราะคุณไม่ได้รับข้อมูลจนกว่าจะเสร็จสิ้นในวันนี้ คุณสามารถใช้ข้อมูลตั้งแต่วันจันทร์ที่จะลงทุนในวันอังคาร. ในงานวิจัยของเราในแต่ละบันทึก (แถว) เป็นข้อมูลสำหรับสัปดาห์ แต่ละระเบียนนอกจากนี้ยังมีผลตอบแทนร้อยละของหุ้นที่มีอยู่ในสัปดาห์ต่อไปนี้ (percent_change_next_weeks_price) เป็นการดีที่คุณต้องการที่จะตรวจสอบว่าหุ้นจะผลิตอัตราผลตอบแทนที่ยิ่งใหญ่ที่สุดในสัปดาห์ต่อมา นี้สามารถช่วยคุณในการฝึกอบรมและการทดสอบขั้นตอนวิธีการของคุณ. บางส่วนของคุณสมบัติเหล่านี้อาจจะไม่ได้ใช้ใช้ในการวิจัยของคุณ พวกเขาถูกเพิ่มเดิมไปยังฐานข้อมูลของเราที่จะดำเนินการคำนวณ (สีน้ำตาล, ซีเปโลซีและ Dirska, 2013) ที่ใช้ percent_change_price, percent_change_volume_over_last_wk, days_to_next_dividend และ percent_return_next_dividend เรายังเหลือคุณลักษณะอื่น ๆ ในชุดข้อมูลในกรณีที่คุณต้องการที่จะใช้ใด ๆ ของพวกเขา แน่นอนสิ่งที่คุณต้องการที่จะเพิ่มเป็น percent_change_next_weeks_price. ข้อมูลการฝึกอบรม vs ข้อมูลการทดสอบ: ใน (สีน้ำตาล, ซีเปโลซีและ Dirska, 2013) ที่เราใช้ในไตรมาสที่ 1 (ม.ค. มี.ค. ) ข้อมูลสำหรับการฝึกอบรมและไตรมาสที่ 2 (เมษายนมิถุนายน) ข้อมูลสำหรับการทดสอบจุดข้อมูลที่น่าสนใจ: ถ้าคุณใช้ไตรมาส 2 ข้อมูลสำหรับการทดสอบคุณจะพบสิ่งที่น่าสนใจในสัปดาห์ที่สิ้นสุดวันที่ 5/27/2011 ทุกดัชนีดาวโจนส์หุ้นสูญเสียเงิน
การแปล กรุณารอสักครู่..
