Citation Request:
This dataset is public available for research. The details are described in [Cortez and Morais, 2007].
Please include this citation if you plan to use this database:
P. Cortez and A. Morais. A Data Mining Approach to Predict Forest Fires using Meteorological Data.
In J. Neves, M. F. Santos and J. Machado Eds., New Trends in Artificial Intelligence,
Proceedings of the 13th EPIA 2007 - Portuguese Conference on Artificial Intelligence, December,
Guimaraes, Portugal, pp. 512-523, 2007. APPIA, ISBN-13 978-989-95618-0-9.
Available at: http://www.dsi.uminho.pt/~pcortez/fires.pdf
1. Title: Forest Fires
2. Sources
Created by: Paulo Cortez and Aníbal Morais (Univ. Minho) @ 2007
3. Past Usage:
P. Cortez and A. Morais. A Data Mining Approach to Predict Forest Fires using Meteorological Data.
In Proceedings of the 13th EPIA 2007 - Portuguese Conference on Artificial Intelligence,
December, 2007. (http://www.dsi.uminho.pt/~pcortez/fires.pdf)
In the above reference, the output "area" was first transformed with a ln(x+1) function.
Then, several Data Mining methods were applied. After fitting the models, the outputs were
post-processed with the inverse of the ln(x+1) transform. Four different input setups were
used. The experiments were conducted using a 10-fold (cross-validation) x 30 runs. Two
regression metrics were measured: MAD and RMSE. A Gaussian support vector machine (SVM) fed
with only 4 direct weather conditions (temp, RH, wind and rain) obtained the best MAD value:
12.71 +- 0.01 (mean and confidence interval within 95% using a t-student distribution). The
best RMSE was attained by the naive mean predictor. An analysis to the regression error curve
(REC) shows that the SVM model predicts more examples within a lower admitted error. In effect,
the SVM model predicts better small fires, which are the majority.
4. Relevant Information:
This is a very difficult regression task. It can be used to test regression methods. Also,
it could be used to test outlier detection methods, since it is not clear how many outliers
are there. Yet, the number of examples of fires with a large burned area is very small.
5. Number of Instances: 517
6. Number of Attributes: 12 + output attribute
Note: several of the attributes may be correlated, thus it makes sense to apply some sort of
feature selection.
7. Attribute information:
For more information, read [Cortez and Morais, 2007].
1. X - x-axis spatial coordinate within the Montesinho park map: 1 to 9
2. Y - y-axis spatial coordinate within the Montesinho park map: 2 to 9
3. month - month of the year: "jan" to "dec"
4. day - day of the week: "mon" to "sun"
5. FFMC - FFMC index from the FWI system: 18.7 to 96.20
6. DMC - DMC index from the FWI system: 1.1 to 291.3
7. DC - DC index from the FWI system: 7.9 to 860.6
8. ISI - ISI index from the FWI system: 0.0 to 56.10
9. temp - temperature in Celsius degrees: 2.2 to 33.30
10. RH - relative humidity in %: 15.0 to 100
11. wind - wind speed in km/h: 0.40 to 9.40
12. rain - outside rain in mm/m2 : 0.0 to 6.4
13. area - the burned area of the forest (in ha): 0.00 to 1090.84
(this output variable is very skewed towards 0.0, thus it may make
sense to model with the logarithm transform).
8. Missing Attribute Values: None
Citation Request: This dataset is public available for research. The details are described in [Cortez and Morais, 2007]. Please include this citation if you plan to use this database: P. Cortez and A. Morais. A Data Mining Approach to Predict Forest Fires using Meteorological Data. In J. Neves, M. F. Santos and J. Machado Eds., New Trends in Artificial Intelligence, Proceedings of the 13th EPIA 2007 - Portuguese Conference on Artificial Intelligence, December, Guimaraes, Portugal, pp. 512-523, 2007. APPIA, ISBN-13 978-989-95618-0-9. Available at: http://www.dsi.uminho.pt/~pcortez/fires.pdf1. Title: Forest Fires2. Sources Created by: Paulo Cortez and Aníbal Morais (Univ. Minho) @ 2007 3. Past Usage: P. Cortez and A. Morais. A Data Mining Approach to Predict Forest Fires using Meteorological Data. In Proceedings of the 13th EPIA 2007 - Portuguese Conference on Artificial Intelligence, December, 2007. (http://www.dsi.uminho.pt/~pcortez/fires.pdf) In the above reference, the output "area" was first transformed with a ln(x+1) function. Then, several Data Mining methods were applied. After fitting the models, the outputs were post-processed with the inverse of the ln(x+1) transform. Four different input setups were used. The experiments were conducted using a 10-fold (cross-validation) x 30 runs. Two regression metrics were measured: MAD and RMSE. A Gaussian support vector machine (SVM) fed with only 4 direct weather conditions (temp, RH, wind and rain) obtained the best MAD value: 12.71 +- 0.01 (mean and confidence interval within 95% using a t-student distribution). The best RMSE was attained by the naive mean predictor. An analysis to the regression error curve (REC) shows that the SVM model predicts more examples within a lower admitted error. In effect, the SVM model predicts better small fires, which are the majority. 4. Relevant Information: This is a very difficult regression task. It can be used to test regression methods. Also, it could be used to test outlier detection methods, since it is not clear how many outliers are there. Yet, the number of examples of fires with a large burned area is very small.5. Number of Instances: 517 6. Number of Attributes: 12 + output attribute Note: several of the attributes may be correlated, thus it makes sense to apply some sort of feature selection.7. Attribute information: For more information, read [Cortez and Morais, 2007]. 1. X - x-axis spatial coordinate within the Montesinho park map: 1 to 9 2. Y - y-axis spatial coordinate within the Montesinho park map: 2 to 9 3. month - month of the year: "jan" to "dec" 4. day - day of the week: "mon" to "sun" 5. FFMC - FFMC index from the FWI system: 18.7 to 96.20 6. DMC - DMC index from the FWI system: 1.1 to 291.3 7. DC - DC index from the FWI system: 7.9 to 860.6 8. ISI - ISI index from the FWI system: 0.0 to 56.10 9. temp - temperature in Celsius degrees: 2.2 to 33.30 10. RH - relative humidity in %: 15.0 to 100 11. wind - wind speed in km/h: 0.40 to 9.40 12. rain - outside rain in mm/m2 : 0.0 to 6.4 13. area - the burned area of the forest (in ha): 0.00 to 1090.84 (this output variable is very skewed towards 0.0, thus it may make sense to model with the logarithm transform). 8. Missing Attribute Values: None
การแปล กรุณารอสักครู่..

ขออ้างอิง :
ชุดข้อมูลนี้เป็นสาธารณะสามารถใช้ได้สำหรับการวิจัย รายละเอียดจะอธิบายในคอร์เตซและ Morais [ 2007 ]
กรุณาใส่อ้างอิงนี้ถ้าคุณวางแผนที่จะใช้ฐานข้อมูลนี้ :
หน้าคอร์เตซและอ. Morais . เป็นเหมืองข้อมูลวิธีการทำนายการเผาป่า การใช้ข้อมูลทางอุตุนิยมวิทยา
J . F . Santos ใน เนวิส , เอ็มเจ มาชาโดแผนที่และแนวโน้มใหม่ในปัญญาประดิษฐ์
รายงานการประชุมทางวิชาการ ครั้งที่ 13 epia 2007 - โปรตุเกส ในการประชุมปัญญาประดิษฐ์ , ธันวาคม ,
Guimaraes , โปรตุเกส , pp . 512-523 2007 ปปิอา isbn-13 , 978-989-95618-0-9 .
ของที่ : http : / / www.dsi . uminho . PT / ~ pcortez / ไฟ . pdf
1 ชื่อเรื่อง : ป่าไฟ
2 แหล่ง
สร้างโดย : เปาโล คอร์เตซ และ มาร์ติน บัล Morais ( มหาวิทยาลัย มินโฮ ) @ )
3 การใช้ในอดีต :
หน้าคอร์เตซและอ. Morais .เป็นเหมืองข้อมูลวิธีการทำนายไฟป่าโดยใช้ข้อมูลอุตุนิยมวิทยา .
ในการดําเนินการของ 13 epia 2007 - โปรตุเกส ในการประชุมปัญญาประดิษฐ์
ธันวาคม , 2007 ( http : / / www.dsi . uminho . PT / ~ pcortez / ไฟ . pdf )
ในการอ้างอิงเหนือ , ออกพื้นที่ " " แรกเปลี่ยนกับ LN ( x 1 ) ฟังก์ชัน .
แล้ววิธีการเหมืองข้อมูลหลายคนใช้ หลังจากการปรับรุ่นผลคือ
โพสต์การประมวลผลด้วยความผกผันของ ln ( x 1 ) เปลี่ยน สี่การตั้งค่า Input ต่างกัน
ใช้ . การทดลองใช้ 10 เท่า ( ข้ามการตรวจสอบ ) x 30 วิ่ง 2
) วัดวัด : บ้าและ RMSE . เป็นเกาส์สนับสนุนเวกเตอร์เครื่องจักร ( SVM ) เลี้ยง
มีเพียง 4 ตรงสภาพอากาศ ( อุณหภูมิความชื้นสัมพัทธ์ , ลมและฝน ) ได้รับค่าโกรธที่ดีที่สุด :
- - 001 ( ค่าเฉลี่ยและช่วงความเชื่อมั่น 95% โดยใช้การกระจายภายใน t-student ) วิธีที่ดีที่สุดบรรลุโดยการปฏิบัติ
หมายถึงไร้เดียงสา การวิเคราะห์การถดถอยกับข้อผิดพลาดโค้ง
( REC ) พบว่าแบบจำลองคาดการณ์ SVM ตัวอย่างภายในลดลง ยอมรับข้อผิดพลาด ผล
SVM รุ่นไฟเล็ก ๆที่ดีกว่าคาดการณ์ ซึ่งส่วนใหญ่
4 . ข้อมูลที่เกี่ยวข้อง :
นี่คืองานขั้นตอนที่ยากมาก มันสามารถใช้วิธีการทดสอบการถดถอย นอกจากนี้
มันอาจจะใช้เพื่อทดสอบวิธีการตรวจสอบค่าผิดปกติเพราะมันไม่ชัดเจนเท่าไหร่
เมื่อมี . แต่จำนวนของตัวอย่างของไฟที่มีขนาดใหญ่พื้นที่เผามีขนาดเล็กมาก
5 หมายเลขของอินสแตนซ์ : 517
6 จำนวนของแอตทริบิวต์ : 12 ออก
หมายเหตุ : คุณลักษณะหลายแอตทริบิวต์อาจจะมีความสัมพันธ์กัน ดังนั้นจึงทำให้รู้สึกที่จะใช้บางประเภทของการเลือกคุณลักษณะ
7 ข้อมูลคุณสมบัติ :
สำหรับข้อมูลเพิ่มเติม โปรดอ่าน คอร์เตซและ Morais [ 2007 ] .
1 . X - แกนพื้นที่ประสานงานภายใน montesinho ปาร์คแผนที่ : 1 ถึง 9
2 Y - Y ( ประสานงานภายใน montesinho ปาร์ค แผนที่ 2 9
3 เดือน - เดือนแห่งปี " แจน " กับ " ธันวาคม "
4วัน - วันของสัปดาห์ : " มอญ " กับ " ซัน "
5 ffmc - ffmc ดัชนีจากระบบ fwi : 18.7 กับ 96.20
6 DMC DMC - ดัชนีจากระบบ fwi : 1.1 เพื่อ 291.3
7 DC - DC ดัชนีจากระบบ fwi : 7.9 ถึง 860.6
8 เอส - เอสดัชนีจากระบบ fwi : 0.0 ถึง 56.10 ประกอบอาชีพเกษตรกรรมเป็นอาชีพหลัก
9 อุณหภูมิ - อุณหภูมิองศาเซลเซียส : 2.2 36.61
10 Rh - ความชื้นสัมพัทธ์ใน % : 15.0 100
11 ลม - ความเร็วลมใน km / h : 040 ถึง 9.40
12 ฝน ฝน ฝน ฝน ฝน ใน - นอก mm / m2 : 0.0 6.4
13 พื้นที่ - การเผาพื้นที่ป่า ( ฮา ) : 0.00 ถึง 1090.84
( output ตัวแปรเป็นเบ้ ต่อ 0.0 , ดังนั้นจึงอาจทำให้รู้สึก
รุ่นกับลอการิทึมแปลง )
8 ไม่มีพลาดค่าแอตทริบิวต์
การแปล กรุณารอสักครู่..
