The data set for the period of 2011–2014 had missing values
about 16% of data set. Before modeling, some preprocessing
operations were thus applied on lagged data set such as excluding
rows with any missing data preserving daily time index and
minimum–maximum normalization to obtain normalized
values in the range of 0.05–0.95.
Input vectors to ANN models indicated by PCA
The lag lengths of the variables and whether or not to input
to ANN models were determined by analyzing PCA results.
The correlation coefficient values (r) were used in PCA runs.
The correlation results were appropriate to use the PCA, as r
values were generally ≥0.3. However, RH did not exhibit a
significant correlation with the others; thus, it was placed
neither in the PCA variables nor in ANN models as input. AT
showed a negative correlation with PM10 (r = −0.698) and a
moderately strong correlation with the other explanatory variables,
which indicates the seasonal pollution effect due to
residential heating controlled by meteorological factors.
PCA was applied to actual PM10 data on day t (PM10t)
against the variables lagged by seven times. Since the variable
RH was removed, four PCA runs were performed between
PM10t and the lagged terms of its own and the retaining
variables in the lagged data set. Table 3 shows the extracted
principal components (PCs), with the percentage of explained
variance by this factor in parenthesis, and loading scores on
them by rows per lags. Generally, only one component is
extracted by these four PCA runs. The loading scores (>0.7)
shown bold-faced were expected to be more associated with
PM10t than the other lags. Based on this assumption, we could
determine the lag lengths of variables considering the number
of closely related lags in sequence. The maximum explained
variances by the factors from PCA-1 to PCA-4 varied in
60.73–77.26%. PCA results indicated that PM10t was closely
related with the first three lags of its own according to first
PCA run, the first three lags of AT by PCA-2, the first lag of
WS by PCA-3, and the first lag of WD by PCA-4. Hence, the
lag lengths of PM10, AT, WS, and WD were found to be 3, 3, 1
and 1, respectively. The 8 variables were selected among the 40
variables in the data set by PCA with an acceptable loss in the
total variance on PM10t. Ultimately, the lags of PM10t−1 to
PM10t−3, ATt−1 to ATt−3, WSt−1, and WDt−1 have been used in
ANN models as inputs.
ชุดข้อมูลสำหรับรอบระยะเวลาของ 2011-2014 มีค่าหายไปประมาณ 16% ของข้อมูลได้ ก่อนที่จะสร้างโมเดล การประมวลผลเบื้องต้นบางการดำเนินงานจึงใช้ lagged ชุดข้อมูลเช่นไม่รวมแถวที่ มีข้อมูลขาดหายไปการรักษาดัชนีเวลาทุกวัน และต่ำสุด – สูงสุดเกี่ยวกับการปรับสภาพการรับตามปกติค่าในช่วง 0.05-0.95เวกเตอร์อินพุตโดย PCA รุ่นแอนความยาวรวมของตัวแปรและป้อนข้อมูลหรือไม่การแอน รุ่นถูกกำหนด โดยการวิเคราะห์ผลลัพธ์ PCAค่าสัมประสิทธิ์สหสัมพันธ์ที่ใช้ใน PCA ค่า (r) ทำงานผลความสัมพันธ์ได้เหมาะสมกับใช้ PCA, rค่าได้โดยทั่วไป ≥0.3 อย่างไรก็ตาม RH ไม่มีการความสัมพันธ์ที่สำคัญกับคนอื่น ๆ ดังนั้น มันถูกวางไว้ไม่ ในตัวแปร PCA หรือรุ่นแอนเป็นการป้อนข้อมูล ที่แสดงให้เห็นความสัมพันธ์เชิงลบกับ PM10 (r = −0.698) และความสัมพันธ์ค่อนข้างแข็งแกร่ง ด้วยการอธิบายตัวแปรอื่น ๆซึ่งบ่งชี้ผลกระทบมลพิษตามฤดูกาลเนื่องจากความร้อนที่อยู่อาศัยที่ถูกควบคุม โดยปัจจัยทางอุตุนิยมPCA กับข้อมูลจริงของ PM10 ในวัน t (PM10t)กับตัวแปร lagged โดยเจ็ดครั้ง ตั้งแต่ตัวแปรRH ลบออก ทำงาน PCA 4 ดำเนินการระหว่างPM10t และเงื่อนไข lagged ของตนเอง และการรักษาตัวแปรในชุดข้อมูล lagged ตารางที่ 3 แสดงการแยกอธิบายส่วนประกอบหลัก (พีซี), มีเปอร์เซ็นต์ของผลต่าง โดยปัจจัยนี้ในวงเล็บ และการโหลดคะแนนโดยแถวต่อล่าช้า มีคอมทั่วไปแยกตามเหล่าสี่ PCA รัน คะแนนโหลด (> 0.7)แสดง bold-faced คาดว่าที่จะเกี่ยวข้องมากขึ้นกับPM10t กว่าล่าช้าอื่น ๆ จากสมมติฐานนี้ เราสามารถกำหนดความยาวรวมของตัวแปรกับจำนวนของเหลวที่เกี่ยวข้องอย่างใกล้ชิดในลำดับ อธิบายสูงสุดผลต่าง โดยปัจจัยจาก PCA 1 PCA 4 แตกต่างกันใน60.73 – 77.26% PCA ผลระบุว่า PM10t อย่างใกล้ชิดที่เกี่ยวข้องกับอาการกระตุกสามอันดับแรกแรกของตัวเองตามเรียกใช้ PCA อาการกระตุกของ AT PCA-2 ความล่าช้าครั้งแรกของสามอันดับแรกWS โดย PCA-3 และความล่าช้าครั้งแรกของ WD โดย PCA 4 ดังนั้น การล่าช้ายาวของ PM10, AT, WS และ WD พบ 3, 3, 1และ 1 ตามลำดับ เลือกตัวแปร 8 อยู่ระหว่าง 40ตัวแปรในชุดข้อมูลโดย PCA กับการสูญเสียที่ยอมรับในการรวมผลต่างบน PM10t ในที่สุด การล่าช้าของ PM10t−1 การPM10t−3, ATt−1 ATt−3, WSt−1 และ WDt−1 มีการใช้ในรุ่นแอนเป็นอินพุต
การแปล กรุณารอสักครู่..

ข้อมูลที่กำหนดระยะเวลา 2011-2014 ได้ค่าที่หายไป
ประมาณ 16% ของชุดข้อมูล ก่อนที่จะสร้างแบบจำลองบาง preprocessing
การดำเนินงานจึงถูกนำไปใช้กับข้อมูล lagged กำหนดเช่นไม่รวม
แถวที่มีข้อมูลที่ขาดหายไปรักษาดัชนีเวลาในชีวิตประจำวันและ
การฟื้นฟูขั้นต่ำสูงสุดที่จะได้รับปกติ
ค่าอยู่ในช่วง 0.05-0.95 ได้.
เวกเตอร์อินพุตรุ่น ANN ระบุโดย PCA
ความยาวความล่าช้าของตัวแปรและหรือไม่ต้องใส่
กับรุ่น ANN ถูกกำหนดโดยการวิเคราะห์ผลการ PCA.
ค่าสัมประสิทธิ์สหสัมพันธ์ (R) ถูกนำมาใช้ใน PCA วิ่ง.
ผลความสัมพันธ์มีความเหมาะสมที่จะใช้ PCA เป็น R
ค่าได้โดยทั่วไป ≥0.3 อย่างไรก็ตาม RH ไม่ได้แสดงให้เห็น
ความสัมพันธ์กับคนอื่น ๆ ; จึงถูกนำมาวาง
ค่าในตัวแปร PCA หรือในรูปแบบ ANN เป็น input ที่
พบว่ามีความสัมพันธ์ทางลบกับ PM10 (r = -0.698) และ
ความสัมพันธ์ที่แข็งแกร่งในระดับปานกลางกับการอธิบายตัวแปรอื่น ๆ
ซึ่งแสดงให้เห็นผลกระทบมลพิษตามฤดูกาลเนื่องจาก
ร้อนที่อยู่อาศัยการควบคุมโดยปัจจัยทางอุตุนิยมวิทยา.
PCA ถูกนำไปใช้ข้อมูล PM10 ที่เกิดขึ้นจริงในวันที่ T ( PM10t)
กับตัวแปร lagged โดยเจ็ดครั้ง เนื่องจากตัวแปร
RH ถูกลบออกสี่ PCA วิ่งได้ดำเนินการระหว่าง
PM10t และข้อตกลงสัมปทานของตัวเองและยึด
ตัวแปรในชุดข้อมูลที่ล่าช้า ตารางที่ 3 แสดงให้เห็นถึงการสกัด
องค์ประกอบหลัก (พีซี) มีร้อยละของการอธิบาย
ความแปรปรวนโดยปัจจัยนี้ในวงเล็บและคะแนนการโหลดบนพวกเขาโดยแถวต่อล่าช้า โดยทั่วไปเพียงองค์ประกอบหนึ่งถูกสกัดโดยทั้งสี่คนนี้ PCA วิ่ง คะแนนการโหลด (> 0.7) แสดงเป็นตัวหนาเผือดคาดว่าจะเกี่ยวข้องกับPM10t กว่าล่าช้าอื่น ๆ อยู่บนพื้นฐานของสมมติฐานนี้เราสามารถตรวจสอบความยาวความล่าช้าของตัวแปรพิจารณาจำนวนของล่าช้าเกี่ยวข้องอย่างใกล้ชิดในลำดับ สูงสุดที่อธิบายความแปรปรวนจากปัจจัยจาก PCA-1 กับ PCA-4 แตกต่างกันใน60.73-77.26% ผลการ PCA ชี้ให้เห็นว่า PM10t ถูกอย่างใกล้ชิดที่เกี่ยวข้องกับสามล่าช้าครั้งแรกของตัวเองตามที่แรกPCA วิ่งสามล่าช้าแรกของ AT โดย PCA-2, ความล่าช้าแรกของWS โดย PCA-3, และความล่าช้าแรกของ WD โดย PCA-4 ดังนั้นความยาวความล่าช้าของ PM10, AT, WS และ WD พบว่ามี 3, 3, 1 และ 1 ตามลำดับ 8 ตัวแปรได้รับการคัดเลือกในหมู่ 40 ตัวแปรในข้อมูลที่กำหนดโดย PCA กับการสูญเสียที่ยอมรับในความแปรปรวนรวม PM10t ในท้ายที่สุดล่าช้าของ PM10t-1 กับPM10t-3, att-1 กับ ATT-3, WST-1 และ WDT-1 ได้ถูกนำมาใช้ในรุ่น ANN เป็นปัจจัยการผลิต
การแปล กรุณารอสักครู่..

ข้อมูลการตั้งค่าสำหรับระยะเวลาของ 2011 – 2014 มีค่าสูญหายประมาณ 16% ของชุดข้อมูล ก่อนที่จะสร้างโมเดล มีการเตรียมการใช้ชุดข้อมูล ) จึงล้าหลัง เช่น ยกเว้นแถวที่มีข้อมูลขาดหายไปรักษาดัชนีเวลาทุกวัน และขั้นต่ำและสูงสุดที่จะได้รับมาตรฐาน บรรทัดฐานค่าในช่วง 0.05 – 0.95 วิเคราะห์ข้อมูลใส่กับแอนแสดงโดย PCA แบบเวกเตอร์ความล่าช้าความยาวของตัวแปรและหรือไม่ที่จะใส่กับแอน โมเดลกำหนดโดยผลวิเคราะห์ระบบ .ค่าสัมประสิทธิ์สหสัมพันธ์ ( r ) ที่ใช้ในระบบทํางานความสัมพันธ์ระหว่างผลที่เหมาะสมของการใช้ PCA เป็น Rค่าโดยทั่วไป≥ 0.3 อย่างไรก็ตาม ความไม่แสดงความสัมพันธ์กับคนอื่น ๆ ดังนั้น มันก็วางทั้งในระบบตัวแปรหรือแอน รูปแบบการป้อนข้อมูล ที่มีความสัมพันธ์เชิงลบ กับ PM10 ( r = − 0.698 ) และแข็งแรงปานกลางความสัมพันธ์กับอื่น ๆที่อธิบายตัวแปรซึ่งบ่งชี้ว่าผลกระทบจากมลพิษในฤดูกาลที่อยู่อาศัยความร้อนควบคุมด้วยปัจจัยทางอุตุนิยมวิทยาถูกใช้จริงพบข้อมูลในวันที่ T ( pm10t )กับตัวแปรย้อนหลังได้ 7 ครั้ง เนื่องจากตัวแปรกิจกรรมออกสี่ PCA วิ่งได้ระหว่างpm10t และล้าหลังด้านของตัวเอง และการรักษาตัวแปรในราคาชุดข้อมูล ตารางที่ 3 แสดงสกัดส่วนประกอบหลัก ( พีซี ) กับค่าร้อยละของอธิบายความแปรปรวน โดยปัจจัยนี้ในวงเล็บ และการโหลดคะแนนโดยแถวต่อล่าช้า โดยทั่วไป แค่ส่วนประกอบหนึ่ง คือสกัดโดยเหล่านี้สี่ PCA ทํางาน โหลด ( 0.7 ) คะแนนแสดงเป็นตัวหนาประสบส่วนใหญ่คาดว่าจะเกี่ยวข้องกับpm10t กว่า 30 อื่น ๆ ตามสมมติฐานนี้เราสามารถตรวจสอบความล่าช้าความยาวของตัวแปรพิจารณาหมายเลขของล่าช้าเกี่ยวข้องอย่างใกล้ชิดในลำดับ สูงสุดที่อธิบายความแปรปรวน โดยปัจจัยจาก pca-1 เพื่อ pca-4 แตกต่างกัน60.73 – 77.26 ล้านบาท ผลพบว่า pm10t PCA เป็นอย่างใกล้ชิดที่เกี่ยวข้องกับสามล่าช้าแรกของตัวเองตามก่อนพีซีวิ่ง สามตัวแรกของที่ล่าช้า โดย pca-2 , ความล่าช้าของแรกโดย pca-3 WS และเป็นครั้งแรกที่ล้าหลังของ WD โดย pca-4 . ดังนั้นกความยาวของ PM10 ที่ WS และ WD พบเป็น 2 , 3 , 1และ 1 ตามลำดับ 8 ตัวแปรที่เลือกระหว่าง 40ตัวแปรในชุดข้อมูลโดย PCA กับการสูญเสียการยอมรับในความแปรปรวนทั้งหมดบน pm10t สุด การล่าช้าของ pm10t − 1 .pm10t − 3 , − 1 , − 3 att att WST , − 1 , − 1 และมีการใช้ WDTแอน รูปแบบข้อมูล
การแปล กรุณารอสักครู่..
