The raw data sets are generally positively skewed, except for
Nb. High skewness and kurtosis values are observed for Ce, Cu,
La, Mn, Pb, Vand Zn, showing that there are rare processes (e.g.,
mineralization or pollution) affecting these elements. Only one
element, Ti, can pass the K-S test for normality (p>0.05), with
another element, Ni, nearly passing the test. Improved normality
features are observed for the log-transformed and BoxeCox
transformed data sets, but only three (Mg, Ti and V) and seven
(Ba, Cu, Mg, Pb, Sr, Ti and V) elements can pass the K-S for
normality, respectively. Compared with log-transformation,
the BoxeCox transformation has significantly reduced the
skewness values of data sets, pushing them towards ‘‘0’’. This
feature is beneficial to multivariate analyses: if the data set can-not be made normal, it should be near normal or symmetric.
Meanwhile, the negative effects of potential outliers in the
heavily skewed raw data sets have been reduced by the Boxe
Cox transformation (McGrath et al., 2004). Many of the elements
that cannot pass the K-S test after BoxeCox transformation
suffer from data imprecision from ICP-AES to some extent,
e.g., most of As values are in low integers, resulting in many du-plicate values in the data set (seeTable 1for a rough judgement).
For data sets with many duplicate values, with values below
detection limits, or with multi-modals (caused by multiple pop-ulations), it is hard for any method to transform them towards
normality. Separation of samples into different sub-populations
is one way to deal with these problems
โดยทั่วไปชุดข้อมูลดิบจะบิดบวก ยกเว้นพบค่าความเบ้และสเชิง Nb. สูงสำหรับ Ce, CuLa, Mn, Pb, Vand Zn แสดงว่า มีกระบวนการที่ยาก (เช่นmineralization หรือมลพิษ) ส่งผลกระทบต่อองค์ประกอบเหล่านี้ เพียงหนึ่งองค์ประกอบ Ti สามารถผ่านการทดสอบ K-S สำหรับแอมป์; (p > 0.05), กับองค์ประกอบอื่น Ni เกือบผ่านการทดสอบ ปรับปรุงเครื่องคุณลักษณะที่สังเกตบันทึกเปลี่ยน และ BoxeCoxเปลี่ยนชุดข้อมูล แต่เพียงสาม (Mg, Ti และ V) และเจ็ดองค์ประกอบ (Ba, Cu, Mg, Pb, Sr, Ti และ V) สามารถผ่าน K-S สำหรับเครื่อง ตามลำดับ เปรียบเทียบกับบันทึกการเปลี่ยนแปลงการแปลง BoxeCox ได้ลดลงอย่างมีนัยสำคัญค่าความเบ้ของข้อมูลชุด ผลักดันพวกเขาไปสู่ '' 0'' นี้คุณสมบัติเป็นประโยชน์ต่อการวิเคราะห์ตัวแปรพหุ: ถ้าทำปกติสามารถชุดข้อมูลไม่ได้ มันควรจะใกล้ปกติ หรือสมมาตรในขณะเดียวกัน ผลกระทบเชิงลบของ outliers มีศักยภาพในการชุดข้อมูลดิบเบ้หนักลดลง โดย Boxeการแปลงค็อกซ์ (McGrath et al. 2004) หลายองค์ประกอบที่ไม่ผ่านการทดสอบ K-S หลังจากการแปลง BoxeCoxต้องทนทุกข์ทรมานจากข้อมูล imprecision จาก ICP AES บ้างเช่น ใหญ่เป็นค่าที่อยู่ในจำนวนเต็มต่ำ ในหลาย du plicate ค่าในชุดข้อมูล (seeTable 1for ตัดสินใจหยาบ)สำหรับชุดข้อมูลที่มีค่าซ้ำกันมาก มีค่าด้านล่างขีดจำกัดการตรวจจับ หรือ มีหลาย modals (เกิดจากหลายป๊อป-ulations), มันยากสำหรับวิธีการตรวจแปลงให้ต่อเครื่อง แยกตัวอย่างเป็นประชากรย่อยที่แตกต่างกันเป็นวิธีหนึ่งในการจัดการกับปัญหาเหล่านี้
การแปล กรุณารอสักครู่..
ชุดข้อมูลดิบโดยทั่วไปมักจะเบ้บวกยกเว้น
Nb เบ้สูงและค่าความโด่งเป็นที่สังเกตสำหรับ CE, Cu,
La แมงกานีสตะกั่วสังกะสี Vand แสดงให้เห็นว่ามีกระบวนการหายาก (เช่น
แร่หรือมลพิษ) ที่มีผลต่อองค์ประกอบเหล่านี้ เพียงหนึ่ง
องค์ประกอบ Ti, สามารถผ่านการทดสอบสำหรับ KS ปกติ (P> 0.05) โดยมี
องค์ประกอบอื่น, Ni, เกือบผ่านการทดสอบ ปกติการปรับปรุง
คุณสมบัติได้มีการปฏิบัติสำหรับการเข้าสู่ระบบและเปลี่ยน BoxeCox
เปลี่ยนชุดข้อมูล แต่เพียงสาม (MG, Ti และ V) และเจ็ด
(BA, Cu, Mg, ตะกั่ว, อาร์ตี้และ V) องค์ประกอบสามารถผ่าน KS สำหรับ
ภาวะปกติ ตามลำดับ เมื่อเทียบกับการเข้าสู่ระบบการเปลี่ยนแปลง
การเปลี่ยนแปลง BoxeCox ได้ลดลงอย่างมีนัยสำคัญ
ค่าเบ้ของชุดข้อมูลผลักดันพวกเขาที่มีต่อ '' 0 '' นี้
คุณสมบัติเป็นประโยชน์ต่อหลายตัวแปรวิเคราะห์: ถ้าชุดข้อมูลที่ไม่สามารถทำการปกติก็ควรจะอยู่ใกล้ปกติหรือสมมาตร.
ในขณะที่ผลกระทบของค่าผิดปกติที่อาจเกิดขึ้นใน
เบ้หนักชุดข้อมูลดิบที่ได้รับลดลงโดย Boxe
เปลี่ยนแปลงค็อกซ์ (McGrath et al., 2004) หลายองค์ประกอบ
ที่ไม่สามารถผ่านการทดสอบ KS หลังจากการเปลี่ยนแปลง BoxeCox
ทนทุกข์ทรมานจากความไม่แน่ชัดข้อมูลจาก ICP-AES บางส่วน
เช่นส่วนใหญ่เป็นค่าอยู่ในจำนวนเต็มต่ำส่งผลให้ค่า du-plicate จำนวนมากในชุดข้อมูล (seeTable 1 สำหรับ คำพิพากษาพท์คร่าวๆ).
สำหรับชุดข้อมูลที่มีค่าที่ซ้ำกันหลาย ๆ คนที่มีค่าดังต่อไปนี้
ข้อ จำกัด ของการตรวจสอบหรือการที่มีหลาย Modals (ที่เกิดจากหลายป๊อป ulations) มันเป็นเรื่องยากสำหรับวิธีการใด ๆ ที่จะเปลี่ยนไปสู่
ภาวะปกติ การแยกตัวอย่างที่แตกต่างกันออกเป็นประชากรย่อย
เป็นวิธีหนึ่งที่จะจัดการกับปัญหาเหล่านี้
การแปล กรุณารอสักครู่..