4.3.1 Pruning Correlations To ﬁnd a

4.3.1 Pruning Correlations
To ﬁnd a pair of demographic groups with correlated sentiment, we have to evaluate all pairs of nodes in demographics lattice. However, we observe that correlation holds certain regularity properties on a demographics lattice and on time granularities, which are useful for pruning. We can apply pruning based on correlation estimates from the higher-granularity data (vertical pruning), and based on the observed part of the time series (horizontal pruning), as described below.
Vertical Pruning:
Given the DTree, we would like to be able to estimate correlations for a smaller time granularity based on the averages computed for a higher time granularity. This is possible using the Spruill and Gastwirth correlation estimation method, which relies on the Bartlett and Wald regression estimator.
LEMMA 1. The estimate l of correlation and its asymptotic standard deviation are computed using the following formula:
In the above equations, sU3 (sL3) and s"U3 (s"L3) are the averages of intermediate aggregates (d, p i) and s (d", pi) computed for i≥ 2n/3 (i≤n/3), where n is the number of intermediate aggregates. The factor c is linearly depending on l and n and is estimated using the tabulation data given in [13]. We note that all standard deviations and intermediate aggregates used in this formula are directly accessible in the DTree at every granularity level.
Horizontal pruning:
If both the correlation threshold l min and the time interval p of size n are known, then for every subinterval p1...pk, k

4.3.1 Pruning Correlations 
To ﬁnd a pair of demographic groups with correlated sentiment, we have to evaluate all pairs of nodes in demographics lattice. However, we observe that correlation holds certain regularity properties on a demographics lattice and on time granularities, which are useful for pruning. We can apply pruning based on correlation estimates from the higher-granularity data (vertical pruning), and based on the observed part of the time series (horizontal pruning), as described below. 
Vertical Pruning: 
Given the DTree, we would like to be able to estimate correlations for a smaller time granularity based on the averages computed for a higher time granularity. This is possible using the Spruill and Gastwirth correlation estimation method, which relies on the Bartlett and Wald regression estimator. 
LEMMA 1. The estimate l of correlation and its asymptotic standard deviation are computed using the following formula:
In the above equations, sU3 (sL3) and s"U3 (s"L3) are the averages of intermediate aggregates (d, p i) and s (d", pi) computed for i≥ 2n/3 (i≤n/3), where n is the number of intermediate aggregates. The factor c is linearly depending on l and n and is estimated using the tabulation data given in [13]. We note that all standard deviations and intermediate aggregates used in this formula are directly accessible in the DTree at every granularity level. 
Horizontal pruning: 
If both the correlation threshold l min and the time interval p of size n are known, then for every subinterval p1...pk, k

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

4.3.1 ตัดสัมพันธ์ เราต้องประเมินคู่ของโหนในประชากรตาข่ายกับคู่ของกลุ่มประชากรที่มีความเชื่อมั่นมีความสัมพันธ์ อย่างไรก็ตาม เราสังเกตว่า ความสัมพันธ์มีคุณสมบัติบางอย่างสม่ำเสมอ บนตาข่ายข้อมูลประชากร และเวลา granularities ซึ่งมีประโยชน์สำหรับการตัดแต่งกิ่ง เราสามารถใช้การตัดคะแนนจากการประเมินความสัมพันธ์จากข้อมูลความละเอียดสูง (ตัดแนวตั้ง), และอิงจากส่วนที่สังเกตของอนุกรมเวลา (แนวตัด), ตามที่อธิบายไว้ด้านล่าง ตัดแนวตั้ง: ได้รับการ DTree เราต้องสามารถประเมินความสัมพันธ์สำหรับเป็นส่วนประกอบเวลาเล็กอิงค่าเฉลี่ยที่คำนวณสำหรับเป็นส่วนประกอบเวลาสูง นี้เป็นไปได้โดยใช้ Spruill และ Gastwirth ความสัมพันธ์การประเมินวิธีการ ซึ่งอาศัยประมาณถดถอยบาร์ตเลตและวอลด์ หน่วยการที่ 1 L การประเมินความสัมพันธ์และความเบี่ยงเบนมาตรฐาน asymptotic จะคำนวณโดยใช้สูตรต่อไปนี้:ในสมการข้างต้น sU3 (sL3) และ s " U3 (s "L3) เป็นค่าเฉลี่ยของผลรวมระดับกลาง (d, p ผม) และ s (d ", pi) คำนวณสำหรับ i≥ 2n/3 (i≤n 3), โดยที่ n คือ จำนวนของผลกลาง C คูณเชิงเส้นขึ้นอยู่กับ l และ n และประมาณโดยใช้ข้อมูล tabulation ใน [13] เราทราบว่า ค่าเบี่ยงเบนมาตรฐานและระดับกลางผลรวมที่ใช้ในสูตรนี้ทั้งหมดสามารถเข้าถึงได้โดยตรงใน DTree ที่บด ตัดแนวนอน: ถ้าความสัมพันธ์เกณฑ์ลิตรนาทีและ p ช่วงเวลาของ n ขนาดเป็นที่รู้จัก แล้วสำหรับ p1 subinterval ทุก... pk, k หน่วยการ 2 ถ้า b และ b "มีความเบี่ยงเบนสูงสุดความเชื่อมั่น และการคูณภายในของความเชื่อมั่นความเบี่ยงเบน (s◦s") k 1 ที่จุด k น้อยกว่า (n l นาที m s m s"−(n-k) b s b s"), แล้ว l (s, s") < l นาที เราทราบว่า ประเมินความเบี่ยงเบนสูงสุดได้เฉพาะสำหรับชุด bounded ครั้ง นี้เป็นจริงในกรณีของเรา ที่จะแบ่งความรู้สึกระหว่าง [-1.1] ดังนั้น เราสามารถตั้งค่า b s = | s | 1 ซึ่งเกิดขึ้นเมื่อมีความเชื่อมั่นเป็นไกลที่สุดจากค่าเฉลี่ย (ทาการเบี่ยงเบนในทิศทางตรงกันข้าม) เช่นในกรณีของการตัดแนวตั้ง ค่าเบี่ยงเบนมาตรฐาน และค่าเฉลี่ย ค่าของชุดข้อมูลเวลา ใช้ในการประเมินข้างต้น จะถูกเก็บไว้ที่เป็นส่วนประกอบสูงขึ้นจึงมีโดยตรง และระดับในการ DTree

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

4.3.1 การตัดแต่งกิ่งความสัมพันธ์
ไปยัง FI ND คู่ของกลุ่มประชากรที่มีความเชื่อมั่นในความสัมพันธ์ที่เรามีการประเมินทุกคู่ของโหนดในประชากรขัดแตะ อย่างไรก็ตามเราสังเกตความสัมพันธ์ที่มีคุณสมบัติระเบียบบางอย่างบนตาข่ายประชากรและในระดับรายละเอียดเวลาซึ่งจะมีประโยชน์สำหรับการตัดแต่งกิ่ง เราสามารถใช้การตัดแต่งกิ่งอยู่บนพื้นฐานของการประมาณการความสัมพันธ์จากข้อมูลที่สูงกว่าเมล็ด (การตัดแต่งกิ่งแนวตั้ง) และขึ้นอยู่กับส่วนที่สังเกตของชุดเวลา (การตัดแต่งกิ่งแนวนอน) ตามที่อธิบายไว้ด้านล่าง.
แนวตั้งการตัดแต่งกิ่ง:
ป.ร. ให้ไว้ DTree เราอยากจะเป็น สามารถประเมินความสัมพันธ์สำหรับเมล็ดขนาดเล็กเวลาที่อยู่บนพื้นฐานของค่าเฉลี่ยคำนวณหาเมล็ดเวลาที่สูงขึ้น นี้เป็นไปได้โดยใช้ Spruill และ Gastwirth วิธีการประมาณค่าความสัมพันธ์ซึ่งอาศัยอยู่กับบาร์ตเลตต์และ Wald ประมาณการถดถอย.
บทแทรก 1. ประมาณการ L ความสัมพันธ์และส่วนเบี่ยงเบนมาตรฐาน asymptotic จะคำนวณโดยใช้สูตรต่อไปนี้:
ในสมการข้างต้น SU3 (SL3 ) และ s "U3 (s" L3) เป็นค่าเฉลี่ยของมวลรวมกลาง (D, PI) และ s (D "PI) คำนวณสำหรับi≥ 2n / 3 (i≤n / 3) ที่ n คือจำนวนของ มวลกลาง. ปัจจัยที่ c คือเส้นตรงขึ้นอยู่กับ L และ n และเป็นที่คาดกันโดยใช้ข้อมูลการจัดระเบียบที่กำหนดใน [13]. เราทราบว่าทุกส่วนเบี่ยงเบนมาตรฐานและมวลกลางที่ใช้ในสูตรนี้จะสามารถเข้าถึงได้โดยตรงใน DTree ในระดับความละเอียดทุก
การตัดแต่งกิ่งแนวนอน:
ถ้าทั้งเกณฑ์ความสัมพันธ์ L นาทีและ P ช่วงเวลาที่มีขนาด n เป็นที่รู้จักกันแล้วสำหรับทุก P1 subinterval ... PK, Kบทแทรก 2. หาก Bs และ BS "คือการเบี่ยงเบนความเชื่อมั่นสูงสุดและผลิตภัณฑ์ด้านในของการเบี่ยงเบนความเชื่อมั่น (s◦s") K 1 ที่จุด K น้อยกว่า (NL นาที MSM S "- (NK) BSB S") แล้ว L (s, s ") <L นาที.
เราทราบว่าการประเมินการเบี่ยงเบนสูงสุดเพียงเป็นไปได้สำหรับชุดเวลา จำกัด . นี้จะเป็นจริงในกรณีของเราที่มีการกระจายความรู้สึกระหว่าง [-1,1]. ดังนั้นเราจึงสามารถตั้ง BS = | s | 1 ซึ่งเกิดขึ้นเมื่อมีความเชื่อมั่นเป็นที่ห่างไกลมากที่สุดจากค่าเฉลี่ย (เบี่ยงเบนไปในทิศทางตรงกันข้าม).
เช่นในกรณีของการตัดแต่งกิ่งแนวตั้งส่วนเบี่ยงเบนมาตรฐานและค่าเฉลี่ยของชุดเวลาที่ใช้ในการดังกล่าวข้างต้น การประมาณค่าจะถูกเก็บไว้ในระดับความละเอียดที่สูงขึ้นใน DTree และทำให้สามารถใช้ได้โดยตรง

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ในการตัดแต่งกิ่งความสัมพันธ์เพื่อถ่ายทอดและคู่ของกลุ่มประชากรที่มีความเชื่อมั่น เราต้องประเมินทุกคู่ของโหนดในลักษณะตาข่าย อย่างไรก็ตาม เราสังเกตว่า ความสัมพันธ์มีบางระเบียบคุณสมบัติในแลตทิซและประชากรในเวลา granularities ซึ่งมีประโยชน์สำหรับการตัดแต่งกิ่ง เราสามารถใช้การตัดแต่งกิ่งตามประมาณการความสัมพันธ์จากข้อมูล granularity สูงกว่า ( ตัดตามแนวตั้ง ) และจากส่วนหนึ่งของอนุกรมเวลา ( การตัดแต่งกิ่งแนวนอน ) ตามที่อธิบายไว้ด้านล่างการตัดแต่งกิ่งในแนวตั้ง :ได้รับ dtree , เราต้องการที่จะสามารถประมาณค่าความสัมพันธ์สำหรับขนาดเล็กเวลา granularity ตามค่าเฉลี่ยที่คำนวณสำหรับ granularity เวลาที่สูงขึ้น นี้สามารถใช้วิธีประมาณค่าและสปรูล gastwirth ซึ่งอาศัย Bartlett เดินถดถอยและประเมินราคาบทแทรก 1 ราคา L ) และส่วนเบี่ยงเบนมาตรฐานของเฉลี่ยจะคำนวณโดยใช้สูตรต่อไปนี้ :ในสมการข้างต้น su3 ( SL3 ) และ " U3 S ( S " L3 ) ค่าเฉลี่ยของระดับกลางมวลรวม ( d , p ) และ S ( D " PI ) สำหรับผม≥ 2 / 3 ( ผม≤ n / 3 ) โดยที่ n คือหมายเลขของกลางมวลรวม . ปัจจัย C เป็นเส้นตรงขึ้นอยู่กับ L และ N และคาดว่าการใช้ตารางข้อมูลที่ระบุใน [ 13 ] เราทราบว่า ค่าส่วนเบี่ยงเบนมาตรฐานและกลุ่มกลางใช้ในสูตรนี้สามารถเข้าถึงได้โดยตรงใน dtree ในทุกระดับ granularity .การตัดแต่งกิ่งแนวนอน :ถ้าความสัมพันธ์ของฉัน มิน และ ช่วงเวลาที่ P ขนาด N เป็นที่รู้จักกัน แล้วทุก subinterval P1 . . . PK K < N กับผลิตภัณฑ์ภายในที่เกี่ยวข้อง ( s ◦ S " ) K 1 เราสามารถคำนวณขอบเขตบนของความสัมพันธ์ coef จึง cient กว่าหน้าเราก็ใช้ประมาณนี้ ลูกพรุนมีขนาดเล็กมากขึ้นของ P เป็นจุดสังเกตพ 2 ถ้า B และ B S " มีความเชื่อมั่นสูงสุดที่เบี่ยงเบนและผลิตภัณฑ์ภายในความรู้สึกเบี่ยงเบน ( s ◦ S " ) K 1 จุด K น้อยกว่า ( n L มิน M S M S " − ( n-k ) B S B S " ) , L ( s , S " ) < ผมมินเราทราบว่า การเบี่ยงเบนสูงสุดเป็นเพียงที่เป็นไปได้สำหรับจำกัดเวลา ชุด นี้เป็นจริงในกรณีของเรา ซึ่งความรู้สึกที่มีการกระจายระหว่าง [ - 1 , 1 ] ดังนั้น เราสามารถเซ็ต B S = | S | + 1 ซึ่งเกิดขึ้นเมื่อมีความเชื่อมั่นมากที่สุดคือไกลจากค่าเฉลี่ย ( เบี่ยงเบนไปในทิศทางตรงกันข้าม )เช่นในกรณีของการตัดแต่งกิ่งในแนวตั้ง ส่วนเบี่ยงเบนมาตรฐานและค่าของอนุกรมเวลาที่ใช้ในการประมาณการข้างต้น จะถูกเก็บไว้ในที่สูงกว่าระดับ granularity ใน dtree และจึงสามารถใช้ได้โดยตรง

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.