5. EXPERIMENTS  We ran experiments using both synthetic and real data. การแปล - 5. EXPERIMENTS  We ran experiments using both synthetic and real data. ไทย วิธีการพูด

5. EXPERIMENTS We ran experiments

5. EXPERIMENTS
We ran experiments using both synthetic and real data. We first experiment with the synthetic data to evaluate the efficiency and performance of our algorithms, following it with the qualitative evaluation of correlations detected on a real dataset.
We implemented our algorithms in Java, and ran the experiments using Java JRE1.7.0 on a machine with dual core2.53 GHz CPU and 1.5 Gb of main memory.
5.1 Datasets
Synthetic Dataset
In order to accurately measure the precision of our system in identifying sentiment correlations, we conduct a series of experiments on synthetic data, containing time series of sentiments with artificially added positive and negative correlations, level biases and sentiment noise as demonstrated in Figure5. We describe the layout of our dataset below.
Hierarchies. As a preliminary step, we generated a set of demographics hierarchies, for such attributes as age, gender, occupation, and location, containing 8, 3, 4 and 65 nodes respectively. Each node in every hierarchy was randomly assigned with a weight and a bias probability. Weights of nodes are distributed according to a Zipf’s distribution, and normalized to add up to 1 at every level of a hierarchy. Nodes from different hierarchies, when combined, form a lattice of 6240 demographic groups as shown in Figure1. The sentiment volume of each demographic group was taken as a multiplication of weights of attribute nodes, and its bias as a weighted sum of their individual biases. That way, we achieve natural regularity in the demographics lattice, providing a natural distribution of sentiments, which is necessary for a proper evaluation of extracting maximal groups and pruning.
Topic Sentiment. The dataset itself contains time series of sentiments generated independently for multiple topics over a time span of 8 years. Each topic is represented by a unique topic time series, produced using a random walk method, which aggregates uniformly distributed sentiments, whose timestamps follow Poisson distribution. We vary the parameter of rate for timestamps to produce faster or slower changing time series for each topic. Since sentiments for the topic time series are sampled uniformly, its mean value is close to zero in a long run, meaning that it crosses the zero line a few times (for example, at points t1 and t2 in Figure5). The original topic time series is stored for a randomly chosen demographic node, and we generate time series for other lattice nodes using individual bias templates for each of them. Bias templates contain sentiment bias levels and intervals of correlation with the topic time series (positive, negative or zero, randomly changed at “zero sentiment” points). The goal of our evaluation is then to correctly extract these correlation intervals between topic and biased time series, generated as described below.
Biased Sentiment. We produce a biased time series in a correspondence with the template, by copying (inverting) the topic time series in the case of positive (negative) correlation, or outputting randomized data otherwise (as seen in Figure5, bottom). Following that, we add a certain positive or negative bias to the whole time series (shifting all the values) and the uniformly-distributed noise (for each value). Finally, we scale the time series to make sure that sentiments lay within the boundaries of [-1,1]. After generating a biased time series for the node, we insert raw sentiment data into the index in a proportion corresponding to node’s volume. Then, we proportionally distribute these sentiments for all node’s children (Figure1), ensuring the maximality of that node.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
5. การทดลอง เราวิ่งทดลองใช้จริง และสังเคราะห์ข้อมูล เราทดลองแรกสังเคราะห์ข้อมูลเพื่อประเมินประสิทธิภาพของอัลกอริธึมของเรา ตาม ด้วยการประเมินผลเชิงคุณภาพของความสัมพันธ์ที่พบในชุดข้อมูลจริงและ efficiencyเราใช้อัลกอริทึมของเราใน Java และวิ่งทดลองใช้ JRE1.7.0 Java บนเครื่องที่มีสอง core2.53 GHz CPU และหน่วยความจำ 1.5 Gb 5.1 ชุดข้อมูล ชุดข้อมูลสังเคราะห์ เพื่อความแม่นยำในการวัดความแม่นยำของระบบในการระบุความสัมพันธ์ความเชื่อมั่นของเรา เราทำชุดของการทดลองสังเคราะห์ข้อมูล อนุกรมเวลาที่มีของความรู้สึกกับอ.ประสพมัจฉาชีพเพิ่มบวก และความสัมพันธ์เชิงลบ ระดับอคติ และความเชื่อมั่นเสียงเป็นการแสดงให้เห็นใน Figure5 เราอธิบายโครงร่างของชุดข้อมูลของเราด้านล่าง ลำดับชั้น เป็นขั้นตอนเบื้องต้น เราสร้างชุดของข้อมูลประชากรลำดับชั้น สำหรับคุณลักษณะดังกล่าว เป็นอายุ เพศ อาชีพ สถานที่ ที่ประกอบด้วยโหน 8, 3, 4 และ 65 ตามลำดับ แต่ละโหนดในทุกลำดับชั้นถูกกำหนดแบบสุ่ม ด้วยน้ำหนักและความน่าเป็น bias น้ำหนักของโหนจะกระจายตาม Zipf แจกจ่าย และตามปกติจะเพิ่มขึ้น 1 ในทุกระดับของลำดับชั้น โหนดจากลำดับชั้นที่แตกต่างกัน เมื่อรวม แบบตาข่ายของกลุ่มประชากรที่ 6240 ดังที่ Figure1 แต่ละกลุ่มประชากรระดับความเชื่อมั่นถ่ายเป็นคูณของน้ำหนักของแอตทริบิวต์โหน และความรุนแรงเป็นผลรวมถ่วงน้ำหนักของอคติของพวกเขาแต่ละ วิธี เราบรรลุธรรมชาติสม่ำเสมอในตาข่ายข้อมูลประชากร ให้การกระจายตามธรรมชาติของความรู้สึก ซึ่งเป็นสิ่งจำเป็นสำหรับการประเมินผลที่เหมาะสมของกลุ่มสูงสุดแยกและตัดแต่งกิ่ง หัวข้อความเชื่อมั่น ชุดข้อมูลเองประกอบด้วยชุดของความรู้สึกที่สร้างอิสระสำหรับหัวข้อหลายช่วงเวลาในระยะ 8 ปีเวลา แต่ละหัวข้อจะแสดง ด้วยหัวข้อเฉพาะเวลา ผลิตโดยใช้วิธีเดินสุ่ม ซึ่งรวมความรู้สึกอย่างสม่ำเสมอ การประทับเวลาที่มีตามการแจกแจงปัวซอง เราแตกต่างกันพารามิเตอร์อัตราสำหรับการประทับเวลาในการผลิตได้เร็วขึ้นหรือช้าลงเปลี่ยนเวลาชุดสำหรับแต่ละหัวข้อ ตั้งแต่คิดชุดหัวข้อเวลามี sampled สม่ำเสมอ เป็นค่าเฉลี่ยอยู่ใกล้กับศูนย์ในระยะยาว ซึ่งหมายความ ว่า มันข้ามเส้นศูนย์กี่ครั้ง (เช่น ที่จุด t1 และ t2 ใน Figure5) เก็บเวลาชุดเดิมของหัวข้อสำหรับโหนสุ่มเลือกประชากร และเราสร้างอนุกรมเวลาสำหรับโหนอื่น ๆ ตาข่ายที่ใช้แม่แบบ bias แต่ละแต่ละของพวกเขา แม่แบบ bias ประกอบด้วยความเชื่อมั่นระดับ bias และช่วงเวลาของความสัมพันธ์กับหัวข้อซีรี่ส์เวลา (บวก ลบ หรือ ศูนย์ การสุ่มเปลี่ยนจุด "ศูนย์ความเชื่อมั่น") เป้าหมายของการประเมินของเราอยู่แล้วเพื่อ แยกช่วงเหล่านี้ความสัมพันธ์ระหว่างหัวข้อและเวลาลำเอียงชุด สร้างขึ้นตามอย่างถูกต้อง ความเชื่อมั่นลำเอียง เราผลิตชุดลำเอียงเวลาในการติดต่อกับแม่แบบ โดยการคัดลอก (สีตรงกันข้าม) ชุดเวลาหัวข้อในกรณีสหสัมพันธ์ (ค่าลบ) หรือแสดงผลแบบสุ่มข้อมูลอื่น (เท่าที่เห็นใน Figure5 ด้านล่าง) ที่ เราเพิ่มบางบวก หรือลบอคติไปชุดตลอดเวลา (เปลี่ยนค่าทั้งหมด) และ -กระจายเสียง (สำหรับแต่ละค่า) ในที่สุด เราปรับอนุกรมเวลาเพื่อให้แน่ใจว่า ความรู้สึกที่วางอยู่ภายในขอบเขตของ [-1.1] หลังจากสร้างชุดลำเอียงเวลาสำหรับโหน เราใส่ข้อมูลดิบความเชื่อมั่นลงในดัชนีในสัดส่วนที่สอดคล้องกับไดรฟ์ข้อมูลของโหนดที่ แล้ว เราตามสัดส่วนกระจายความรู้สึกเหล่านี้สำหรับโหนทั้งหมดของเด็ก (Figure1), มั่นใจ maximality ของโหน
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
5. การทดลอง
เราวิ่งทดลองโดยใช้ข้อมูลทั้งสังเคราะห์และจริง เรา fi ทดลองครั้งแรกกับข้อมูลที่สังเคราะห์เพื่อประเมิน ciency EF fi และประสิทธิภาพการทำงานของอัลกอริทึมของเราต่อไปนี้มันมีการประเมินคุณภาพของความสัมพันธ์ที่ตรวจพบในชุดข้อมูลที่แท้จริง.
เราดำเนินการขั้นตอนวิธีการของเราใน Java และวิ่งทดลองใช้ Java JRE1.7.0 บนเครื่อง ด้วย Dual CPU core2.53 GHz และ 1.5 GB หน่วยความจำหลัก.
5.1 ชุดข้อมูล
ชุดข้อมูลสังเคราะห์
เพื่อให้แม่นยำในการวัดความแม่นยำของระบบของเราในการระบุความสัมพันธ์ความเชื่อมั่นที่เราดำเนินการชุดการทดลองเกี่ยวกับข้อมูลการสังเคราะห์ที่มีอนุกรมเวลาของความรู้สึกกับ Arti Fi cially เพิ่มความสัมพันธ์ในเชิงบวกและเชิงลบอคติระดับเสียงและความเชื่อมั่นที่แสดงในรูปที่ 5 เราอธิบายรูปแบบของชุดข้อมูลของเราดังต่อไปนี้.
ลำดับชั้น เป็นขั้นตอนเบื้องต้นเราสร้างชุดของประชากรลำดับชั้นสำหรับคุณลักษณะเช่นอายุเพศอาชีพและสถานที่ที่มี 8, 3, 4 และ 65 ตามลำดับโหนด โหนดในทุกลำดับชั้นของแต่ละคนได้รับการสุ่มที่มีน้ำหนักและความน่าจะเป็นอคติ น้ำหนักของโหนดจะกระจายไปตามการกระจายของ Zipf และปกติจะเพิ่มขึ้นถึง 1 ในทุกระดับของลำดับชั้น โหนดจากลำดับชั้นที่แตกต่างกันเมื่อรวมรูปแบบตาข่าย 6240 กลุ่มประชากรดังแสดงในรูปที่ 1 ปริมาณความเชื่อมั่นของแต่ละกลุ่มประชากรที่ถูกนำมาเป็นคูณน้ำหนักของโหนดแอตทริบิวต์และอคติของตนเป็นผลรวมถ่วงน้ำหนักของอคติของตน วิธีการที่เราบรรลุความสม่ำเสมอตามธรรมชาติในประชากรตาข่ายให้กระจายพันธุ์ตามธรรมชาติของความรู้สึกซึ่งเป็นสิ่งจำเป็นสำหรับการประเมินผลที่เหมาะสมของการแยกกลุ่มสูงสุดและการตัดแต่งกิ่ง.
ความเชื่อมั่นกระทู้ ชุดข้อมูลที่ตัวเองมีชุดช่วงเวลาของความรู้สึกอิสระที่สร้างขึ้นสำหรับหลายหัวข้อมากกว่าช่วงเวลา 8 ปี แต่ละหัวข้อจะแสดงเป็นอนุกรมเวลาหัวข้อที่ไม่ซ้ำกันที่ผลิตโดยใช้วิธีการสุ่มเดินซึ่งรวบรวมความรู้สึกกระจายเหมือนกันซึ่งเป็นไปตามการกระจาย timestamps Poisson เราแตกต่างกันไปพารามิเตอร์ของอัตราสำหรับการประทับเวลาในการผลิตเร็วหรือช้าเปลี่ยนชุดเวลาสำหรับแต่ละหัวข้อ ตั้งแต่ความรู้สึกสำหรับชุดเวลาหัวข้อเป็นตัวอย่างสม่ำเสมอค่าเฉลี่ยของมันอยู่ใกล้กับศูนย์ในระยะยาวซึ่งหมายความว่ามันข้ามเส้นศูนย์ไม่กี่ครั้ง (ตัวอย่างเช่นที่จุด T1 และ T2 ในรูปที่ 5) ชุดเวลาหัวข้อเดิมถูกเก็บไว้เป็นโหนดประชากรศาสตร์สุ่มเลือกและเราสร้างอนุกรมเวลาสำหรับโหนดตาข่ายอื่น ๆ โดยใช้แม่แบบอคติส่วนบุคคลสำหรับแต่ละของพวกเขา แม่แบบอคติความลำเอียงมีระดับความเชื่อมั่นและช่วงเวลาของความสัมพันธ์กับหัวข้ออนุกรมเวลา (บวกลบหรือศูนย์การเปลี่ยนแปลงแบบสุ่มที่ "ศูนย์ความเชื่อมั่น" คะแนน) เป้าหมายของเราคือการประเมินผลแล้วจะดึงช่วงเวลาที่ความสัมพันธ์ระหว่างเหล่านี้หัวข้อและอนุกรมเวลาลำเอียงสร้างตามที่อธิบายไว้ด้านล่างได้อย่างถูกต้อง.
ความเชื่อมั่นลำเอียง เราผลิตอนุกรมเวลาลำเอียงในการติดต่อกับแม่แบบโดยการคัดลอก (กลับหัว) อนุกรมเวลาหัวข้อในกรณีของการบวก (ลบ) ความสัมพันธ์หรือการแสดงผลข้อมูลแบบสุ่มอย่างอื่น (เท่าที่เห็นในรูปที่ 5 ด้านล่าง) ต่อไปนี้ที่เราเพิ่มอคติบวกหรือลบบางอย่างที่จะชุดตลอดเวลา (ขยับค่าทั้งหมด) และเสียงสม่ำเสมอกระจาย (สำหรับแต่ละค่า) สุดท้ายเราชั่งแบบเวลาที่จะทำให้แน่ใจว่ารู้สึกวางอยู่ภายในขอบเขตของ [-1,1] หลังจากสร้างอนุกรมเวลาลำเอียงสำหรับโหนดที่เราแทรกข้อมูลความเชื่อมั่นดิบให้เป็นดัชนีในสัดส่วนที่สอดคล้องกับปริมาณโหนด จากนั้นเราจะกระจายตามสัดส่วนความรู้สึกเหล่านี้สำหรับเด็กทุกคนของโหนด (รูปที่ 1) เพื่อให้มั่นใจ maximality ของโหนดว่า
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
5 . การทดลองเราก็ทดลองใช้ทั้งสังเคราะห์และข้อมูลที่แท้จริง เราจึงทดลองแรกกับสังเคราะห์ข้อมูลเพื่อประเมินประสิทธิภาพและสมรรถนะของ EF จึงขั้นตอนวิธีการของเรา ตามด้วยการประเมินเชิงคุณภาพของความสัมพันธ์ที่พบบนพื้นผิวจริงเราใช้ขั้นตอนวิธีการของเราใน Java และรันการทดลองโดยใช้ Java jre1.7.0 บนเครื่องด้วยระบบ core2.53 GHz CPU และ 1.5 GB ของหน่วยความจำหลัก5.1 ข้อมูลข้อมูลสังเคราะห์เพื่อทำการวัดความแม่นยำของระบบของเราในการระบุความเชื่อมั่น ความสัมพันธ์ เราดำเนินการชุดของการทดลองสังเคราะห์ข้อมูลอนุกรมเวลาที่มีความรู้สึกกับกิจึง cially เพิ่มบวกและลบความอคติและเสียง ระดับความเชื่อมั่นที่แสดงให้เห็นใน figure5 . เราอธิบายถึงรูปแบบของชุดข้อมูลด้านล่างลำดับชั้น . เป็นขั้นตอนเบื้องต้น เราสร้างชุดของประชากรขั้นได้ คุณลักษณะที่สำคัญ เช่น อายุ เพศ อาชีพ และสถานที่ที่มี 2 , 3 , 4 และ 65 จุด ตามลำดับ แต่ละโหนดทุกลำดับชั้นสุ่มเข้ากับน้ำหนัก และ อคติ ความน่าจะเป็น น้ำหนักของโหนดมีการกระจายตามซิพฟ์ของการกระจายตัว และปกติจะเพิ่มถึง 1 ในทุกระดับของการปกครอง โหนดจากต่างชนชั้น เมื่อรวมแบบแลตทิซของ 6240 ประชากรกลุ่มดังแสดงใน figure1 . ความเชื่อมั่นของระดับเสียงของแต่ละกลุ่มประชากรถูกจับเป็นการคูณน้ำหนักของแอตทริบิวต์ของโหนดและอคติเป็นผลรวมถ่วงน้ำหนักของอคติของแต่ละคน วิธีที่เราบรรลุความสม่ำเสมอในประชากรธรรมชาติตาข่ายให้ธรรมชาติของความรู้สึก ซึ่งเป็นสิ่งที่จำเป็นสำหรับการประเมินที่เหมาะสมของการสกัดสูงสุดของกลุ่ม และตัดแต่งกิ่งความเชื่อมั่นในหัวข้อ ข้อมูลอนุกรมเวลาของความรู้สึกที่สร้างขึ้นเอง ประกอบด้วยหัวข้ออิสระหลายกว่าช่วงเวลา 8 ปี แต่ละหัวข้อจะถูกแสดง โดยเฉพาะเรื่องเวลา ชุด ผลิตโดยใช้วิธีสุ่มกระจายอย่างสม่ำเสมอ ซึ่งรวบรวมความรู้สึกที่มี timestamps ตามการแจกแจงปัวส์ซอง เราเปลี่ยนพารามิเตอร์ของอัตราสำหรับ timestamps ผลิตช้า หรือเร็ว เวลาเปลี่ยนชุดสำหรับแต่ละหัวข้อ เพราะความรู้สึก เรื่องเวลา ชุดตัวอย่างเหมือนกันค่าของ หมายถึงอยู่ใกล้กับศูนย์ในการเรียกใช้เวลานาน หมายความว่ามันข้ามบรรทัดเป็นศูนย์ ไม่กี่ครั้ง เช่น ที่จุด T1 และ T2 ใน figure5 ) ต้นฉบับเรื่องเวลาเป็นชุดเก็บไว้ที่สุ่มเลือกระหว่างโหนด และเราสร้างอนุกรมเวลาสำหรับโหนดตาข่ายอื่นๆโดยใช้แม่แบบอคติส่วนบุคคลสำหรับแต่ละของพวกเขา ตั้งค่าแม่แบบประกอบด้วยความรู้สึกอคติระดับและช่วงเวลาของความสัมพันธ์กับหัวข้อของอนุกรมเวลา ( บวก ลบ หรือศูนย์ สุ่มเปลี่ยนที่ศูนย์ ฯ " คะแนน ) เป้าหมายของการประเมินของเรา แล้วถูกสกัดช่วงความสัมพันธ์เหล่านี้ระหว่างหัวข้อและอคติของอนุกรมเวลาที่สร้างขึ้นตามที่อธิบายไว้ด้านล่างลำเอียง sentiment เราผลิตชุดลำเอียงเวลาในการติดต่อกับแม่แบบโดยการคัดลอก ( กลับหัว ) หัวข้อเวลาชุดในกรณีที่บวก ( ลบ ) ความสัมพันธ์ หรือสร้างข้อมูลแบบอื่น ( ตามที่เห็นใน figure5 ด้านล่าง ) ต่อไปนี้ เราเพิ่มเป็นบวกหรือลบ อคติ กับชุดตลอดเวลา ( เปลี่ยนค่าทั้งหมด ) และกระจายอย่างสม่ำเสมอเสียง ( สำหรับแต่ละค่า ) สุดท้ายเราขนาดอนุกรมเวลาเพื่อให้แน่ใจว่า ความรู้สึกวางภายในขอบเขตของ [ - 1 , 1 ] หลังจากการสร้างอคติเวลาชุดเพื่อใส่ เราใส่ข้อมูลอารมณ์ดิบที่เป็นดัชนีในสัดส่วนที่สอดคล้องกับปริมาณโหนดของ จากนั้น เราได้แจกจ่ายความรู้สึกเหล่านี้สำหรับเด็กโหนดทั้งหมด ( figure1 ) เพื่อให้มั่นใจว่า maximality ของโหนด
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2024 I Love Translation. All reserved.

E-mail: