Table 2
The details of dataset used to period detection (100 events life length is about
30–40 days).
Feature Value
Average number of seeds per event 2
Average number of Webpages per event 5556
Average number of event attributes per event 16,856
Average number of days per event 40
Average number of Webpages per day 146
Average number of event attributes per day 469
of modeling the distribution of attributes on webpage and the classified
webpages on website directly, namely we computed the web
event veracity via uncertainty through the two distributions without
modeling them directly.
6. Experiments
This section implements the proposed web event veracity model.
As we discussed prior, web event veracity connect to web event uncertainty
and website confidence closely. High uncertainty of attribute,
webpage, classified webpage and low confidence of website yield high
uncertainty and low veracity of web event. These features influence
each other through two distributions (attributes on webpages, classified
webpages on websites), and sparse distribution on uncertain
webpage and unauthentic website lead to more uncertain and less
veracious web event. Data sets and experimental analysis are made
in this section.
6.1. Data sets
In this paper, the web events in our experiments are downloaded
from Baidu (http://news.baidu.com), and other news websites. The
seeds of events are extracted from baidu.com. In the experiments, we
chose 900,000 webpages about 100 events as the experimental data
set, which covers politic area, accidents, disasters, terrorist attacks
and so on. Table 2 shows the various statistics of the above data. The
start timestamp is determined referring (Jin et al., 2010), and the end
timestamp is settled as the time we stopped climbing webpages. And
the average web event life length is about 30–40 days.
6.2. Experimental analysis of how the event features influence the
veracity of web event via uncertainty
6.2.1. How the classified webpages distribution on the website influence
on the veracity of web event via uncertainty
In Fig. 5 , after the distribution of attributes on webpages is fixed,
we compute the uncertainty of web event with the variation of classified
webpages distribution on websites.
Fig. 5. How the event classified webpage distribution on the websites χ influence the
web event uncertainty.
Fig. 6. How the website confidence and the diversity influence on the web event
uncertainty.
Supposing the number of edges is max(ne) when all the classified
webpages are supported by all websites. Then the density of edges
means the number of existed edges divide max(ne). From Fig. 5 we
can gain that the uncertainty of web event is 0 and veracity is 1 when
the density of edges near 1; the uncertainty of web event is high and
veracity is low when the density of edges close to 0. The results are
in accordance with Deductions 1 and 2.
Actually, when the density of edges is near 1, it means all the
subordinated web events of a web event are supported by all websites,
which indicates that the event has been admitted by all Medias. In
this way, the corresponding web event uncertainty is low and veracity
is high. When the density close to 0, it means few websites support
related subordinated web events and its evolution direction is quite
uncertain, then the corresponding web event uncertainty is high and
veracity is low.
6.2.2. How the website confidence influence on the web event
uncertainty
We assigned the website confidences randomly as the initial values
at the beginning of the iterative process, and then compute the
web event uncertainty. Fig. 6 shows how the website confidence
influences the web event veracity. Through the experiment results,
we can get the uncertainty distribution pattern; namely, web event
veracity via uncertainty not only related to the website confidence
but also related to the diversity of webpages. Website confidence has
a little drift with the type of website such as news, bbs, and blog.
Furthermore, web event veracity is affected.
Therefore, the website confidence and the distribution of classified
webpages on websites affect the web event uncertainty.
6.2.3. Experimental results about website confidence
According to the descriptions in Sections 3–5, we know that the
web event uncertainty is influenced by the website confidence, attribute
uncertainty, webpage uncertainty, classified webpage uncertainty
and related two distributions. This section chooses website
confidence to confirm whether our algorithm is effective for that
website confidence are easy to be evaluated by human.
6.2.3.1. Statistical results. We extracted 23 representative websites
came from Internet, and compute the website confidence according
to the iterative process proposed in Section 4 and the results have
been shown in Table 3.
The third column in Table 3 is labeled as the artificial website
confidences. During the process of the labeling, we train seven experimenters.
Then experimenters graded the website confidence with
their experiences. The five columns are range of website confidence,
ตารางที่ 2
รายละเอียดของชุดข้อมูลที่ใช้ในการตรวจจับการงวด (100 ระยะเวลาในชีวิตเป็นเรื่องเกี่ยวกับเหตุการณ์ที่เกิดขึ้น
วันที่ 30-40).
คุณลักษณะค่า
เฉลี่ยจำนวนเมล็ดต่อเหตุการณ์ที่ 2
จำนวนเฉลี่ยของหน้าเว็บต่อเหตุการณ์ 5556
จำนวนเฉลี่ยของเหตุการณ์แอตทริบิวต์ต่อเหตุการณ์ 16,856
จำนวนเฉลี่ยของ วันต่อเหตุการณ์ 40
จำนวนเฉลี่ยของหน้าเว็บต่อวัน 146
จำนวนเฉลี่ยของเหตุการณ์แอตทริบิวต์ต่อวัน 469
ของการสร้างแบบจำลองการกระจายของคุณลักษณะบนหน้าเว็บและจัด
หน้าเว็บบนเว็บไซต์โดยตรงคือเราคำนวณเว็บ
ความจริงเหตุการณ์ความไม่แน่นอนทางผ่านสองการกระจายโดยไม่ต้อง
สร้างแบบจำลอง พวกเขาโดยตรง.
6 การทดลอง
ในส่วนนี้จะดำเนินการจัดกิจกรรมรูปแบบเว็บที่นำเสนอความจริง.
ขณะที่เราพูดคุยกันก่อนที่เหตุการณ์จริงเว็บเชื่อมต่อกับความไม่แน่นอนของเหตุการณ์เว็บ
และความเชื่อมั่นเว็บไซต์อย่างใกล้ชิด ความไม่แน่นอนสูงของแอตทริบิวต์,
หน้าเว็บ, หน้าเว็บที่จัดและความเชื่อมั่นต่ำของอัตราผลตอบแทนของเว็บไซต์สูง
ความไม่แน่นอนและความจริงต่ำของเหตุการณ์เว็บ คุณสมบัติเหล่านี้มีอิทธิพลต่อ
กันและกันผ่านสองการกระจาย (คุณลักษณะบนหน้าเว็บ, จัด
หน้าเว็บบนเว็บไซต์) และการกระจายเบาบางบนความไม่แน่นอน
ของหน้าเว็บและนำไปสู่เว็บไซต์ปลอมให้มากขึ้นมีความไม่แน่นอนและน้อย
เหตุการณ์เว็บวาจาสัตย์ ชุดข้อมูลและการวิเคราะห์การทดลองจะทำ
ในส่วนนี้.
6.1 ชุดข้อมูล
ในบทความนี้เหตุการณ์ที่เกิดขึ้นบนเว็บในการทดลองของเราจะมีการดาวน์โหลด
จาก Baidu (http://news.baidu.com) และเว็บไซต์ข่าวอื่น ๆ
เมล็ดของเหตุการณ์ที่สกัดจาก baidu.com ในการทดลองที่เรา
เลือกที่ 900,000 หน้าเว็บที่เกี่ยวกับเหตุการณ์ที่เกิดขึ้นเป็น 100 ข้อมูลการทดลอง
ชุดซึ่งครอบคลุมพื้นที่ทางการเมืองที่เกิดอุบัติเหตุ, ภัยพิบัติ, การโจมตีของผู้ก่อการร้าย
และอื่น ๆ ตารางที่ 2 แสดงสถิติต่างๆของข้อมูลดังกล่าวข้างต้น
การประทับเวลาเริ่มต้นจะถูกกำหนดหมาย (จิน et al., 2010), และสิ้นสุด
การประทับเวลาจะเรียกว่าเวลาที่เราหยุดหน้าเว็บที่ปีนเขา และ
เหตุการณ์เว็บเฉลี่ยระยะเวลาในชีวิตก็คือประมาณ 30-40 วัน.
6.2 การวิเคราะห์การทดลองของวิธีการคุณสมบัติเหตุการณ์ที่มีอิทธิพลต่อ
ความจริงของเหตุการณ์ความไม่แน่นอนเว็บผ่าน
6.2.1 วิธีการกระจายหน้าเว็บโฆษณาบนเว็บไซต์อิทธิพล
ในความจริงของเหตุการณ์เว็บผ่านความไม่แน่นอน
ในรูป 5 หลังจากการกระจายของคุณลักษณะบนหน้าเว็บได้รับการแก้ไข
เราคำนวณความไม่แน่นอนของเหตุการณ์เว็บที่มีรูปแบบของการจัด
กระจายหน้าเว็บในเว็บไซต์.
รูป 5. กรณีที่การกระจายจัดหน้าเว็บบนเว็บไซต์มีอิทธิพลต่อχ
เหตุการณ์ความไม่แน่นอนเว็บ.
รูป 6. ความเชื่อมั่นของเว็บไซต์และมีอิทธิพลต่อความหลากหลายเกี่ยวกับเหตุการณ์ที่เว็บ
ไม่แน่นอน.
เผื่อว่าจำนวนขอบเป็นสูงสุด (ตะวันออกเฉียงเหนือ) เมื่อทุกประเภท
หน้าเว็บที่ได้รับการสนับสนุนโดยเว็บไซต์ทั้งหมด แล้วความหนาแน่นของขอบ
หมายถึงจำนวนที่มีอยู่ขอบแบ่งสูงสุด (ตะวันออกเฉียงเหนือ) จากรูปที่ 5 เรา
สามารถได้รับที่ความไม่แน่นอนของเหตุการณ์เว็บเป็น 0 และความจริงเป็น 1 เมื่อ
ความหนาแน่นของขอบใกล้ 1; ความไม่แน่นอนของเหตุการณ์เว็บเป็นที่สูงและ
ความจริงอยู่ในระดับต่ำเมื่อความหนาแน่นของขอบใกล้กับ 0. ผลลัพธ์ที่ได้จะ
เป็นไปตามที่มีการหักเงินที่ 1 และ 2.
อันที่จริงเมื่อความหนาแน่นของขอบอยู่ใกล้ 1 ก็หมายความว่าทุก
เหตุการณ์ที่เกิดขึ้นเว็บด้อยสิทธิของ เหตุการณ์เว็บได้รับการสนับสนุนโดยเว็บไซต์ทั้งหมด
ซึ่งแสดงให้เห็นว่าเหตุการณ์ที่ได้รับการยอมรับโดยมีเดียทั้งหมด ใน
วิธีนี้ความไม่แน่นอนเหตุการณ์เว็บที่เกี่ยวข้องอยู่ในระดับต่ำและความจริง
เป็นที่สูง เมื่อความหนาแน่นใกล้เคียงกับ 0 จะหมายถึงการไม่กี่เว็บไซต์การสนับสนุน
ที่เกี่ยวข้องกับเหตุการณ์ที่เกิดขึ้นเว็บด้อยสิทธิและทิศทางวิวัฒนาการของมันค่อนข้าง
มีความไม่แน่นอนจากนั้นความไม่แน่นอนเหตุการณ์เว็บที่เกี่ยวข้องอยู่ในระดับสูงและ
ความจริงอยู่ในระดับต่ำ.
6.2.2 วิธีที่มีอิทธิพลต่อความเชื่อมั่นของเว็บไซต์บนเว็บเหตุการณ์
ความไม่แน่นอน
เราได้รับมอบหมายให้ความเชื่อมั่นของเว็บไซต์สุ่มเป็นค่าเริ่มต้น
ที่จุดเริ่มต้นของกระบวนการซ้ำแล้วคำนวณ
ความไม่แน่นอนกรณีที่เว็บ มะเดื่อ 6 แสดงให้เห็นว่าความเชื่อมั่นของเว็บไซต์
ที่มีอิทธิพลต่อความจริงเหตุการณ์เว็บ ผ่านผลการทดลองที่
เราจะได้รับรูปแบบการกระจายความไม่แน่นอน; คือเหตุการณ์เว็บ
จริงผ่านความไม่แน่นอนไม่ได้เกี่ยวข้องเฉพาะกับความเชื่อมั่นของเว็บไซต์
แต่ยังเกี่ยวข้องกับความหลากหลายของหน้าเว็บ ความเชื่อมั่นของเว็บไซต์มี
ลอยเล็ก ๆ น้อย ๆ กับประเภทของเว็บไซต์เช่นข่าว BBS และบล็อก.
นอกจากนี้ความจริงเหตุการณ์เว็บได้รับผลกระทบ.
ดังนั้นความเชื่อมั่นของเว็บไซต์และการกระจายของการจัด
หน้าเว็บบนเว็บไซต์ส่งผลกระทบต่อความไม่แน่นอนของเหตุการณ์เว็บ.
6.2.3 . ผลการทดลองเกี่ยวกับความเชื่อมั่นของเว็บไซต์
ตามรายละเอียดในส่วนที่ 3-5 เรารู้ว่า
ความไม่แน่นอนเหตุการณ์เว็บได้รับอิทธิพลจากความเชื่อมั่นของเว็บไซต์ที่แอตทริบิวต์
ไม่แน่นอน, ความไม่แน่นอนของหน้าเว็บ, ความไม่แน่นอนของหน้าเว็บโฆษณา
และ บริษัท ที่เกี่ยวข้องสองแจกแจง ในส่วนนี้จะเลือกเว็บไซต์
ความมั่นใจที่จะยืนยันว่าอัลกอริทึมของเรามีประสิทธิภาพสำหรับการที่
ความเชื่อมั่นของเว็บไซต์เป็นเรื่องง่ายที่จะได้รับการประเมินโดยมนุษย์.
6.2.3.1 ผลทางสถิติ เราสกัด 23 เว็บไซต์ที่เป็นตัวแทน
มาจากอินเทอร์เน็ตและการคำนวณความเชื่อมั่นของเว็บไซต์ตาม
กระบวนการซ้ำเสนอในมาตรา 4 และผลที่ได้
รับการแสดงในตารางที่ 3.
คอลัมน์ที่สามในตารางที่ 3 มีการระบุว่าเป็นเว็บไซต์เทียม
ความเชื่อมั่น ในระหว่างขั้นตอนของการติดฉลากเรารถไฟเจ็ดขัดเคือง.
แล้วขัดเคืองให้คะแนนความเชื่อมั่นของเว็บไซต์ที่มี
ประสบการณ์ของพวกเขา ห้าคอลัมน์ช่วงของความเชื่อมั่นของเว็บไซต์
การแปล กรุณารอสักครู่..
