Even in developed countries, infectious disease has significant impact; for example, flu seasons in the United States take between 3,000 and 49,000 lives. Disease surveillance, traditionally based on patient visits to health providers and laboratory tests, can reduce these impacts. Motivated by cost and timeliness, surveillance methods based on internet data have recently emerged, but are not yet reliable for several reasons, including weak scientific peer review, breadth of diseases and countries covered, and underdeveloped forecasting capabilities. We argue that these challenges can be overcome by using a freely available data source: aggregated access logs from the online encyclopedia Wikipedia. Using simple statistical techniques, our proof-of-concept experiments suggest that these data are effective for predicting the present, as well as forecasting up to the 28-day limit of our tests. Our results also suggest that these models can be used even in places with no official data upon which to build models. In short, this paper establishes the utility of Wikipedia as a broadly effective data source for disease information, and we outline a path to a reliable, scientifically sound, operational, and global disease surveillance system that overcomes key gaps in existing traditional and internet-based techniques.
แม้แต่ในประเทศที่พัฒนาแล้วโรคที่มีผลกระทบอย่างมีนัยสำคัญ ตัวอย่างเช่น ไข้หวัดฤดูกาลในสหรัฐอเมริกาใช้เวลาระหว่าง 3 , 000 และ 49 , 000 คน การเฝ้าระวังโรค , ประเพณีจากเยี่ยมคนไข้กับผู้ให้บริการสุขภาพและการทดสอบทางห้องปฏิบัติการ สามารถลดผลกระทบเหล่านี้ แรงจูงใจจากต้นทุน และสมดุล วิธีการเฝ้าระวังบนพื้นฐานของข้อมูลอินเทอร์เน็ตที่เพิ่งออกมาแต่ยังไม่สามารถเชื่อถือได้ ด้วยเหตุผลหลายประการรวมถึงตรวจสอบทางวิทยาศาสตร์ อ่อน ความกว้างของโรคและประเทศที่ครอบคลุม และด้อยพัฒนาในการพยากรณ์ความสามารถในการ เรายืนยันว่าสามารถเอาชนะความท้าทายเหล่านี้ โดยการใช้แหล่งข้อมูลที่ใช้ได้อย่างอิสระ : รวมบันทึกการเข้าถึงจากสารานุกรมออนไลน์วิกิพีเดีย การใช้เทคนิคทางสถิติอย่างง่ายหลักฐานของแนวคิดการทดลองชี้ให้เห็นว่าข้อมูลเหล่านี้จะมีประสิทธิภาพสำหรับทำนายปัจจุบัน ตลอดจนการคาดการณ์ถึง 28 วัน จำกัด ในการทดสอบของเรา ผลของเรายังแนะนำว่า รุ่นนี้สามารถใช้ได้แม้ในสถานที่ที่ไม่มีข้อมูลอย่างเป็นทางการตามที่การสร้างโมเดล ในสั้น , กระดาษนี้สร้างสาธารณูปโภคของวิกิพีเดียเป็นแหล่งข้อมูลที่มีประสิทธิภาพมากขึ้นข้อมูลโรคและเราร่างเส้นทางที่เชื่อถือได้ , เสียง , วิทยาศาสตร์ปฏิบัติการ และระบบการเฝ้าระวังโรคทั่วโลกที่เอาชนะช่องว่างที่สำคัญในที่มีอยู่ดั้งเดิม และใช้เทคนิค
การแปล กรุณารอสักครู่..