N. A. CHRISTAKIS AND J. H. FOWLER
thus covers several domains and relies on diverse data and approaches. It builds on prior research on
‘peer effects’ and interpersonal influence by examining data in which individuals are embedded in
networks much larger than two people. We summarize this work and describe critiques, extensions,
and confirmations of our findings by other scientists.
Using similar modeling approaches and exploiting data from many sources, we have examined the
‘spread’ of obesity [14, 15], smoking [16], alcohol consumption [17], health screening [18], happiness
[19], loneliness [20], depression [21], sleep [22], drug use [22], divorce [23], food consumption [24],
cooperative behavior [6], influenza [4], sexuality and sexual orientation [25], and tastes in music, books,
and movies [26]. We have also conducted experiments regarding the spread within networks of altruism
[6, 7] and of political mobilization [3]; in such experiments, causal inference with respect to network
effects is more robust (although experiments have limitations of their own). We have previously sum-
marized this work, and also the work of numerous other scholars who have investigated social networks
and interpersonal influence, in our book,
Connected
, published in 2009 [27], and in a 2008 review article
focusedonhealth[28].
In our work, we have used the best currently available methods. Network statistics is a fast-growing
field (for useful reviews of the topic, see [29–36]), and it is clear that perfect methods, free of any
limitations or assumptions, do not exist for every sort of question one might want to ask with obser-
vational (or even experimental) data. Basic issues in coping with missing data (missing nodes, ties,
covariates, waves), sampling (design effects and incomplete network ascertainment), computation of
standard errors, and even of the causal interpretation of model parameters, for example, are still
being addressed.
However, rather than foreswear observations regarding social network phenomena, we have chosen,
in our papers, to analyze available data, and we attempt to characterize known limitations and assump-
tions in available methods. Also, of course, as scientists identify limitations in current methods, many
will, we hope, also take the next step to innovate and propose alternatives, because all statistical methods
have limitations and they frequently rely on untestable or awkward assumptions. We hope our own work
has played a part in stimulating interest in developing statistical methods for network data; we are inter-
ested to deploy new and better methods, and we are attempting to contribute to progress in this area, as
described below. Hence, we invite suggestions regarding how to analyze such data if current approaches
have limitations that some find overwhelming.
This paper proceeds as follows. First, in Section 2 we describe a key dataset that we assembled and
first analyzed, the so-called FHS-Net. Although we describe the FHS-Net in detail, we note that we and
others have replicated our findings using other datasets and methods, as discussed below, including by
using experiments. In Section 3 we describe basic analyses involving permutation tests that show clus-
tering of various traits within various observed social networks. Section 4 addresses a set of concerns
regarding the nature of potential biases introduced to estimates of clustering by the limited nature of
social ties available in the FHS-Net. Section 5 describes the longitudinal regression models we deployed
to analyze peer effects within the network, at the dyadic level. We attempt to provide a comprehen-
sive review of the assumptions and biases present in such models. Also, we summarize model output as
applied to more than one dataset. In Section 6, we describe a novel identification strategy we proposed in
2007 involving the exploitation of the directionality of some social ties. We also describe extensions and
limitations since characterized by other scientists. Section 7 describes how geographic location infor-
mation might be used to help address certain types of confounding with observational network data.
Section 8 describes how the FHS-Net data has been publicly available since 2009, and where other data
regarding longitudinally evolving networks might also be obtained. Section 9 concludes and also sum-
marizes much work that has been conducted in recent years by other scholars documenting spreading
processes in networ
N. A. CHRISTAKIS และ J. H. ฟาวเลอร์จึงครอบคลุมหลายโดเมน และอาศัยข้อมูลที่หลากหลายและแนวทาง สร้างในงานวิจัยก่อนใน'ผลเพียร์' และอิทธิพลที่มีต่อมนุษยสัมพันธ์ ด้วยการตรวจสอบข้อมูลที่บุคคลถูกฝังอยู่ในเครือข่ายขนาดใหญ่กว่าสองคน เราสรุปงานนี้ และอธิบายข้อดีข้อเสีย นามสกุลและยืนยันของเราค้นพบโดยนักวิทยาศาสตร์อื่น ๆใช้วิธีการสร้างโมเดลและ exploiting ข้อมูลจากหลายแหล่งเหมือนกัน เรามีการตรวจสอบการ'แพร่' โรคอ้วน [14, 15], [16] บุหรี่ แอลกอฮอล์ [17], [18] ตรวจสุขภาพ ความสุข[19], ความเหงา [20], ภาวะซึมเศร้า [21], สลี [22], ใช้ยาเสพติด [22], [23] การหย่า ปริมาณอาหาร [24],พฤติกรรมแบบมีส่วนร่วม [6], ไข้หวัดใหญ่ [4], เพศ และเพศ [25], และรสนิยมในดนตรี หนังสือและภาพยนตร์ [26] นอกจากนี้เรายังได้ดำเนินการทดลองเกี่ยวกับการแพร่กระจายภายในเครือข่ายของ altruism[6, 7] และ การเคลื่อนไหวทางการเมือง [3]; ในการทดลองดังกล่าว ข้อสาเหตุเกี่ยวกับเครือข่ายผลมีประสิทธิภาพมากขึ้น (แม้ว่าการทดลองมีข้อจำกัดของตนเอง) ก่อนหน้านี้มีผล-marized งานนี้ และการทำงานของนักวิชาการอื่น ๆ จำนวนมากที่มีการตรวจสอบเครือข่ายทางสังคมอิทธิพลของมนุษยสัมพันธ์ ในหนังสือของเรา และการเชื่อมต่อเผยแพร่ ในปี 2552 [27], และ ในบทความรีวิว 2008focusedonhealth [28]ในการทำงานของเรา เราใช้ดีสุดวิธีที่อยู่ สถิติเครือข่ายได้อย่างรวดเร็วเติบโต(สำหรับประโยชน์รีวิวหัวข้อ ดู [29-36]), และล้างที่สมบูรณ์แบบวิธี ฟรีของข้อจำกัดหรือสมมติฐาน ไม่มีอยู่สำหรับทุกประเภทของคำถามอาจต้องถามกับ obser-ข้อมูล vational (หรือแม้กระทั่งทดลอง) ปัญหาพื้นฐานในการรับมือกับการขาดข้อมูล (โหนสูญหาย ความสัมพันธ์covariates คลื่น), คำนวณ การสุ่มตัวอย่าง (ผลออกแบบและ ascertainment เครือข่ายไม่สมบูรณ์)ข้อผิดพลาดมาตรฐาน และแม้แต่การตีความสาเหตุของพารามิเตอร์รูปแบบ ตัวอย่าง ยังคงที่อยู่อย่างไรก็ตาม แต่กว่า foreswear ข้อสังเกตเกี่ยวกับปรากฏการณ์สังคม เราเลือกในเอกสารของเรา วิเคราะห์ ข้อมูล และเราพยายามที่จะกำหนดลักษณะข้อจำกัดที่ทราบและ assump-tions ในวิธี ยัง แน่นอน เป็นนักวิทยาศาสตร์ระบุข้อจำกัดในวิธีการปัจจุบัน มากหวัง ยังจะขั้นตอนถัดไปเพื่อสร้างสรรค์สิ่งใหม่ ๆ และนำเสนอทางเลือก เนื่องจากสถิติทั้งหมดวิธีมีข้อจำกัด และพวกเขามักอาศัยสมมติฐาน untestable หรือตกใจ เราหวังว่างานของเราเองได้เล่นเป็นส่วนหนึ่งในกระตุ้นการสนใจในการพัฒนาวิธีการทางสถิติสำหรับข้อมูลเครือข่าย เรามีอินเตอร์-ested การจัดวางใหม่ และดีกว่าวิธีการ และเรากำลังพยายามที่จะนำไปสู่ความก้าวหน้าในนี้ เป็นอธิบายได้ดังนี้ ดังนั้น เราขอเชิญให้คำแนะนำเกี่ยวกับวิธีการวิเคราะห์ข้อมูลดังกล่าวหากใกล้ถึงปัจจุบันมีข้อจำกัดที่ว่า บางคนค้นหามากมายกระดาษนี้ดำเนินดังนี้ ครั้งแรก 2 ส่วน เราอธิบายชุดข้อมูลคีย์ที่เรารวบรวม และfirst analyzed, the so-called FHS-Net. Although we describe the FHS-Net in detail, we note that we andothers have replicated our findings using other datasets and methods, as discussed below, including byusing experiments. In Section 3 we describe basic analyses involving permutation tests that show clus-tering of various traits within various observed social networks. Section 4 addresses a set of concernsregarding the nature of potential biases introduced to estimates of clustering by the limited nature ofsocial ties available in the FHS-Net. Section 5 describes the longitudinal regression models we deployedto analyze peer effects within the network, at the dyadic level. We attempt to provide a comprehen-sive review of the assumptions and biases present in such models. Also, we summarize model output asapplied to more than one dataset. In Section 6, we describe a novel identification strategy we proposed in2007 involving the exploitation of the directionality of some social ties. We also describe extensions andlimitations since characterized by other scientists. Section 7 describes how geographic location infor-mation might be used to help address certain types of confounding with observational network data.Section 8 describes how the FHS-Net data has been publicly available since 2009, and where other dataregarding longitudinally evolving networks might also be obtained. Section 9 concludes and also sum-marizes much work that has been conducted in recent years by other scholars documenting spreadingprocesses in networ
การแปล กรุณารอสักครู่..
. . christakis และ J . H . ฟาวเลอร์
จึงครอบคลุมหลายโดเมน และอาศัยข้อมูลที่หลากหลายและวิธี มันสร้างก่อนการวิจัยเกี่ยวกับผลและอิทธิพลระหว่างบุคคล 'peer ' โดยการตรวจสอบข้อมูลที่บุคคลจะฝังตัวอยู่ในเครือข่ายขนาดใหญ่กว่า
2 คน เราสรุปงานนี้ และอธิบายการวิจารณ์ , นามสกุล และการยืนยันของการค้นพบของเรา
โดยนักวิทยาศาสตร์อื่น ๆโดยใช้วิธีการสร้างแบบจำลองที่คล้ายกันและใช้ข้อมูลจากแหล่งข้อมูลมากมายให้เราได้ศึกษา
'spread ' โรคอ้วน [ 14 , 15 ] [ 16 ] การสูบบุหรี่ การดื่มแอลกอฮอล์ [ 17 ] สุขภาพ คัดกรอง [ 18 ] ความสุข
[ 19 ] ความเหงา [ 20 ] , ซึมเศร้า [ 21 ] , นอนหลับ [ 22 ] การใช้ยา [ 22 ] , การหย่าร้าง [ 23 ] , การบริโภคอาหาร [ 24 ] , [ 6 ]
พฤติกรรมความร่วมมือ ไข้หวัดใหญ่ [ 4 ] , เพศและรสนิยมทางเพศ [ 25 ]และรสนิยมในดนตรี , หนังสือ ,
และภาพยนตร์ [ 26 ] นอกจากนี้เรายังได้ทำการทดลองเกี่ยวกับการแพร่กระจายภายในเครือข่ายด้าน
[ 6 , 7 ] และการชุมนุมทางการเมือง [ 3 ] ; ในการทดลองดังกล่าว สาเหตุการอนุมานเกี่ยวกับผลกระทบของเครือข่ายที่แข็งแกร่งมากขึ้น ( แม้ว่า
การทดลองมีข้อ จำกัด ของตัวเอง ) เราได้เคยรวม -
marized งานนี้และยังมีงานของนักวิชาการอื่น ๆ มากมายที่ได้ศึกษาเครือข่ายทางสังคม
และอิทธิพลระหว่างบุคคลในหนังสือของเราต่อ
, ตีพิมพ์ในปี 2009 [ 27 ] และ ใน 2008 บทความรีวิว
focusedonhealth [ 28 ] .
ในงานของเรา เราต้องใช้วิธีการที่ดีที่สุดในขณะนี้สามารถใช้ได้ สถิติเครือข่าย เป็นเขตที่เติบโตอย่างรวดเร็ว
( เพื่อประโยชน์ความคิดเห็น ของหัวข้อ ดู [ 29 ] ( 36 )และมันเป็นที่ชัดเจนว่าวิธีการที่สมบูรณ์แบบ , ฟรีของ
ข้อจำกัดหรือสมมติฐานไม่มีอยู่สำหรับทุกประเภทของคำถามที่อาจจะถามกับ obser -
vational ( หรือแม้กระทั่ง 2 ) ข้อมูล ปัญหาพื้นฐานในการจัดการกับข้อมูลสูญหาย ( หายไป ) , สัมพันธ์ ,
ความรู้ คลื่น ) ตัวอย่าง ( ผลการออกแบบและสมบูรณ์วิธีการค้นหาเครือข่าย ) , การคำนวณ
ข้อผิดพลาดมาตรฐานและแม้แต่การตีความเชิงสาเหตุของตัวแปร รุ่น ตัวอย่างเช่น ยังคงถูกเรียกว่า
.
แต่มากกว่า foreswear ข้อสังเกตเกี่ยวกับปรากฏการณ์สังคมเครือข่าย เราได้เลือก
ในเอกสาร วิเคราะห์ข้อมูลที่มีอยู่ และเราพยายามที่จะจำกัดความรู้ข้อจำกัดและ assump -
ยินดีด้วยในวิธีที่พร้อมใช้งาน . ยัง , แน่นอน , เป็นนักวิทยาศาสตร์ระบุข้อจำกัดในวิธีการในปัจจุบันหลาย
จะ เราหวังว่า ยังก้าวต่อไปเพื่อสร้างสรรค์นวัตกรรมและนำเสนอทางเลือก เพราะทุกวิธีทางสถิติ
มีข้อจำกัดและพวกเขามักพึ่งพา untestable หรืออึดอัดของสมมติฐาน เราหวังว่า
งานของเราเอง มีการเล่นเป็นส่วนหนึ่งในการกระตุ้นความสนใจในการพัฒนาวิธีการทางสถิติสำหรับข้อมูลเครือข่าย เรามีอินเตอร์ ested -
ปรับใหม่และดีกว่าวิธีการเราพยายามที่จะมีส่วนร่วมกับความก้าวหน้าในพื้นที่นี้เป็น
อธิบายไว้ด้านล่าง ดังนั้น เราขอเชิญให้ข้อเสนอแนะเกี่ยวกับวิธีการวิเคราะห์ข้อมูล เช่น ถ้าปัจจุบันมีข้อจำกัดบางค้นหาวิธี
นี้ท่วมท้น กระดาษเงิน ดังนี้ แรกในมาตรา 2 ที่เราอธิบายชุดข้อมูลที่สำคัญที่เราติดตั้งและ
แรกวิเคราะห์ที่เรียกว่า fhs สุทธิ แม้ว่าเราจะอธิบาย fhs สุทธิในรายละเอียด
การแปล กรุณารอสักครู่..