Today, social-network research involves mining huge digital data sets of collective behavior online. Among the findings: people whom you know but don’t communicate with often — “weak ties,” in sociology — are the best sources of tips about job openings. They travel in slightly different social worlds than close friends, so they see opportunities you and your best friends do not.
Researchers can see patterns of influence and peaks in communication on a subject — by following trending hashtags on Twitter, for example. The online fishbowl is a window into the real-time behavior of huge numbers of people. “I look for hot spots in the data, an outbreak of activity that I need to understand,” says Jon Kleinberg, a professor at Cornell. “It’s something you can only do with Big Data.”
Big Data has its perils, to be sure. With huge data sets and fine-grained measurement, statisticians and computer scientists note, there is increased risk of “false discoveries.” The trouble with seeking a meaningful needle in massive haystacks of data, says Trevor Hastie, a statistics professor at Stanford, is that “many bits of straw look like needles.”Big Data also supplies more raw material for statistical shenanigans and biased fact-finding excursions. It offers a high-tech twist on an old trick: I know the facts, now let’s find ’em. That is, says Rebecca Goldin, a mathematician at George Mason University, “one of the most pernicious uses of data.”
Data is tamed and understood using computer and mathematical models. These models, like metaphors in literature, are explanatory simplifications. They are useful for understanding, but they have their limits. A model might spot a correlation and draw a statistical inference that is unfair or discriminatory, based on online searches, affecting the products, bank loans and health insurance a person is offered, privacy advocates warn.
วันนี้ งานวิจัยสังคมเครือข่ายเกี่ยวข้องกับเหมืองใหญ่ดิจิทัลข้อมูลชุดรวมลักษณะการทำงานออนไลน์ ระหว่างผลการวิจัย: คนที่คุณรู้ แต่ไม่สื่อสารกับมัก — "อ่อนแอผูก ในสังคมวิทยาซึ่งเป็นแหล่งดีที่สุดของคำแนะนำเกี่ยวกับงานเปิด เดินทางในโลกทางสังคมแตกต่างกันเล็กน้อยกว่าเพื่อนสนิท เพื่อให้พวกเขาเห็นโอกาสที่คุณและเพื่อนที่ดีที่สุดไม่นักวิจัยสามารถดูรูปแบบของอิทธิพลและยอดในการสื่อสารในเรื่อง — โดย trending hashtags ในทวิตเตอร์ ตัวอย่าง Fishbowl ออนไลน์เป็นหน้าต่างเป็นลักษณะการทำงานแบบเรียลไทม์ของจำนวนคนมาก "ฉันค้นหาข้อมูล การระบาดของกิจกรรมที่ต้องทำความเข้าใจ จุดร้อน" Jon Kleinberg อาจารย์ที่ Cornell ที่กล่าวว่า "มันเป็นสิ่งที่คุณเท่านั้นสามารถทำได้กับข้อมูลขนาดใหญ่"ข้อมูลขนาดใหญ่ได้เป็นภัย เพื่อให้แน่ใจ กับชุดข้อมูลขนาดใหญ่ และวัดทรายแป้งละเอียด statisticians และคอมพิวเตอร์นักวิทยาศาสตร์สังเกต มีความเสี่ยงเพิ่มขึ้น "เท็จค้นพบ" ปัญหากับการหาเข็มในเกรดอาวุธขนาดใหญ่ของข้อมูล ความหมายว่า เทรเวอร์ Hastie อาจารย์สถิติที่สแตนฟอร์ด เป็นที่ "บิตมากมองฟางชอบเข็ม"ข้อมูลขนาดใหญ่วัสดุวัตถุดิบเพิ่มเติมประเภททางสถิติและทัศนศึกษา fact-finding biased ยัง มีบิดสูงบนเป็นเทคนิคเก่า: ฉันรู้ว่าข้อเท็จจริง ตอนนี้ลองค้นหา 'em กล่าวคือ รีเบคก้า Goldin เป็นนักคณิตศาสตร์ที่มหาวิทยาลัยจอร์จ Mason "หนึ่งของโทษที่สุดใช้ข้อมูล"Data is tamed and understood using computer and mathematical models. These models, like metaphors in literature, are explanatory simplifications. They are useful for understanding, but they have their limits. A model might spot a correlation and draw a statistical inference that is unfair or discriminatory, based on online searches, affecting the products, bank loans and health insurance a person is offered, privacy advocates warn.
การแปล กรุณารอสักครู่..