Big data has significantly changed
the data management landscape
and has an impact way beyond the
technology sector. Here, I tried to
shed some light on the area and
how it’s perceived in the database
research community. Unfortunately, I
could only provide a brief overview
with a strong focus on the two most
famous types of systems, key-value
stores and MapReduce systems. In
future columns, I’ll expand on other
systems and talk about more recent
advances, such as better support for
machine learning and how to integrate
humans in the discovery process.
References
1. D. DeWitt et al., “MapReduce: A Major
Step Backwards,” The Database Column,
blog, 2008; http://homes.cs.washington
.edu/~billhowe/mapreduce_a_major_
step_backwards.html.
2. J.C. Corbett et al., “Spanner: Google’s
Globally-Distributed Database,” Proc. 10th
Usenix Symp. Operating System Design
and Implementation (OSDI 12), Usenix
Assoc., 2012.
3. C. Mohan et al., “ARIES: A Transaction
Recovery Method Supporting FineGranularity
Locking and Partial Rollbacks
using Write-Ahead Logging,” ACM
Trans. Database Systems (TODS), vol. 17,
no. 1, 1992, pp. 94–162; www.almaden
.ibm.com/u/mohan/ARIES_Impact.html.
Tim Kraska is an assistant professor in the
Computer Science Department at Brown
University. His research focuses on big
data management and hybrid humanmachine
database systems. Kraska has
a PhD from ETH Zurich in Switzerland.
Contact him at kraskat@cs.brown.edu.
ข้อมูลขนาดใหญ่ที่มีการเปลี่ยนแปลงอย่างมีนัยสำคัญภูมิทัศน์การจัดการข้อมูลและมีวิธีที่มีผลกระทบเกินกว่าภาคอุตสาหกรรมเทคโนโลยี ที่นี่ พยายามเปิดพื้นที่ และวิธีรับรู้ในฐานข้อมูลชุมชนการวิจัย เงียบสงบสามารถให้คร่าว ๆ เท่านั้นมีความสำคัญที่สุดสองระบบ มีชื่อเสียงชนิดคีย์ค่าร้านค้าและระบบ MapReduce ในคอลัมน์ในอนาคต ฉันจะขยายอื่น ๆระบบและพูดคุยเกี่ยวกับเพิ่มเติมล่าสุดความก้าวหน้า เช่นการสนับสนุนดีกว่าเรียนรู้ของเครื่องและวิธีการรวมมนุษย์ในกระบวนการค้นหาอ้างอิง1. D. วิทท์ et al., " MapReduce: สำคัญขั้นตอนย้อนหลัง คอลัมน์ของฐานข้อมูลบล็อก 2008 http://homes.cs.washington.edu/~billhowe/mapreduce_a_major_step_backwards.html2. J.C. คอร์เบตต์ et al., "ประแจ: ของ Googleกระจายทั่วโลก "ฐานข้อมูล Proc. 10Usenix Symp ออกแบบระบบปฏิบัติการและการดำเนินงาน (OSDI 12), Usenixรศ 20123. โมฮาน C. et al., "ราศีเมษ: ธุรกรรมFineGranularity การสนับสนุนวิธีการกู้คืนล็อก และบางส่วน Rollbacksใช้เขียนล่วงหน้าการเข้าสู่ระบบ ACMระบบฐานข้อมูลโอนย้าย (TODS), ฉบับ 17หมายเลข 1, 1992, pp. 94-162 www.almaden.ibm.com/u/mohan/ARIES_Impact.htmlทิม Kraska เป็นผู้ช่วยศาสตราจารย์ในการกรมวิทยาศาสตร์คอมพิวเตอร์ที่น้ำตาลมหาวิทยาลัย วิจัยของเขามุ่งเน้นใหญ่ข้อมูลการจัดการและไฮบริ humanmachineระบบฐานข้อมูล มี Kraskaปริญญาเอกจากสถาบันเทคโนโลยีสวิสซูริกในสวิตเซอร์แลนด์ติดต่อเขาที่ kraskat@cs.brown.edu
การแปล กรุณารอสักครู่..
ข้อมูลขนาดใหญ่ที่มีการเปลี่ยนแปลงอย่างมีนัยสำคัญ
ภูมิทัศน์การจัดการข้อมูล
และมีผลกระทบทางเกินกว่า
ภาคอุตสาหกรรมเทคโนโลยี นี่ผมพยายามที่จะ
หลั่งน้ำตาแสงในบางพื้นที่และ
วิธีการที่จะรับรู้ในฐานข้อมูล
การวิจัยชุมชน แต่ฉัน
เท่านั้นที่สามารถให้ภาพรวมสั้น ๆ
ที่มีความสำคัญอย่างมากต่อทั้งสองมากที่สุด
ชนิดที่มีชื่อเสียงของระบบค่าคีย์
ร้านค้าและระบบ MapReduce ใน
คอลัมน์ในอนาคตฉันจะขยายตัวอื่น ๆ
ระบบและพูดคุยเกี่ยวกับเมื่อเร็ว ๆ นี้
ความก้าวหน้าเช่นการสนับสนุนที่ดีกว่าสำหรับ
การเรียนรู้เครื่องและวิธีการที่จะบูรณา
มนุษย์ในขั้นตอนการค้นพบ.
อ้างอิง
1 D. DeWitt, et al, "MapReduce: เมเจอร์.
ก้าวถอยหลัง" คอลัมน์ฐานข้อมูล
บล็อก 2008; http: //homes.cs.washington
.edu / ~ billhowe / mapreduce_a_major_
. step_backwards.html
2 JC Corbett et al, "ประแจ: ของ Google.
ฐานข้อมูลทั่วโลกกระจาย" พร 10
Usenix Symp การดำเนินงานการออกแบบระบบ
และการดำเนินงาน (OSDI 12), Usenix
รศ. 2012
3 ค. โมฮัน et al, "ราศีเมษ: การทำธุรกรรม
วิธีการกู้คืนสนับสนุน FineGranularity
ล็อคและ Rollbacks บางส่วน
ใช้เขียนล่วงหน้าล็อก" ACM
ทรานส์ ระบบฐานข้อมูล (Tods) ฉบับ 17
ไม่มี 1 1992, PP 94-162. www.almaden
.ibm.com / u / โมฮัน / ARIES_Impact.html.
ทิม kraska เป็นผู้ช่วยอาจารย์ใน
ภาควิชาวิทยาการคอมพิวเตอร์ที่บราวน์
มหาวิทยาลัย งานวิจัยของเขาใหญ่มุ่งเน้นไปที่
การจัดการข้อมูลและไฮบริด humanmachine
ระบบฐานข้อมูล kraska มี
ปริญญาเอกจากผลประโยชน์ทับซ้อนในซูริกวิตเซอร์แลนด์.
ติดต่อเขาได้ที่ kraskat@cs.brown.edu
การแปล กรุณารอสักครู่..
ข้อมูลเปลี่ยนแปลงไปมากใหญ่การจัดการข้อมูล ภูมิและมีผลกระทบต่อวิธีที่เกินภาคเทคโนโลยี นี่ ฉันพยายามหลั่งบางแสงในพื้นที่ และมันคือการรับรู้ในฐานข้อมูลชุมชนวิจัย แต่น่าเสียดายที่ฉันจะสามารถให้ภาพรวมสั้น ๆโดยเน้นที่ 2 มากที่สุดประเภทที่มีชื่อเสียงของระบบ , ค่าคีย์ร้านค้า และระบบ mapreduce . ในคอลัมน์ในอนาคต ผมจะขยายอื่น ๆระบบและพูดคุยเกี่ยวกับรุ่นล่าสุดหน้า เช่นดีสนับสนุนการเรียนรู้ของเครื่องและวิธีการรวมมนุษย์ในกระบวนการค้นพบอ้างอิง1 . D . DeWitt et al . , " mapreduce : เป็นหลักก้าวถอยหลัง " คอลัมน์ฐานข้อมูลบล็อก , 2008 ; http://homes.cs.washington. edu / ~ billhowe / mapreduce_a_major_step_backwards.html .2 . J.C . Corbett et al . , " ประแจ : Googleสำหรับฐานข้อมูลแบบกระจาย " proc . ครั้งที่ 10usenix บ้าง . การออกแบบระบบปฏิบัติการและการดำเนินงาน ( osdi 12 ) usenixหัวข้อ , 20123 . C . Mohan et al . , " ราศีเมษ : รายการวิธีการกู้คืนสนับสนุน finegranularityล็อคและ rollbacks บางส่วนใช้เขียนก่อนการเข้าสู่ระบบ " โดยทรานส์ . ระบบฐานข้อมูล ( tods ) , เล่มที่ 17 ,1 , 1992 , pp . 94 และ www.almaden 162 ;. ibm.com/u/mohan/aries_impact.html .ทิม kraska เป็นผู้ช่วยศาสตราจารย์ในกรมวิทยาศาสตร์คอมพิวเตอร์ที่ บราวน์มหาวิทยาลัย งานวิจัยของเขาเน้นใหญ่การจัดการข้อมูลและ humanmachine ลูกผสมระบบฐานข้อมูล kraska ได้ปริญญาเอกจากซูริคในสวิตเซอร์แลนด์ติดต่อเขา kraskat@cs.brown.edu .
การแปล กรุณารอสักครู่..