small number of parity updates were generated. For a fair
comparison, we built a trace-based experimental environment.
While running real world applications, we first collected I/O
traces that included timestamps, request types, logical addresses,
actual data contents, and so on. Using this information,
we constructed real block I/O requests and sent them to the
Linux’s MD layer. This experimental setup allowed us to
repeat exactly the same workloads under different RAID setups
(e.g., Diff-RAID and DA-RAID). While replaying I/O traces,
we measured important performance numbers that included the
amount of written data, deduplication ratios, and request sizes.
We used six different I/O traces for the evaluations. Three
production system traces, web, homes and mail were from
the FIU [14]. All of them included actual data. Three inhouse
traces, PC, Package, and KV traces were collected
while running real-world applications. PC was a desktop PC
workload such as a web surfing, emailing, and document
editing, whereas Package captured all of the I/O activities
while downloading and installing software packages. KV was a
key-value store workload that was collected from YCSB [16]
running on top of Cassandra [6]. We modified YCSB so that
it wrote data with a specific deduplication ratio (e.g., 25%
or 50%). The detailed configuration for data generation is described
in Section IV-D. Table I summarizes the characteristics
of the I/O traces such as amount of writes, average sequential
write request size, the ratios of sequential write requests and
duplicated data.
จำนวนเล็ก ๆของความเท่าเทียมกันปรับปรุงได้ถูกสร้างขึ้น สำหรับ แฟร์การเปรียบเทียบ เราสร้างติดตามสิ่งแวดล้อม ทดลองใช้ขณะใช้งานจริง เราใช้ I / O ก่อนร่องรอยที่รวมเวลาประทับ ขอประเภทที่อยู่ตรรกะข้อมูลที่แท้จริง และ การใช้ข้อมูลนี้เราสร้างจริงบล็อกการร้องขอ I / O และส่งพวกเขาไปลินุกซ์เป็น MD ของเลเยอร์ การตั้งค่านี้อนุญาติให้เราทดลองย้ำว่างานเดียวกันภายใต้การตั้งค่า RAID ที่แตกต่างกัน( เช่น RAID Diff และ da-raid ) ในขณะที่ทบทวน I / O ร่องรอยเราวัดประสิทธิภาพที่สำคัญ ได้แก่ ตัวเลขปริมาณของข้อมูลที่เขียนอัตราส่วนดังกล่าว และขอขนาดเราใช้หกที่แตกต่างกันมี I / O สำหรับการประเมิน . สามระบบผลิตร่องรอย , เว็บ , บ้านและจดหมายจากไข้ธรรมดา [ 14 ] ทั้งหมดของพวกเขามีวัตถุประสงค์ที่แท้จริง ห้องสามร่องรอย , PC , แพคเกจและร่องรอย KV ศึกษาในขณะที่ใช้งานจริง . PC เป็นคอมพิวเตอร์ตั้งโต๊ะภาระงานเช่นการท่องเว็บ , อีเมล์ , และเอกสารการแก้ไข ในขณะที่แพคเกจจับทุกกิจกรรม I / Oในขณะที่การดาวน์โหลดและการติดตั้งแพคเกจซอฟต์แวร์ โครงการ คือค่าคีย์เก็บงานที่รวบรวมจาก ycsb [ 16 ]วิ่งบน Cassandra [ 6 ] เราแก้ไข ycsb ดังนั้นมันเขียนข้อมูลด้วยอัตราส่วนที่เฉพาะเจาะจง ( เช่น 25 % ผลิตภัณฑ์หรือ 50 % ) ตั้งค่ารายละเอียดสำหรับสร้างข้อมูลอธิบายในส่วน iv-d. ตารางที่ผมสรุปคุณลักษณะของ I / O ร่องรอยเช่นจํานวนเขียนแบบเฉลี่ยเขียนขนาดขอ อัตราส่วนของการร้องขอและแบบเขียนคัดลอกข้อมูล
การแปล กรุณารอสักครู่..
