2. PROBLEM DEFINITION AND MOTIVATION
With regard to medical data, cloud computing is a promising solution and has many attractive features [2]. First the pay-as-you-go model and maintenance (insured by cloud provider) can lead to reduce the total cost of storing medical files. Then, elasticity ensures a good response time for retrieving medical data even at peak periods, by offering the ability of scaling the system up/out or scaling it downward when needed. Finally, data replication and distribution over geographically separated areas can increase fault tolerance, insuring in particular availability of critical data.
Cloud-enabled data management systems can be classed purposefully into: row-oriented store such as Amazon RDS, SQL Azure, Pig [19], Hive [25], and Jaql [8]; and column-oriented stores such as Bigtable [9], SimpleDB [4] and Megastore [6]. These systems do not provide an efficient solution for the heterogeneity and/or expressiveness issues. For example, in Pig we can either store all the 3000 attributes in the same file (flat), in this case we will have a huge number of null values, leading to poor performance; or we apply a good normalization (getting multiple files). In pig, outer joins are two-ways; therefore to reconstruct a DICOM file we need to apply hundreds of two-way joins with the philosophy adopted by Pig: optimize it yourself! BigTable doesn’t support joins and is not designed for ad-hoc queries. Recently new service (BigQuery) has been proposed to enable ad-hoc query over such systems.
In the following subsections we present the challenging characteristics of DICOM files, we then discuss the pertinence of existing storage management systems; we conclude this section by presenting the motivation of our research.
2 . การนิยามปัญหาและแรงจูงใจ
เกี่ยวกับข้อมูลทางการแพทย์ , คอมพิวเตอร์เมฆเป็นโซลูชั่นที่สดใสและมีหลายคุณสมบัติที่น่าสนใจ [ 2 ] แรกที่คุณไปชำระเงินรูปแบบและการบำรุงรักษา ( ผู้ประกันตนโดยผู้ให้บริการเมฆ ) สามารถนำไปสู่การลดต้นทุนรวมของการจัดเก็บไฟล์แพทย์ แล้วให้เวลาตอบสนองความยืดหยุ่นที่ดีสำหรับสืบค้นข้อมูลทางการแพทย์แม้ในช่วงเวลาสูงสุดโดยมีความสามารถในการปรับระบบขึ้น / ออก หรือปรับลดลงเมื่อจำเป็น ในที่สุด , การกระจายทางภูมิศาสตร์และข้อมูลผ่านแยกพื้นที่สามารถเพิ่มความอดทนความผิด , ประกันพร้อมใช้งานเฉพาะของข้อมูลที่สำคัญ .
เมฆเปิดระบบการจัดการข้อมูลสามารถ classed เป็นเป็น : แถวร้านที่มุ่งเน้นเช่น Amazon RDS , SQL Azure , หมู [ 19 ] , รังผึ้ง [ 25 ]และ jaql [ 8 ] ; คอลัมน์ที่มุ่งเน้นและร้านค้ามากมาย อาทิ bigtable [ 9 ] , [ 4 ] และ simpledb Megastore [ 6 ] ระบบเหล่านี้ไม่ได้ให้โซลูชั่นที่มีประสิทธิภาพสำหรับสามารถและ / หรือปัญหาลึกซึ้ง . ตัวอย่างเช่น ในหมู เราสามารถเก็บทั้งหมด 3000 คุณสมบัติในไฟล์เดียวกัน ( แบน ) , ในกรณีนี้เราจะมีตัวเลขขนาดใหญ่ของค่า null ที่นำไปสู่การปฏิบัติไม่ดีหรือเราใช้เป็นปกติดี ( รับหลายไฟล์ ) ในหมู รวมด้านนอกมี 2 วิธี ดังนั้นเพื่อสร้าง DICOM ไฟล์เราต้องใช้หลายร้อยรวมสองทางกับปรัชญาเลี้ยงหมู : เพิ่มประสิทธิภาพของตัวคุณเอง ไม่สนับสนุน bigtable เข้าร่วมและไม่ได้ถูกออกแบบสำหรับ Ad - hoc แบบสอบถาม บริการใหม่ล่าสุด ( bigquery ) ได้รับการเสนอเพื่อเปิดใช้งานแบบสอบถามของผ่านระบบดังกล่าว .
ในส่วนย่อยที่เรานำเสนอที่ท้าทายคุณลักษณะของแฟ้ม DICOM ดังนี้ เราจึงกล่าวถึงความเกี่ยวข้องของจัดเก็บที่มีอยู่ระบบการจัดการ ; เราสรุปในส่วนนี้ โดยการนำเสนอแรงจูงใจในการวิจัยของเรา
การแปล กรุณารอสักครู่..