14
Enterprise
distributed
databases
901
transaction record are selected from 50,000, 100,000, 150,000 and 200,000 at each client
site for these two tests in order to compare the average refresh times between the use of
the latent transactional consistency in the replication functions provided by SQL
Server and the database refresh model proposed in this research. The results of the test,
in terms of total execution time versus different numbers of transaction records, are
shown in Table II.
As we can observe from Table II, the results show that the total execution time of
MS SQL Server is better than our research model when records are less than 100,000.
However, when records are more than 100,000, our model shows a better execution
time than that of MS SQL Server. Nevertheless, there are no significant differences
between MS SQL Server replication and the methods developed by our research model.
In our research model, the process of data collection of bureaus’ transactions is
triggered remotely by the central refresh module. The transactions are transferred and
stored in standardized XML format in order that they can have high transportability
over different database platforms. Therefore, during central database refreshment, the
refresh module also has to interpret each transaction record retrieved in XML format
from the transaction log files before it can be used for database refreshment. Therefore,
in comparison with SQL Server replication, the logic of our research model is
apparently more complicated but actually more open and transportable. Although, the
execution time of our research model appears worse than that of SQL Server replication
when the number of records is low, however our research model shows better results
when the number is over a certain threshold such as around the number of 150,000.
7. Conclusions
We presented a feasible data framework and database refresh model to effectively
support the distributed databases aggregation for the national immunization
information system of Taiwan. The data refresh model is designed for this
implementation based on the assumption that the database management systems used
to implement the central database and each of distributed databases are different.
A latent transactional consistency algorithm is applied for implementing the refresh
system because the immediate synchronization between the central database and
distributed databases are not required in NIIS. The transaction data for database
refreshment are formatted in XML standardized files stored in the log files at local and
central sites and for exchange between two sites during the database refreshment. The
refreshment is periodically activated by the refresh module installed at the central site.
Another type of refresh module is installed at each bureau site which is triggered by
Methods
No. of records
Latent transactional
consistency of MS SQL Server
(unit: seconds)
Refresh methods of
this research
(unit: seconds)
50,000 2:96 3:41
100,000 4:15 4:30
150,000 5:10 5:04
200,000 6:16 5:93
Table II.
Comparisons in total
execution times (seconds)
vs different record
numbers
15
JMTM
18,7
902
the refresh module at central site. Whenever a bureau’s refresh module is triggered to
conduct the refreshment, the transaction records logged in bureau’s log file are
collected and loaded into the central log file. The collection is done by a specially
designed data transformation service which includes the activities of the extraction of
each transaction record from a bureau’s log file, the transfer of the transaction record
from each bureau site to the central site over the health information network, and then
the loading of the transaction record into the central log file. The mechanism of
timestamp is also applied to effectively control the transactional retrieval from two log
files at both sites and maintain the contents of both log files.
Although, this data system model is uniquely designed for NIIS’s databases
aggregation of Taiwan, we believe it may be applied to other similar implementations
without difficulty because the algorithm we proposed is not restricted to a specific
database management system and a standardized XML message for transaction
exchange is applied. However, the effectiveness of a database refresh model for
distributed databases not only depends upon the design of refresh algorithm, but it
also depends upon the performance of computer networks and the reliability of
information technologies employed to support this implementation and its later
operations. The reliability of this data system model has not been widely verified yet,
therefore, as a manager of NIIS database, these issues have to be overcome to assure
the performance, reliability, and feasibility of this system implementation before it is
widely deployed.
References
Adiba, M. and Lindsay, B. (1980), “Database snapshots”, Proceedings 6th International
Conference on Very Large Databases, Montreal, Canada, pp. 86-91.
Amoroso, D., Atkinson, J. and Secor, S. (1993), “A study of the data management construct:
design, construction, and utilization”, System Science, Vol. 4, pp. 490-9.
Anzbock, R. and Dustdar, S. (2005), “Modeling and implementing medical web services”, Data &
Knowledge Engineering, Vol. 55, pp. 203-36.
Brazhnik, O. (2007), “Databases and the geometry of knowledge”, Data & Knowledge
Engineering, Vol. 61 No. 2, pp. 207-27.
Chiu, R. and Boe, W. (1995), “An efficient refresh mechanism for distributed views: analytic
modeling and cost analysis”, MIS Review, p. 5.
Connolly, T. and Begg, C. (1998), Database Systems: A Practical Approach to Design,
Implementation and Management, 2nd ed., Addison-Wesley, Reading, MA.
Franklin, M., Carey, M. and Livny, M. (1997), “Transactional client-server cache consistency:
alternatives and performance”, ACM Transactions on Database Systems, Vol. 22 No. 3,
pp. 315-63.
Gamal-Eldin, M., Thomas, G. and Elmasri, R. (1988), “Integrating relational databases with
support for updates”, Proceedings of International Symposium on Databases in Parallel and
Distributed Systems, Austin, TX, pp. 202-9.
Lenz, R. and Reichert, M. (2007), “IT support for healthcare processes – premises, challenges,
perspectives”, Data & Knowledge Engineering, Vol. 61 No. 1, pp. 39-58.
Lindsay, B., Haas, L., Mohan, C., Pirahesh, H. and Wilms, P. (1986), “A snapshot differential
refresh algorithm”, ACM Proceedings SIGMOD, Vol. 15 No. 2, pp. 53-60.
This article has been cited by:
1. Ji Lu, Tao LiComputation Process Evolution 1-6. [CrossRef]
14องค์กรกระจายฐานข้อมูล901เลือกเรกคอร์ดธุรกรรมจาก 50000, 100000, 150, 000 และ 200000 ที่ลูกค้าแต่ละรายเว็บไซต์สำหรับทดสอบสองเหล่านี้สามารถเปรียบเทียบเวลาฟื้นฟูเฉลี่ยระหว่างการใช้ความสอดคล้องที่ทรานแซคชันที่แฝงอยู่ในฟังก์ชันจำลองโดย SQLเซิร์ฟเวอร์และฐานข้อมูลการฟื้นฟูรูปแบบที่นำเสนอในงานวิจัยนี้ ผลลัพธ์ของการทดสอบในเวลาดำเนินการรวมกับตัวเลขที่แตกต่างกันของเรกคอร์ดธุรกรรม มีแสดงในตารางที่สองเราสามารถสังเกตจากตาราง II ผลลัพธ์แสดงว่าเวลาดำเนินการทั้งหมดของMS SQL Server จะดีกว่ารูปแบบการวิจัยของเราเมื่อระเบียนไม่น้อยกว่า 100000อย่างไรก็ตาม เมื่อระเบียน มากกว่า 100000 รุ่นของเราแสดงการดำเนินการที่ดีกว่าเวลากว่าของ MS SQL Server อย่างไรก็ตาม มีไม่แตกต่างกันระหว่าง MS SQL Server จำลองแบบและวิธีการพัฒนา โดยใช้แบบจำลองการวิจัยของเราในรูปแบบของการวิจัย กระบวนการในการเก็บรวบรวมข้อมูลของ bureaus ธุรกรรมเป็นทริกเกอร์จากระยะไกล โดยโมรีเฟรชกลาง ธุรกรรมจะถูกโอนย้าย และจัดเก็บในรูปแบบ XML มาตรฐานเพื่อให้พวกเขาสามารถมี transportability สูงผ่านระบบฐานข้อมูลอื่น ในระหว่างที่เครื่องฐานข้อมูลกลาง ดังนั้น การโมดูลฟื้นฟูมีการแปลแต่ละเรกคอร์ดธุรกรรมที่เรียกใช้ในรูปแบบ XMLจากแฟ้มล็อกธุรกรรมก่อนที่จะใช้สำหรับฐานข้อมูลเครื่องดื่ม ดังนั้นเมื่อเปรียบเทียบกับการจำลองแบบ SQL Server เป็นตรรกะของแบบจำลองการวิจัยของเราเห็นได้ชัดมากขึ้นซับซ้อน แต่จริงมากเปิด ก transportable ถึงแม้ว่า การเวลาดำเนินการของรูปแบบการวิจัยของเราแสดงแย่กว่าที่จำลองแบบ SQL Serverเมื่อจำนวนของระเบียนที่อยู่ในระดับต่ำ อย่างไรก็ตามแบบจำลองการวิจัยของเราแสดงผลลัพธ์ที่ดีขึ้นเมื่อตัวเลขไม่เกินกำหนดขีดจำกัดเช่นจากจำนวน 150, 0007. บทสรุปเรานำเสนอเป็นไปได้กรอบและฐานข้อมูลการฟื้นฟูแบบไปได้อย่างมีประสิทธิภาพสนับสนุนการรวมฐานข้อมูลแบบกระจายการรับวัคซีนแห่งชาติระบบข้อมูลของไต้หวัน รูปแบบการฟื้นฟูข้อมูลถูกออกแบบมานี้ตามสมมุติฐานที่ว่าระบบการจัดการฐานข้อมูลใช้งานการใช้ ฐานข้อมูลกลางและแต่ละฐานข้อมูลแบบกระจายแตกต่างกันมีใช้อัลกอริทึมมีความสอดคล้องของทรานแซคชันที่แฝงอยู่ในการดำเนินการฟื้นฟูระบบเนื่องจากการซิงโครไนซ์ทันทีระหว่างฐานข้อมูลกลาง และไม่ต้องใช้ฐานข้อมูลแบบกระจายใน NIIS ข้อมูลธุรกรรมสำหรับฐานข้อมูลเครื่องดื่มเป็นรูปแบบแฟ้ม XML มาตรฐานที่เก็บไว้ในแฟ้มบันทึกในท้องถิ่น และอเมริกากลางและ การแลกเปลี่ยนระหว่าง 2 ไซต์ระหว่างเครื่องฐานข้อมูล ที่เครื่องดื่มมีการเรียกใช้เป็นระยะ ๆ โดยโมรีเฟรชที่ติดตั้งที่ไซต์ส่วนกลางมีการติดตั้งโมดูลฟื้นฟูชนิดอื่นที่แต่ละสำนักซึ่งทริกเกอร์โดยMethodsNo. of recordsLatent transactionalconsistency of MS SQL Server(unit: seconds)Refresh methods ofthis research(unit: seconds)50,000 2:96 3:41100,000 4:15 4:30150,000 5:10 5:04200,000 6:16 5:93Table II.Comparisons in totalexecution times (seconds)vs different recordnumbers15JMTM18,7902the refresh module at central site. Whenever a bureau’s refresh module is triggered toconduct the refreshment, the transaction records logged in bureau’s log file arecollected and loaded into the central log file. The collection is done by a speciallydesigned data transformation service which includes the activities of the extraction ofeach transaction record from a bureau’s log file, the transfer of the transaction recordfrom each bureau site to the central site over the health information network, and thenthe loading of the transaction record into the central log file. The mechanism oftimestamp is also applied to effectively control the transactional retrieval from two logfiles at both sites and maintain the contents of both log files.Although, this data system model is uniquely designed for NIIS’s databasesaggregation of Taiwan, we believe it may be applied to other similar implementationswithout difficulty because the algorithm we proposed is not restricted to a specificdatabase management system and a standardized XML message for transactionexchange is applied. However, the effectiveness of a database refresh model fordistributed databases not only depends upon the design of refresh algorithm, but italso depends upon the performance of computer networks and the reliability ofinformation technologies employed to support this implementation and its lateroperations. The reliability of this data system model has not been widely verified yet,therefore, as a manager of NIIS database, these issues have to be overcome to assurethe performance, reliability, and feasibility of this system implementation before it iswidely deployed.ReferencesAdiba, M. and Lindsay, B. (1980), “Database snapshots”, Proceedings 6th InternationalConference on Very Large Databases, Montreal, Canada, pp. 86-91.Amoroso, D., Atkinson, J. and Secor, S. (1993), “A study of the data management construct:design, construction, and utilization”, System Science, Vol. 4, pp. 490-9.Anzbock, R. and Dustdar, S. (2005), “Modeling and implementing medical web services”, Data &Knowledge Engineering, Vol. 55, pp. 203-36.Brazhnik, O. (2007), “Databases and the geometry of knowledge”, Data & KnowledgeEngineering, Vol. 61 No. 2, pp. 207-27.Chiu, R. and Boe, W. (1995), “An efficient refresh mechanism for distributed views: analyticmodeling and cost analysis”, MIS Review, p. 5.Connolly, T. and Begg, C. (1998), Database Systems: A Practical Approach to Design,Implementation and Management, 2nd ed., Addison-Wesley, Reading, MA.Franklin, M., Carey, M. and Livny, M. (1997), “Transactional client-server cache consistency:alternatives and performance”, ACM Transactions on Database Systems, Vol. 22 No. 3,pp. 315-63.Gamal-Eldin, M., Thomas, G. and Elmasri, R. (1988), “Integrating relational databases withsupport for updates”, Proceedings of International Symposium on Databases in Parallel andDistributed Systems, Austin, TX, pp. 202-9.Lenz, R. and Reichert, M. (2007), “IT support for healthcare processes – premises, challenges,perspectives”, Data & Knowledge Engineering, Vol. 61 No. 1, pp. 39-58.Lindsay, B., Haas, L., Mohan, C., Pirahesh, H. and Wilms, P. (1986), “A snapshot differentialrefresh algorithm”, ACM Proceedings SIGMOD, Vol. 15 No. 2, pp. 53-60.This article has been cited by:1. Ji Lu, Tao LiComputation Process Evolution 1-6. [CrossRef]
การแปล กรุณารอสักครู่..
