Existing SolutionsPast solutions to

Existing Solutions
Past solutions to data-quality problems were driven
in part by the economics of the institutions
having the problem. Traditionally, the demand for
data-quality solutions was driven by very large
organizations, such as Global 2000 corporations.
They had the resources to deploy complex software
system for gathering data, and they were the
first to notice and suffer from the inevitable dataquality
problems resulting from this complexity.
Accordingly, the approaches developed by the
information technology researchers pioneering
the area of data quality (Lee et al. 2006) tended to
emphasize statistical data assessment, business
process engineering, and comprehensive organizational
data-assurance policies. Given their size, the
early data-quality customers had the resources to
adopt these labor-intensive and therefore expensive
solutions. The traditional data-quality solutions
tended to rely heavily on manual operations,
in two different respects.
First, data was often hand-cleansed by contracting
with external staffing agencies. Business analysts
would first identify what type of data-quality
work needed to be performed and on which data.
Large data sets would be broken up into reasonable
sizes and put into spreadsheets. This data would be
distributed to individuals along with instructions
for cleansing. After the manual work on a spreadsheet
was finished oftentimes the work could be
cross-checked by another worker and any discrepancies
investigated. Once the data was finished it
was reassembled into the appropriate format for
loading back into the source IT system. Such manual
effort has clear drawbacks, including the time
required to cycle through the entire process, the
possibility for manual error, and the need to export
and then import the final results. Exporting is usually
fairly easy. The importing is almost always the
bigger issue. Import logic typically needs to identify
not only which specific fields and records to
update, but also how to deal with deleted or
merged data, and how to accomplish this all without
introducing new errors. Another issue is that
additional work is required to build and thoroughly
test the import tools. Finally, the entire manual
process has little room for increased return on
investment. The customer has to pay for the manual
work each time data is cleansed, meaning that
the economic benefits of automation are not realized.
Second, earlier data-quality vendors provided
technological solutions to data-quality problems,
and these required significant manual setup. The
reasons for the manual setup included business
analysis to understand data-quality needs of the
organization, identification of the final data-quality
work flow, and then the actual programming
and configuration to put the data-quality solution
in place. In other words, these companies were
building custom data-quality solutions using dataquality
vendor application programming interfaces
(APIs). Once the solution was put in place,
automation reduced the manual effort, so a longer
horizon for return on investment was acceptable.
These solutions worked fine for large companies
that could afford both the problem, initial enterprise
system that aggregates the data, and the solutions.
Today, sophisticated business applications
are being used by even the smallest organizations;
hence, the manual effort associated with data quality
must be in alignment with the resources of
these smaller organizations. The data-quality solutions
must leverage automation and, at the same
time, provide the business user with intuitive
access to the processing results and the ability to
override the results.
Data-quality research has also seen significant
progress with the first issue of the new ACM Journal
of Data and Information Quality published in
2009. Frameworks for researching data quality
have been introduced (Madnick 2009, Wang 1995)
as well as specific mathematical models for
addressing the record linkage problem (Fellegi and
Sunter 1969). Recent research in record linkage
includes the development and deployment of
more intelligent linkage algorithms (Moustakides
and Verykios 2009, Winkler 2006). Data linkage is
a core issue in many data-cleansing operations and
is the process of identifying whether two separate
records refer to the same entity. Linkage can be
used for both identifying duplicate records in a
database as well as identifying similar records
across disparate data sets.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

โซลูชั่นที่มีอยู่แก้ไขปัญหาคุณภาพข้อมูลมาถูกขับเคลื่อนบางส่วน โดยเศรษฐศาสตร์ของสถาบันที่มีปัญหา ประเพณี ความต้องการข้อมูลคุณภาพถูกขับเคลื่อนโดยมีขนาดใหญ่มากองค์กร เช่นบริษัทโกลบอล 2000มีทรัพยากรการปรับใช้ซอฟต์แวร์ที่ซับซ้อนระบบสำหรับการรวบรวมข้อมูล และพวกแรกจะสังเกตเห็น และประสบการ dataquality หลีกเลี่ยงไม่ได้ปัญหาที่เกิดจากความซับซ้อนตามลำดับ แนวทางการพัฒนาโดยการข้อมูลนักวิจัยเทคโนโลยีบุกเบิกพื้นที่ของคุณภาพข้อมูล (Lee et al. 2006) มีแนวโน้มที่จะเน้นการประเมินข้อมูลทางสถิติ ธุรกิจกระบวนการวิศวกรรม และองค์กรครบวงจรรับรองข้อมูลนโยบายการ กำหนดขนาด การลูกค้าคุณภาพข้อมูลก่อนมีทรัพยากรนำมาใช้เหล่านี้ labor-intensive และมีราคาแพงดังนั้นการแก้ไขปัญหา โซลูชั่นคุณภาพข้อมูลดั้งเดิมมีแนวโน้มมากพึ่งดำเนินการด้วยตนเองสองประการแตกต่างกันครั้งแรก ข้อมูลมักจะมีมือชำระตามสัญญากับหน่วยงานภายนอกพนักงาน นักวิเคราะห์ธุรกิจก่อนจะระบุชนิดของคุณภาพข้อมูลงานที่จำเป็นในการดำเนินการและข้อมูลที่ชุดข้อมูลขนาดใหญ่จะแบ่งเป็นค่าเหมาะสมขนาดและวางลงในกระดาษคำนวณ ข้อมูลนี้จะแจกจ่ายไปยังบุคคลพร้อมคำแนะนำสำหรับทำความสะอาด หลังจากทำงานด้วยตนเองบนกระดาษคำนวณถูกเสร็จแล้วอาจเกิดการทำงานอาจจะตรวจสอบระหว่างผู้ปฏิบัติงานอื่นและความขัดแย้งตรวจสอบ เมื่อข้อมูลเสร็จมันที่ตกในรูปแบบที่เหมาะสมสำหรับโหลดไว้ต้นเรื่องระบบ คู่มือดังกล่าวข้อเสียชัดเจน รวมถึงเวลามีความพยายามต้องวนกระบวนการทั้งหมด การความเป็นไปได้สำหรับข้อผิดพลาดด้วยตนเอง และจำเป็นในการส่งออกและนำเข้าผลสุดท้ายแล้ว การส่งออกเป็นปกติค่อนข้างง่าย การนำเข้าอยู่เกือบตลอดเวลาปัญหาใหญ่ นำตรรกะโดยทั่วไปจะต้องระบุไม่ เพียงเฉพาะที่เขตข้อมูล และระเบียนการปรับปรุง แต่วิธีการจัดการกับการลบ หรือรวมข้อมูล และวิธีการทำทั้งหมดนี้ไม่มีแนะนำข้อผิดพลาดใหม่ อีกประเด็นคืองานเพิ่มเติมจะต้องสร้างแล้วทดสอบเครื่องมือนำเข้า สุดท้าย คู่มือทั้งหมดกระบวนการมีห้องน้อยกลับเพิ่มขึ้นลงทุน ลูกค้ามีการชำระค่าจ้างสำหรับคู่มือเวลาแต่ละข้อมูลจะชำระ ทำงานผลประโยชน์ทางเศรษฐกิจของระบบอัตโนมัติจะไม่มีการรับรู้ที่สอง คุณภาพข้อมูลก่อนหน้านี้ผู้ให้แก้ไขปัญหาคุณภาพข้อมูล เทคโนโลยีและเหล่านี้จำเป็นต้องตั้งค่าด้วยตนเองอย่างมีนัยสำคัญ ที่เหตุผลสำหรับการตั้งค่าด้วยตนเองรวมธุรกิจการเข้าใจความต้องการข้อมูลคุณภาพของการองค์กร รหัสสุดท้ายข้อมูลคุณภาพขั้นตอนการทำงาน และการเขียนโปรแกรมจริงและการกำหนดค่าให้การแก้ปัญหาคุณภาพข้อมูลในสถานที่ ในคำอื่น ๆ บริษัทเหล่านี้ได้อาคารโซลูชั่นคุณภาพข้อมูลกำหนดเองที่ใช้ dataqualityผู้แอพลิเคชันเขียนโปรแกรมอินเทอร์เฟซ(Api) เมื่อย้ายที่ การแก้ปัญหาอัตโนมัติลดความพยายามด้วยตนเอง ดังนั้นความยาวขอบฟ้าผลลงทุนยอมรับได้โซลูชั่นเหล่านี้ทำงานดีสำหรับบริษัทขนาดใหญ่ที่สามารถซื้อได้ทั้งปัญหา องค์กรที่เริ่มต้นระบบที่รวมข้อมูล และการแก้โปรแกรมประยุกต์ทางธุรกิจวันนี้ ทันสมัยกำลังถูกใช้ โดยแม้แต่น้อยที่สุดองค์กรดังนั้น ความพยายามด้วยตนเองเกี่ยวข้องกับคุณภาพข้อมูลต้องสอดคล้องกับทรัพยากรขององค์กรขนาดเล็กเหล่านี้ โซลูชั่นคุณภาพข้อมูลต้องใช้ระบบอัตโนมัติและ ที่เดียวกันเวลา ให้ผู้ใช้ทางธุรกิจที่ใช้งานง่ายเข้าถึงประมวลผลและความสามารถในการแทนผลลัพธ์คุณภาพข้อมูลวิจัยได้เห็นสำคัญความคืบหน้ากับของรายพลอากาศใหม่ของข้อมูลและคุณภาพข้อมูลที่เผยแพร่ใน2009. กรอบการวิจัยคุณภาพข้อมูลได้รับการแนะนำ (Madnick 2009, 1995 วัง)และแบบจำลองทางคณิตศาสตร์เฉพาะสำหรับกำหนดปัญหาเชื่อมโยงเรกคอร์ด (Fellegi และSunter 1969) การวิจัยล่าสุดในการเชื่อมโยงระเบียนมีการพัฒนาและการใช้งานอัลกอริทึมความเชื่อมโยงไป (Moustakidesก Verykios 2009, Winkler 2006) เชื่อมโยงข้อมูลเป็นปัญหาหลักในการดำเนินการทำความสะอาดข้อมูลจำนวนมาก และเป็นกระบวนการระบุว่าแยกระเบียนหมายถึงเอนทิตีเดียว สามารถเชื่อมโยงใช้สำหรับเรกคอร์ดที่ซ้ำทั้งระบุในแบบฐานข้อมูลรวมทั้งระบุเรกคอร์ดที่คล้ายกันในชุดข้อมูลที่แตกต่างกัน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

โซลูชั่นที่มีอยู่แก้ปัญหาที่ผ่านมาปัญหาที่มีคุณภาพข้อมูลที่ถูกขับในส่วนของเศรษฐกิจของสถาบันมีปัญหา ตามเนื้อผ้าความต้องการสำหรับโซลูชั่นข้อมูลที่มีคุณภาพถูกผลักดันโดยมีขนาดใหญ่มากองค์กรเช่นGlobal 2000 บริษัท . พวกเขามีทรัพยากรในการปรับใช้ซอฟต์แวร์ที่ซับซ้อนของระบบสำหรับการรวบรวมข้อมูลและพวกเขาเป็นคนแรกที่สังเกตเห็นและทุกข์ทรมานจากdataquality หลีกเลี่ยงไม่ได้ปัญหาที่เป็นผลจากความซับซ้อนนี้. ดังนั้นแนวทางการพัฒนาโดยนักวิจัยด้านเทคโนโลยีสารสนเทศการสำรวจพื้นที่ของข้อมูลที่มีคุณภาพ(Lee et al. 2006) มีแนวโน้มที่จะเน้นการประเมินข้อมูลสถิติธุรกิจวิศวกรรมกระบวนการและองค์กรที่ครอบคลุมนโยบายการประกันข้อมูล ด้วยขนาดของพวกเขาลูกค้าข้อมูลที่มีคุณภาพในช่วงต้นมีทรัพยากรที่จะนำมาใช้เหล่านี้ที่ใช้แรงงานเข้มข้นและดังนั้นจึงมีราคาแพงการแก้ปัญหา โซลูชั่นข้อมูลที่มีคุณภาพแบบดั้งเดิมมีแนวโน้มที่จะต้องพึ่งพาการดำเนินงานด้วยตนเองในสองประการที่แตกต่างกัน. ครั้งแรกข้อมูลมักจะมือทำความสะอาดโดยการทำสัญญากับหน่วยงานของพนักงานภายนอก นักวิเคราะห์ธุรกิจแรกที่จะระบุชนิดของข้อมูลที่มีคุณภาพการทำงานที่จำเป็นจะต้องดำเนินการและที่ข้อมูล. ชุดข้อมูลขนาดใหญ่จะถูกแบ่งออกเป็นที่เหมาะสมขนาดและใส่ลงไปในกระดาษคำนวณ ข้อมูลนี้จะถูกกระจายให้กับประชาชนพร้อมกับคำแนะนำสำหรับการทำความสะอาด หลังจากการทำงานด้วยตนเองในสเปรดชีตที่เสร็จอาจเกิดการทำงานที่อาจจะข้ามการตรวจสอบโดยผู้ปฏิบัติงานอื่นและแตกต่างใดๆการตรวจสอบ เมื่อข้อมูลเสร็จมันถูกประกอบเป็นรูปแบบที่เหมาะสมสำหรับการโหลดกลับเข้ามาของระบบไอที คู่มือดังกล่าวพยายามที่มีข้อบกพร่องที่ชัดเจนรวมทั้งเวลาที่จำเป็นในการวงจรผ่านกระบวนการทั้งหมดที่เป็นไปได้สำหรับข้อผิดพลาดด้วยตนเองและความจำเป็นในการส่งออกและนำเข้าผลสุดท้าย การส่งออกมักจะค่อนข้างง่าย การนำเข้าเกือบเสมอปัญหาที่ใหญ่กว่า ตรรกะนำเข้ามักจะต้องมีการระบุไม่เพียงแต่ที่เฉพาะสาขาและมีการบันทึกการปรับปรุงแต่ยังวิธีการจัดการกับการลบหรือข้อมูลรวมและวิธีการที่จะบรรลุนี้โดยไม่ต้องมีการแนะนำข้อผิดพลาดใหม่ ปัญหาก็คือว่าการทำงานเพิ่มเติมเป็นสิ่งจำเป็นในการสร้างและทั่วถึงทดสอบเครื่องมือที่นำเข้า สุดท้ายคู่มือทั้งกระบวนการมีห้องเล็ก ๆ สำหรับการกลับมาเพิ่มขึ้นในการลงทุน ลูกค้าที่มีการชำระเงินสำหรับคู่มือการทำงานในแต่ละข้อมูลเวลาทำความสะอาดหมายความว่าผลประโยชน์ทางเศรษฐกิจของระบบอัตโนมัติจะไม่ได้ตระหนักถึง. ประการที่สองก่อนหน้านี้ผู้ผลิตที่มีคุณภาพให้ข้อมูลโซลูชั่นเทคโนโลยีในการแก้ไขปัญหาคุณภาพข้อมูลและคู่มือการติดตั้งเหล่านี้อย่างมีนัยสำคัญที่จำเป็น เหตุผลในการติดตั้งคู่มือการรวมธุรกิจการวิเคราะห์เพื่อเข้าใจความต้องการข้อมูลที่มีคุณภาพขององค์กรที่บัตรประจำตัวที่มีคุณภาพข้อมูลสุดท้ายกระบวนการทำงานและจากนั้นการเขียนโปรแกรมที่เกิดขึ้นจริงและการกำหนดค่าที่จะนำวิธีการแก้ปัญหาข้อมูลที่มีคุณภาพในสถานที่ ในคำอื่น ๆ ที่ บริษัท เหล่านี้ได้รับการสร้างโซลูชั่นที่มีคุณภาพโดยใช้ข้อมูลที่กำหนดเองdataquality อินเตอร์เฟซการเขียนโปรแกรมประยุกต์ของผู้ขาย(API) เมื่อการแก้ปัญหาที่ถูกขังอยู่ในสถานที่ที่อัตโนมัติลดความพยายามด้วยตนเองเพื่อให้มีความยาวขอบฟ้าสำหรับผลตอบแทนการลงทุนได้รับการยอมรับ. โซลูชั่นเหล่านี้ทำงานได้ดีสำหรับ บริษัท ขนาดใหญ่ที่สามารถจ่ายได้ทั้งปัญหาขององค์กรเริ่มต้นระบบที่รวบรวมข้อมูลและการแก้ปัญหา. วันนี้ใช้งานทางธุรกิจที่มีความซับซ้อนที่มีการใช้โดยแม้กระทั่งองค์กรที่มีขนาดเล็กที่สุด; ดังนั้นความพยายามคู่มือที่เกี่ยวข้องกับข้อมูลที่มีคุณภาพจะต้องอยู่ในแนวเดียวกันกับทรัพยากรของเหล่านี้องค์กรขนาดเล็ก โซลูชั่นข้อมูลที่มีคุณภาพจะต้องใช้ประโยชน์จากระบบอัตโนมัติและที่เดียวกันเวลาให้ผู้ใช้ทางธุรกิจที่มีการใช้งานง่ายเข้าถึงผลการประมวลผลและความสามารถในการลบล้างผล. การวิจัยข้อมูลที่มีคุณภาพยังได้เห็นอย่างมีนัยสำคัญความคืบหน้ากับรุ่นแรกของใหม่ACM วารสารของคุณภาพข้อมูลและสารสนเทศที่เผยแพร่ใน2009 กรอบสำหรับการวิจัยข้อมูลที่มีคุณภาพได้รับการแนะนำ (Madnick 2009 วัง 1995) เช่นเดียวกับแบบจำลองทางคณิตศาสตร์ที่เฉพาะเจาะจงสำหรับการแก้ไขปัญหาการเชื่อมโยงการบันทึก (Fellegi และ Sunter 1969) งานวิจัยล่าสุดในการเชื่อมโยงการบันทึกรวมถึงการพัฒนาและการใช้งานของขั้นตอนวิธีการเชื่อมโยงความคิดสร้างสรรค์มากขึ้น(Moustakides และ Verykios 2009 เคลอร์ 2006) การเชื่อมโยงข้อมูลเป็นปัญหาหลักในการดำเนินงานข้อมูลการทำความสะอาดจำนวนมากและเป็นกระบวนการในการระบุว่าทั้งสองแยกบันทึกหมายถึงนิติบุคคลเดียวกัน เชื่อมโยงสามารถใช้สำหรับทั้งระบุระเบียนที่ซ้ำกันในฐานข้อมูลเช่นเดียวกับการระบุระเบียนที่คล้ายกันทั่วชุดข้อมูลที่แตกต่างกัน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

โซลูชั่นที่มีอยู่มาแก้ไขปัญหาคุณภาพข้อมูล

ถูกขับเคลื่อนในส่วนของเศรษฐศาสตร์สถาบัน
มีปัญหา ตามความต้องการที่มีคุณภาพ
ข้อมูลโซลูชั่นถูกขับเคลื่อนโดยองค์กรขนาดใหญ่
มาก เช่น Global 2000 บริษัท มีทรัพยากรให้ใช้

ระบบซอฟต์แวร์ที่ซับซ้อนสำหรับการรวบรวมข้อมูลและพวกเขา
ก่อนจะสังเกตเห็น และประสบอย่างหลีกเลี่ยงไม่ได้ dataquality

ปัญหาที่เกิดจากความซับซ้อนนี้ ตามแนวทางที่พัฒนาโดยนักวิจัยบุกเบิกเทคโนโลยีสารสนเทศ

พื้นที่คุณภาพข้อมูล ( ลี et al . 2006 ) มีแนวโน้ม
เน้นการประเมินข้อมูลทางสถิติวิศวกรรมกระบวนการทางธุรกิจและข้อมูลที่ครอบคลุมองค์กร

ประกันนโยบาย ระบุขนาดของพวกเขา ,
ลูกค้าคุณภาพข้อมูลก่อนมีทรัพยากรที่จะใช้แรงงานมากและดังนั้นจึงมีราคาแพงเหล่านี้

โซลูชั่น โซลูชั่นคุณภาพข้อมูลดั้งเดิม
มีแนวโน้มที่จะอาศัยการดำเนินงานคู่มือ ,
2 ประการที่แตกต่างกัน .
ครั้งแรก ข้อมูลมักจะมือล้างด้วย สัญญา
กับหน่วยงานทั้งภายนอก นักวิเคราะห์ธุรกิจ

คนแรกจะระบุชนิดของข้อมูลที่มีคุณภาพงานที่จะต้องปฏิบัติ และที่ข้อมูล .
ชุดข้อมูลขนาดใหญ่ จะแตกขึ้นเป็นขนาดที่เหมาะสม
และใส่ลงในเอกสาร ข้อมูลนี้จะถูกกระจายไปยังบุคคลพร้อมกับคำแนะนำ

สำหรับล้างหน้า หลังจากงานคู่มือในสเปรดชีต
เสร็จ บ่อยครั้งที่งานอาจจะข้ามการตรวจสอบโดยคนงานอีก

และความขัดแย้งได้ เมื่อข้อมูลถูกอ่านจบ
ถูกประกอบขึ้นในรูปแบบที่เหมาะสมสำหรับ
โหลดกลับสู่ที่มาของระบบ คู่มือ
ความพยายามดังกล่าวได้ชัดเจน ข้อด้อย รวมถึงเวลา
ต้องวงจรผ่านกระบวนการทั้งหมด ,
เป็นไปได้สำหรับข้อผิดพลาดด้วยตนเอง และต้องส่งออก
แล้วนำเข้าผลลัพธ์สุดท้าย การส่งออกมักจะ
ค่อนข้างง่าย นำเข้าเป็นเกือบเสมอ
ใหญ่กว่าปัญหาตรรกะนำเข้าโดยปกติจะต้องระบุ
ไม่เพียง แต่ที่เขตข้อมูลที่เฉพาะเจาะจงและประวัติ

อัพเดท แต่ยังวิธีการจัดการลบหรือ
รวมข้อมูลและวิธีการ เพื่อให้บรรลุนี้ทั้งหมดโดยไม่
แนะนำข้อผิดพลาดใหม่ อีกปัญหาคือว่า
เพิ่มเติมงานจะต้องสร้างและถี่ถ้วน
ทดสอบนำเข้าเครื่องมือ ในที่สุด , คู่มือกระบวนการทั้งหมดมีห้องน้อย

เพิ่มผลตอบแทนในการลงทุนลูกค้าต้องจ่ายค่าใช้งานในแต่ละครั้งเป็นข้อมูล

สะอาดหมายความว่าผลประโยชน์ทางเศรษฐกิจของระบบอัตโนมัติจะไม่ตระหนัก .
2 ก่อนหน้านี้ผู้ขายที่มีคุณภาพข้อมูล
เทคโนโลยีโซลูชันปัญหาคุณภาพข้อมูล และที่สำคัญเหล่านี้เป็นคู่มือการติดตั้ง
.
เหตุผลสำหรับคู่มือการติดตั้งรวมธุรกิจ
3
เข้าใจความต้องการคุณภาพข้อมูลองค์กรตัวสุดท้ายข้อมูลคุณภาพ
งานไหลแล้วจริงโปรแกรม
และการใส่ข้อมูลคุณภาพโซลูชั่น
ในสถานที่ ในคำอื่น ๆที่ บริษัท เหล่านี้เป็นโซลูชั่นการสร้างข้อมูลที่กำหนดเองโดยใช้คุณภาพ

dataquality ผู้ขายโปรแกรมประยุกต์ interfaces ( API ) เมื่อสารละลายถูกวางในสถานที่
อัตโนมัติลดความพยายามด้วยตนเอง ดังนั้นอีกต่อไป
ขอบฟ้าสำหรับผลตอบแทนการลงทุนอยู่ในเกณฑ์ที่ยอมรับได้ โซลูชั่นเหล่านี้ทำงานได้ดีสำหรับ

ที่ บริษัท ขนาดใหญ่สามารถจ่ายได้ทั้งปัญหาเริ่มต้นระบบที่รวบรวมข้อมูลองค์กร

วันนี้ และโซลูชั่น ซับซ้อนจะถูกใช้โดยโปรแกรมประยุกต์ทางธุรกิจ

แม้แต่น้อยที่สุดขององค์การ จึงใช้ความพยายามที่เกี่ยวข้องกับ
คุณภาพข้อมูล ต้องสอดคล้องกับทรัพยากรของ
องค์กรขนาดเล็กเหล่านี้ คุณภาพของข้อมูลโซลูชั่น
ต้องใช้ระบบอัตโนมัติและในเวลาเดียวกัน
, ให้ผู้ใช้ทางธุรกิจด้วยการเข้าถึงง่าย
เพื่อผลการประมวลผลและความสามารถ
ยกเลิกผล การวิจัยคุณภาพ
ข้อมูลยังเห็นความก้าวหน้าอย่างมีนัยสำคัญ
กับปัญหาแรกของใหม่จากวารสาร
ของข้อมูลและข้อมูลที่มีคุณภาพ เผยแพร่ใน
2009กรอบการวิจัย
คุณภาพข้อมูลได้รับการแนะนำ ( madnick 2009 หวัง 1995 )
เช่นเดียวกับเฉพาะแบบจำลองทางคณิตศาสตร์สำหรับปัญหาการบันทึกค่า (

fellegi ซุนเตอร์และ 1969 ) งานวิจัยล่าสุดในการบันทึกค่า

รวมถึงการพัฒนาและการใช้งานของขั้นตอนวิธีความฉลาดมากขึ้น ( moustakides
verykios Winkler และในปี 2006 ) การเชื่อมโยงข้อมูล
ประเด็นหลักในการดำเนินงาน และหลายข้อมูลล้างหน้า
คือกระบวนการระบุว่าสองแยก
ประวัติอ้างถึงหน่วยงานเดียวกัน โดยสามารถใช้ทั้งเพื่อระบุระเบียนที่ซ้ำกัน

ในฐานข้อมูล ตลอดจนการระบุที่คล้ายกันบันทึกในชุดข้อมูลที่แตกต่างกัน

.

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.