Several business and technology dri

Several business and technology drivers are disrupting the
world of enterprise software, and that in turn is driving the
need for more effective data-quality solutions. These drivers
include business acceptance of the software-as-a-service
(SaaS) model, wide adoption of the web as a platform, collapse
of enterprise application silos, aggregation of data from disparate
internal and external sources, the agile mindset, and the
economic conditions driving agility.
SaaS is a software deployment model in which the provider
licenses applications for use as service on demand, most often
accessed through a browser. In 2007 SaaS clearly gained momentum,
with the sector having three billion dollars in revenue; by
2013 revenue could reach 50 percent of all application software
revenues (Ernst and Dunham 2006). Customer benefits from
SaaS deployments include much quicker and easier implementations,
relatively painless upgrades, global access through the
browser, lower total cost of ownership, and software vendors
sharing more of the risk (Friar et al. 2007). Related to SaaS is
another significant shift, the move from proprietary platforms
to the web as a platform. Again the user benefits because of less
vendor lock-in, open standards, well documented and broadly
accepted standards, and long-term commitment by the software
industry as a whole. These all contribute to higher quality solutions
across the industry as well as accelerated innovation and
more choice and flexible solutions available to the user.
Articles
Copyright © 2010, Association for the Advancement of Artificial Intelligence. All rights reserved. ISSN 0738-4602 SPRING 2010 65
Exceptional Data Quality
Using Intelligent
Matching and Retrieval
Clint Bidlack and
Michael P. Wellman
n Recent advances in enterprise web-based
software have created a need for sophisticated
yet user-friendly data-quality solutions. A new
category of data-quality solutions that fill this
need using intelligent matching and retrieval
algorithms is discussed. Solutions are focused
on customer and sales data and include realtime
inexact search, batch processing, and data
migration. Users are empowered to maintain
higher quality data resulting in more efficient
sales and marketing operations. Sales managers
spend more time with customers and less time
managing data.
Over the past couple of decades enterprise software
solutions tended to result in data in silos, for
example, a deployed accounting system that is
unable to share data with a customer-relationship
management system. The potential business value,
or benefit, from removing data silos has driven
companies to pursue such efforts to completion.
Collapse of the data silo is related to the larger phenomenon
of overall data aggregation on the web.
A growing pool of online structured data, better
tools, and, again, a large economic driver are all
pushing organizations to aggregate and use data
from a multitude of sources.
Finally, one of the most significant shifts in the
software industry is the explicit transition toward
agile software development. Agile development
includes iterative software development methodologies
in which both requirements and solutions
evolve during the development of the software.
Agile methodologies are in contrast to waterfall
methodologies, which imply that requirements are
well known before development starts (Larman
and Basili 2003). More effective agile processes are
important not only for software development, but
for organizations of all types and sizes. The necessity
to keep organizations aligned with opportunities
and external competitive forces is forcing this
reality. Being agile allows an organization to adapt
more rapidly to external forces, which in turn
increases the chances of survival.
For companies, the above trends are resulting in
more effective use of enterprise software as well as
more efficient business operations. Effectiveness is
driving adoption across the business landscape,
across industries, and from very small companies
up to the Global 2000. Efficiency is driving application
acceptance and usage within the company.
This combination of effectiveness and efficiency,
driving adoption and usage, is fueling enormous
growth of structured business data.
Large volumes of structured business data
require significant effort to maintain the quality of
the data. For instance, with customer-relationship
management (CRM) systems (deployed under SaaS
or traditional software installations), ActivePrime
and its partners have found that data quality has
become the number one issue that limits return on
investment. As the volume of data grows, the pain
experienced from poor quality data grows more
acute. Data quality has been an ongoing issue in
the IT industry for the past 30 years, and it continues
and is expanding as an issue, fueling the
growth of the data-quality industry to one billion
dollars in 2008. It is also estimated that companies
are losing 6 percent of sales because of poor management
of customer data (Experian QAS 2006).
Several competing definitions of data quality
exist. The pragmatic definition is considered here;
specifically, if data effectively and efficiently sup-
Articles
66 AI MAGAZINE
ports an organization’s analysis, planning, and
operations, then that data is considered of high
quality. In addition, data cleansing is defined as
manual or automated processes that are expected
to increase the quality of data.
Existing Solutions
Past solutions to data-quality problems were driven
in part by the economics of the institutions
having the problem. Traditionally, the demand for
data-quality solutions was driven by very large
organizations, such as Global 2000 corporations.
They had the resources to deploy complex software
system for gathering data, and they were the
first to notice and suffer from the inevitable dataquality
problems resulting from this complexity.
Accordingly, the approaches developed by the
information technology researchers pioneering
the area of data quality (Lee et al. 2006) tended to
emphasize statistical data assessment, business
process engineering, and comprehensive organizational
data-assurance policies. Given their size, the
early data-quality customers had the resources to
adopt these labor-intensive and therefore expensive
solutions. The traditional data-quality solutions
tended to rely heavily on manual operations,
in two different respects.
First, data was often hand-cleansed by contracting
with external staffing agencies. Business analysts
would first identify what type of data-quality
work needed to be performed and on which data.
Large data sets would be broken up into reasonable
sizes and put into spreadsheets. This data would be
distributed to individuals along with instructions
for cleansing. After the manual work on a spreadsheet
was finished oftentimes the work could be
cross-checked by another worker and any discrepancies
investigated. Once the data was finished it
was reassembled into the appropriate format for
loading back into the source IT system. Such manual
effort has clear drawbacks, including the time
required to cycle through the entire process, the
possibility for manual error, and the need to export
and then import the final results. Exporting is usually
fairly easy. The importing is almost always the
bigger issue. Import logic typically needs to identify
not only which specific fields and records to
update, but also how to deal with deleted or
merged data, and how to accomplish this all without
introducing new errors. Another issue is that
additional work is required to build and thoroughly
test the import tools. Finally, the entire manual
process has little room for increased return on
investment. The customer has to pay for the manual
work each time data is cleansed, meaning that
the economic benefits of automation are not realized.
Second, earlier data-quality vendors provided
technological solutions to data-quality problems,
and these required significant manual setup. The
reasons for the manual setup included business
analysis to understand data-quality needs of the
organization, identification of the final data-quality
work flow, and then the actual programming
and configuration to put the data-quality solution
in place. In other words, these companies were
building custom data-quality solutions using dataquality
vendor application programming interfaces
(APIs). Once the solution was put in place,
automation reduced the manual effort, so a longer
horizon for return on investment was acceptable.
These solutions worked fine for large companies
that could afford both the problem, initial enterprise
system that aggregates the data, and the solutions.
Today, sophisticated business applications
are being used by even the smallest organizations;
hence, the manual effort associated with data quality
must be in alignment with the resources of
these smaller organizations. The data-quality solutions
must leverage automation and, at the same
time, provide the business user with intuitive
access to the processing results and the ability to
override the results.
Data-quality research has also seen significant
progress with the first issue of the new ACM Journal
of Data and Information Quality published in
2009. Frameworks for researching data quality
have been introduced (Madnick 2009, Wang 1995)
as well as specific mathematical models for
addressing the record linkage problem (Fellegi and
Sunter 1969). Recent research in record linkage
includes the development and deployment of
more intelligent linkage algorithms (Moustakides
and Verykios 2009, Winkler 2006). Data linkage is
a core issue in many data-cleansing operations and
is the process of identifying whether two separate
records refer to the same entity. Linkage can be
used for both identifying duplicate records in a
database as well as identifying similar records
across disparate data sets.
Solutions
ActivePrime’s initial products and services focus on
increasing the quality

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

มีการควบควบคุมเทคโนโลยีและธุรกิจหลายโลกขององค์กร และซอฟต์แวร์ที่ใช้คือการขับรถต้องการแก้ไขปัญหาคุณภาพของข้อมูลมีประสิทธิภาพมากขึ้น โปรแกรมควบคุมเหล่านี้รวมธุรกิจยอมรับเป็นมีบริการซอฟต์แวร์แบบจำลอง (ซาส) ยอมรับความกว้างของเว็บเป็นแพลตฟอร์ม ยุบขององค์กรใช้ไซโล รวมข้อมูลแตกต่างกันภายใน และภายนอก ความคิดคล่องตัว และสภาพทางเศรษฐกิจที่การขับขี่ความคล่องตัวซาสเป็นแบบการปรับใช้ซอฟต์แวร์ซึ่งผู้ให้บริการสิทธิ์การใช้งานโปรแกรมประยุกต์สำหรับใช้บริการตามความต้องการ บ่อยที่สุดเข้าถึงผ่านทางเบราว์เซอร์ ในปี 2007 ซาสชัดเจนรับโมเมนตัมมีภาคที่มีสามพันล้านดอลลาร์ในรายได้ โดย2013 รายได้สามารถเข้าถึง 50 เปอร์เซ็นต์ของโปรแกรมทั้งหมดรายได้ (เอิร์นสท์และ Dunham 2006) ประโยชน์ของบริการจากจัดวางซาสรวมมากได้อย่างรวดเร็ว และง่ายต่อใช้งานการอัพเกรดที่ค่อนข้างเจ็บปวด การเข้าถึงทั่วโลกผ่านการเบราว์เซอร์ ต้นทุนรวมต่ำกว่าของเจ้า และผู้จำหน่ายซอฟต์แวร์ร่วมกันของความเสี่ยง (ไฟรอาร์ et al. 2007) ที่เกี่ยวข้องกับซาสเป็นอีกอย่างมีนัยสำคัญกะ ย้ายจากแพลตฟอร์มกรรมสิทธิ์เว็บเป็น อีกประโยชน์ผู้ใช้น้อยเนื่องจากผู้จัดจำหน่ายใน เปิดมาตรฐาน จัดดี และอย่างกว้างขวางมาตรฐานที่ยอมรับ และความมุ่งมั่นระยะยาว โดยซอฟต์แวร์อุตสาหกรรมทั้งหมด เหล่านี้ทั้งหมดช่วยให้โซลูชั่นคุณภาพสูงในอุตสาหกรรมรวมทั้งนวัตกรรมเร่ง และทางเลือกและกลุ่มผู้ใช้โซลูชั่นแบบยืดหยุ่นบทความลิขสิทธิ์ © 2010 สมาคมเพื่อความก้าวหน้าของปัญญาประดิษฐ์ สงวนลิขสิทธิ์ทั้งหมด นอก 0738-4602 สปริง 2010 65ข้อมูลยอดเยี่ยมคุณภาพใช้อัจฉริยะจับคู่ และเรียกClint Bidlack และMichael P. Wellmann Recent ล่วงหน้าในเว็บไซต์องค์กรซอฟต์แวร์สร้างความต้องการสำหรับที่ทันสมัยยังใช้งานง่ายคุณภาพข้อมูลการแก้ไขปัญหา ใหม่ประเภทโซลูชั่นคุณภาพข้อมูลที่กรอกข้อมูลนี้ต้องใช้การจับคู่อัจฉริยะและเรียกอัลกอริทึมมีการพูดถึง มุ่งเน้นการแก้ไขปัญหาข้อมูลลูกค้าและการขายและเรียลไทม์ค้นหาของ ย้าย และข้อมูลการโยกย้าย ผู้มีอำนาจในการรักษาข้อมูลคุณภาพสูงที่เกิดขึ้นในที่มีประสิทธิภาพมากขึ้นการดำเนินการขาย และการตลาด ผู้จัดการฝ่ายขายใช้เวลาเพิ่มเติม กับลูกค้า และน้อย กว่าเวลาการจัดการข้อมูลกว่าคู่ของซอฟต์แวร์องค์กรทศวรรษผ่านมามีแนวโน้มที่จะ ทำสำหรับข้อมูลในไซโล โซลูชั่นตัวอย่าง ระบบบัญชีที่ใช้ไม่สามารถใช้ข้อมูลร่วมกับลูกค้าความสัมพันธ์ระบบการจัดการ มูลค่าทางธุรกิจที่มีศักยภาพหรือมีการขับเคลื่อนสวัสดิการ ไซโลข้อมูลการเอาออกบริษัทเพื่อติดตามความพยายามดังกล่าวจนเสร็จสมบูรณ์ของไซโลข้อมูลเกี่ยวข้องกับปรากฏการณ์ใหญ่ของการรวมข้อมูลทั้งหมดบนเว็บเติบโตพูออนไลน์จัดโครงสร้างข้อมูล ดีเครื่องมือ และ อีก โปรแกรมควบคุมเศรษฐกิจขนาดใหญ่มีทั้งหมดผลักดันองค์กรรวม และใช้ข้อมูลจากหลากหลายแหล่งในที่สุด หนึ่งกะที่สำคัญในการอุตสาหกรรมซอฟต์แวร์เป็นการเปลี่ยนแปลงอย่างชัดเจนต่อเอจายล์ พัฒนาที่คล่องตัวมีวิธีการพัฒนาซอฟต์แวร์ซ้ำซึ่งความต้องการและแก้ไขปัญหาพัฒนาระหว่างการพัฒนาซอฟต์แวร์มีลักษณะคล่องตัวตรงข้ามน้ำตกหลักสูตร ซึ่งเป็นสิทธิ์แบบความต้อง(Larman เริ่มรู้จักกันดีก่อนที่จะพัฒนาก Basili 2003) มีกระบวนการคล่องตัวมีประสิทธิภาพความสำคัญต่อการพัฒนาซอฟแวร์ ไม่เพียง แต่สำหรับองค์กรของชนิดและขนาด ความจำเป็นเพื่อให้สอดคล้องกับโอกาสขององค์กรและบังคับกองกำลังแข่งขันภายนอกนี้ความเป็นจริง มีความคล่องตัวช่วยให้องค์กรปรับรวดเร็วยิ่งขึ้นกับกองกำลังภายนอก ซึ่งในการเปิดเพิ่มโอกาสอยู่รอดสำหรับบริษัท แนวโน้มดังกล่าวจะเกิดขึ้นในใช้เพิ่มประสิทธิภาพขององค์กรซอฟต์แวร์เป็นการดำเนินธุรกิจที่มีประสิทธิภาพมากขึ้น มีประสิทธิภาพยอมรับขับขี่ผ่านภูมิทัศน์ทางธุรกิจอุตสาหกรรม และ จากบริษัทเล็ก ๆถึง 2000 ทั่วโลก ประสิทธิภาพคือการขับรถแอพลิเคชันยอมรับและการใช้งานภายในบริษัทชุดนี้ประสิทธิภาพและประสิทธิผลยอมรับและการใช้งาน ในการขับรถเป็น fueling มหาศาลเจริญเติบโตของธุรกิจที่มีโครงสร้างข้อมูลธุรกิจโครงสร้างข้อมูลจำนวนมากต้องใช้ความพยายามอย่างมีนัยสำคัญเพื่อรักษาคุณภาพของข้อมูล มีความสัมพันธ์กับลูกค้าเช่นระบบการจัดการ (CRM) (จัดวางภายใต้ซาสหรือติดตั้งซอฟต์แวร์แบบดั้งเดิม), ActivePrimeและคู่พบว่า คุณภาพของข้อมูลได้เป็น จำนวนหนึ่งปัญหาที่ขีดจำกัดบนลงทุน เป็นระดับข้อมูลเติบโต ความเจ็บปวดประสบการณ์จากคุณภาพไม่ดีข้อมูลขยายเพิ่มเติมเฉียบพลัน ข้อมูลคุณภาพมีประเด็นต่อเนื่องในอุตสาหกรรมไอทีสำหรับ 30 ปีที่ผ่านมา และยังคงและขยายเป็นประเด็น fuelingเจริญเติบโตของอุตสาหกรรมคุณภาพข้อมูลการพันดอลลาร์ ในปี 2008 นอกจากนี้ยังคาดที่บริษัทมีการสูญเสียร้อยละ 6 ของยอดขายเนื่องจากการจัดการไม่ดีข้อมูลลูกค้า (Experian QAS 2006)กำหนดแข่งขันหลายของคุณภาพข้อมูลมีอยู่ คำนิยามปฏิบัติถือว่าที่นี่โดยเฉพาะ ถ้าข้อมูลได้อย่างมีประสิทธิภาพ และมีประสิทธิภาพผู้จำหน่าย-บทความนิตยสารไอ 66พอร์ตขององค์กรวิเคราะห์ วางแผน และการดำเนินงาน แล้วข้อมูลที่ถือว่าสูงคุณภาพการ นอกจากนี้ ทำความสะอาดข้อมูลถูกกำหนดเป็นกระบวนการโดยอัตโนมัติ หรือด้วยตนเองที่คาดไว้เพื่อเพิ่มคุณภาพของข้อมูลโซลูชั่นที่มีอยู่แก้ไขปัญหาคุณภาพข้อมูลมาถูกขับเคลื่อนบางส่วน โดยเศรษฐศาสตร์ของสถาบันที่มีปัญหา ประเพณี ความต้องการข้อมูลคุณภาพถูกขับเคลื่อนโดยมีขนาดใหญ่มากองค์กร เช่นบริษัทโกลบอล 2000มีทรัพยากรการปรับใช้ซอฟต์แวร์ที่ซับซ้อนระบบสำหรับการรวบรวมข้อมูล และพวกแรกจะสังเกตเห็น และประสบการ dataquality หลีกเลี่ยงไม่ได้ปัญหาที่เกิดจากความซับซ้อนตามลำดับ แนวทางการพัฒนาโดยการข้อมูลนักวิจัยเทคโนโลยีบุกเบิกพื้นที่ของคุณภาพข้อมูล (Lee et al. 2006) มีแนวโน้มที่จะเน้นการประเมินข้อมูลทางสถิติ ธุรกิจกระบวนการวิศวกรรม และองค์กรครบวงจรรับรองข้อมูลนโยบายการ กำหนดขนาด การลูกค้าคุณภาพข้อมูลก่อนมีทรัพยากรนำมาใช้เหล่านี้ labor-intensive และมีราคาแพงดังนั้นการแก้ไขปัญหา โซลูชั่นคุณภาพข้อมูลดั้งเดิมมีแนวโน้มมากพึ่งดำเนินการด้วยตนเองสองประการแตกต่างกันครั้งแรก ข้อมูลมักจะมีมือชำระตามสัญญากับหน่วยงานภายนอกพนักงาน นักวิเคราะห์ธุรกิจก่อนจะระบุชนิดของคุณภาพข้อมูลงานที่จำเป็นในการดำเนินการและข้อมูลที่ชุดข้อมูลขนาดใหญ่จะแบ่งเป็นค่าเหมาะสมขนาดและวางลงในกระดาษคำนวณ ข้อมูลนี้จะแจกจ่ายไปยังบุคคลพร้อมคำแนะนำสำหรับทำความสะอาด หลังจากทำงานด้วยตนเองบนกระดาษคำนวณถูกเสร็จแล้วอาจเกิดการทำงานอาจจะตรวจสอบระหว่างผู้ปฏิบัติงานอื่นและความขัดแย้งตรวจสอบ เมื่อข้อมูลเสร็จมันที่ตกในรูปแบบที่เหมาะสมสำหรับโหลดไว้ต้นเรื่องระบบ คู่มือดังกล่าวข้อเสียชัดเจน รวมถึงเวลามีความพยายามต้องวนกระบวนการทั้งหมด การความเป็นไปได้สำหรับข้อผิดพลาดด้วยตนเอง และจำเป็นในการส่งออกและนำเข้าผลสุดท้ายแล้ว การส่งออกเป็นปกติค่อนข้างง่าย การนำเข้าอยู่เกือบตลอดเวลาปัญหาใหญ่ นำตรรกะโดยทั่วไปจะต้องระบุไม่ เพียงเฉพาะที่เขตข้อมูล และระเบียนการปรับปรุง แต่วิธีการจัดการกับการลบ หรือรวมข้อมูล และวิธีการทำทั้งหมดนี้ไม่มีแนะนำข้อผิดพลาดใหม่ อีกประเด็นคืองานเพิ่มเติมจะต้องสร้างแล้วทดสอบเครื่องมือนำเข้า สุดท้าย คู่มือทั้งหมดกระบวนการมีห้องน้อยกลับเพิ่มขึ้นลงทุน ลูกค้ามีการชำระค่าจ้างสำหรับคู่มือเวลาแต่ละข้อมูลจะชำระ ทำงานผลประโยชน์ทางเศรษฐกิจของระบบอัตโนมัติจะไม่มีการรับรู้ที่สอง คุณภาพข้อมูลก่อนหน้านี้ผู้ให้แก้ไขปัญหาคุณภาพข้อมูล เทคโนโลยีและเหล่านี้จำเป็นต้องตั้งค่าด้วยตนเองอย่างมีนัยสำคัญ ที่เหตุผลสำหรับการตั้งค่าด้วยตนเองรวมธุรกิจการเข้าใจความต้องการข้อมูลคุณภาพของการองค์กร รหัสสุดท้ายข้อมูลคุณภาพขั้นตอนการทำงาน และการเขียนโปรแกรมจริงและการกำหนดค่าให้การแก้ปัญหาคุณภาพข้อมูลในสถานที่ ในคำอื่น ๆ บริษัทเหล่านี้ได้อาคารโซลูชั่นคุณภาพข้อมูลกำหนดเองที่ใช้ dataqualityผู้แอพลิเคชันเขียนโปรแกรมอินเทอร์เฟซ(Api) เมื่อย้ายที่ การแก้ปัญหาอัตโนมัติลดความพยายามด้วยตนเอง ดังนั้นความยาวขอบฟ้าผลลงทุนยอมรับได้โซลูชั่นเหล่านี้ทำงานดีสำหรับบริษัทขนาดใหญ่ที่สามารถซื้อได้ทั้งปัญหา องค์กรที่เริ่มต้นระบบที่รวมข้อมูล และการแก้โปรแกรมประยุกต์ทางธุรกิจวันนี้ ทันสมัยกำลังถูกใช้ โดยแม้แต่น้อยที่สุดองค์กรดังนั้น ความพยายามด้วยตนเองเกี่ยวข้องกับคุณภาพข้อมูลต้องสอดคล้องกับทรัพยากรขององค์กรขนาดเล็กเหล่านี้ โซลูชั่นคุณภาพข้อมูลต้องใช้ระบบอัตโนมัติและ ที่เดียวกันเวลา ให้ผู้ใช้ทางธุรกิจที่ใช้งานง่ายเข้าถึงประมวลผลและความสามารถในการแทนผลลัพธ์คุณภาพข้อมูลวิจัยได้เห็นสำคัญความคืบหน้ากับของรายพลอากาศใหม่ของข้อมูลและคุณภาพข้อมูลที่เผยแพร่ใน2009. กรอบการวิจัยคุณภาพข้อมูลได้รับการแนะนำ (Madnick 2009, 1995 วัง)และแบบจำลองทางคณิตศาสตร์เฉพาะสำหรับกำหนดปัญหาเชื่อมโยงเรกคอร์ด (Fellegi และSunter 1969) การวิจัยล่าสุดในการเชื่อมโยงระเบียนมีการพัฒนาและการใช้งานอัลกอริทึมความเชื่อมโยงไป (Moustakidesก Verykios 2009, Winkler 2006) เชื่อมโยงข้อมูลเป็นปัญหาหลักในการดำเนินการทำความสะอาดข้อมูลจำนวนมาก และเป็นกระบวนการระบุว่าแยกระเบียนหมายถึงเอนทิตีเดียว สามารถเชื่อมโยงใช้สำหรับเรกคอร์ดที่ซ้ำทั้งระบุในแบบฐานข้อมูลรวมทั้งระบุเรกคอร์ดที่คล้ายกันในชุดข้อมูลที่แตกต่างกันโซลูชั่นของ ActivePrime เริ่มต้นผลิตภัณฑ์และบริการที่เน้นเพิ่มคุณภาพ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

หลายธุรกิจและไดรเวอร์เทคโนโลยีกระทบกับโลกของซอฟต์แวร์ขององค์กรและในทางกลับจะขับรถจำเป็นที่จะต้องมีประสิทธิภาพมากขึ้นโซลูชั่นที่มีคุณภาพข้อมูล ไดรเวอร์เหล่านี้รวมถึงการได้รับการยอมรับธุรกิจของ Software-as-a-Service (SaaS), การยอมรับกว้างของเว็บเป็นแพลตฟอร์มที่การล่มสลายของไซโลโปรแกรมประยุกต์ขององค์กร, การรวมตัวของข้อมูลจากที่แตกต่างกันภายในและภายนอกความคิดเปรียวและภาวะเศรษฐกิจที่ขับรถคล่องตัว. SaaS เป็นรูปแบบการใช้ซอฟแวร์ในการที่ผู้ให้บริการการใช้งานใบอนุญาตสำหรับการใช้งานเป็นบริการตามความต้องการส่วนใหญ่มักจะเข้าถึงได้ผ่านทางเบราว์เซอร์ ในปี 2007 อย่างชัดเจน SaaS ได้รับโมเมนตัมกับภาคมีสามพันล้านดอลลาร์ในรายได้นั้น โดย2013 รายได้จะไปถึงร้อยละ 50 ของการประยุกต์ใช้ซอฟแวร์ทุกรายได้(เอิร์นส์และ Dunham 2006) ประโยชน์ที่ลูกค้าจะได้จากการใช้งาน SaaS รวมถึงการใช้งานที่ง่ายและรวดเร็วมาก, การอัพเกรดความเจ็บปวดการเข้าถึงทั่วโลกผ่านทางเบราว์เซอร์ที่ต่ำกว่าค่าใช้จ่ายทั้งหมดในการเป็นเจ้าของและผู้ผลิตซอฟต์แวร์ใช้งานร่วมกันมากขึ้นของความเสี่ยง(คริสตศาสนา et al. 2007) ที่เกี่ยวข้องกับการ SaaS เป็นอีกหนึ่งการเปลี่ยนแปลงอย่างมีนัยสำคัญย้ายจากแพลตฟอร์มที่เป็นกรรมสิทธิ์ไปยังเว็บเป็นแพลตฟอร์ม อีกครั้งในผลประโยชน์ที่ผู้ใช้น้อยเพราะผู้ขายล็อคในมาตรฐานเปิดเอกสารที่ดีในวงกว้างและได้รับการยอมรับมาตรฐานและความมุ่งมั่นในระยะยาวโดยซอฟต์แวร์อุตสาหกรรมโดยรวม ทั้งหมดเหล่านี้นำไปสู่การที่สูงขึ้นโซลูชั่นที่มีคุณภาพในอุตสาหกรรมเช่นเดียวกับนวัตกรรมและเร่งเลือกมากขึ้นและมีความยืดหยุ่นในการแก้ปัญหาที่มีอยู่ให้กับผู้ใช้. บทความลิขสิทธิ์© 2010 สมาคมเพื่อความก้าวหน้าของปัญญาประดิษฐ์ สงวนลิขสิทธิ์. ISSN 0738-4602 SPRING 2010 65 คุณภาพของข้อมูลเจ๋งใช้ความคิดสร้างสรรค์การจับคู่และดึงคลินต์Bidlack และไมเคิลพีWellman n ก้าวหน้าในองค์กรบนเว็บซอฟแวร์ได้สร้างความจำเป็นในการที่มีความซับซ้อนยังใช้งานง่ายโซลูชั่นที่มีคุณภาพข้อมูล ใหม่ประเภทของโซลูชั่นข้อมูลที่มีคุณภาพที่กรอกนี้จำเป็นที่จะต้องใช้การจับคู่ที่ชาญฉลาดและการดึงขั้นตอนวิธีการที่จะกล่าวถึง โซลูชั่นที่มีการมุ่งเน้นลูกค้าและข้อมูลการขายและรวมถึงเรียลไทม์ค้นหาไม่แน่นอน, การประมวลผลชุดและข้อมูลการย้ายถิ่น ผู้ใช้บริการจะเพิ่มขีดความสามารถในการรักษาข้อมูลที่มีคุณภาพที่สูงขึ้นส่งผลให้มีประสิทธิภาพมากขึ้นในการขายและการตลาด ผู้จัดการฝ่ายขายใช้เวลามากขึ้นกับลูกค้าและใช้เวลาน้อยการจัดการข้อมูล. กว่าคู่ที่ผ่านมาของทศวรรษที่ผ่านมาซอฟต์แวร์ขององค์กรการแก้ปัญหามีแนวโน้มที่จะส่งผลให้ข้อมูลในไซโลสำหรับตัวอย่างเช่นระบบบัญชีการใช้งานที่ไม่สามารถใช้ข้อมูลร่วมกับลูกค้าสัมพันธ์ระบบการจัดการ. มูลค่าทางธุรกิจที่อาจเกิดขึ้นหรือได้รับประโยชน์จากการเอาไซโลข้อมูลที่ได้ผลักดันให้บริษัท ที่จะติดตามความพยายามดังกล่าวจะเสร็จสิ้น. การล่มสลายของไซโลข้อมูลที่เกี่ยวข้องกับปรากฏการณ์ที่มีขนาดใหญ่ของการรวบรวมข้อมูลโดยรวมบนเว็บ. สระว่ายน้ำที่เพิ่มขึ้นของข้อมูลที่มีโครงสร้างออนไลน์ดีกว่าเครื่องมือและอีกคนขับทางเศรษฐกิจที่มีขนาดใหญ่มีทั้งหมดผลักดันให้องค์กรสามารถรวบรวมและใช้ข้อมูลจากหลากหลายแหล่งที่มา. ในที่สุดหนึ่งในการเปลี่ยนแปลงที่สำคัญที่สุดในอุตสาหกรรมซอฟต์แวร์คือการเปลี่ยนแปลงอย่างชัดเจนต่อการพัฒนาซอฟต์แวร์เปรียว การพัฒนาเปรียวรวมถึงวิธีการพัฒนาซอฟแวร์ซ้ำซึ่งทั้งสองความต้องการและการแก้ปัญหาการพัฒนาขึ้นในระหว่างการพัฒนาซอฟแวร์. วิธีเปรียวเป็นในทางตรงกันข้ามกับน้ำตกวิธีการซึ่งบ่งบอกว่าต้องการจะเป็นที่รู้จักกันดีก่อนที่จะเริ่มต้นการพัฒนา(Larman และ Basili 2003) กระบวนการคล่องตัวมีประสิทธิภาพมากขึ้นมีความสำคัญไม่เพียง แต่สำหรับการพัฒนาซอฟต์แวร์ แต่สำหรับองค์กรทุกประเภทและขนาด ความจำเป็นที่จะให้องค์กรที่สอดคล้องกับโอกาสและกองกำลังในการแข่งขันภายนอกจะบังคับนี้ความเป็นจริง ความคล่องตัวช่วยให้องค์กรที่จะปรับตัวขึ้นอย่างรวดเร็วไปยังกองกำลังภายนอกซึ่งจะเพิ่มโอกาสของการอยู่รอด. สำหรับ บริษัท แนวโน้มดังกล่าวข้างต้นจะส่งผลให้การใช้งานมีประสิทธิภาพมากขึ้นของซอฟต์แวร์ขององค์กรเช่นเดียวกับการดำเนินธุรกิจมีประสิทธิภาพมากขึ้น ประสิทธิผลคือการผลักดันการใช้ในภูมิประเทศธุรกิจในอุตสาหกรรมและจากบริษัท ขนาดเล็กมากขึ้นไปทั่วโลก2000 ประสิทธิภาพการประยุกต์ใช้คือการขับรถได้รับการยอมรับและการใช้งานภายในบริษัท . ชุดนี้ของความมีประสิทธิผลและประสิทธิภาพผลักดันการใช้และการใช้เป็นเชื้อเพลิงอย่างมากการเจริญเติบโตของข้อมูลทางธุรกิจที่มีโครงสร้าง. ปริมาณขนาดใหญ่ของข้อมูลทางธุรกิจที่มีโครงสร้างต้องใช้ความพยายามอย่างมีนัยสำคัญเพื่อรักษาคุณภาพของข้อมูล ยกตัวอย่างเช่นลูกค้าที่มีความสัมพันธ์การจัดการระบบ (CRM) (ภายใต้การใช้งาน SaaS หรือการติดตั้งซอฟต์แวร์แบบดั้งเดิม) ActivePrime และคู่ค้าได้พบว่าคุณภาพของข้อมูลได้กลายเป็นหมายเลขหนึ่งของปัญหาที่ข้อ จำกัด ของผลตอบแทนจากการลงทุน ขณะที่ปริมาณการเติบโตของข้อมูลที่มีอาการปวดที่มีประสบการณ์จากข้อมูลที่มีคุณภาพไม่ดีเติบโตมากขึ้นเฉียบพลัน ข้อมูลที่มีคุณภาพที่ได้รับปัญหาอย่างต่อเนื่องในอุตสาหกรรมไอทีสำหรับที่ผ่านมา 30 ปีและมันยังคงและมีการขยายเป็นปัญหาเติมน้ำมันเจริญเติบโตของอุตสาหกรรมข้อมูลที่มีคุณภาพให้หนึ่งพันล้านดอลลาร์ในปี2008 นอกจากนี้ยังคาดว่า บริษัทจะมี การสูญเสียร้อยละ 6 ของยอดขายเนื่องจากการจัดการไม่ดีของข้อมูลลูกค้า (Experian QAS 2006). คำจำกัดความของการแข่งขันหลายคุณภาพของข้อมูลที่มีอยู่ ความหมายในทางปฏิบัติเป็นที่ยอมรับว่าที่นี่โดยเฉพาะหากข้อมูลมีประสิทธิภาพและประสิทธิผลสนับสนุนบทความ66 AI นิตยสารพอร์ตการวิเคราะห์ขององค์กรการวางแผนและการดำเนินงานแล้วข้อมูลที่ถือว่าเป็นของสูงที่มีคุณภาพ นอกจากนี้การทำความสะอาดข้อมูลที่ถูกกำหนดให้เป็นกระบวนการตนเองหรือโดยอัตโนมัติที่คาดว่าจะเพิ่มคุณภาพของข้อมูล. โซลูชั่นที่มีอยู่แก้ปัญหาที่ผ่านมาปัญหาที่มีคุณภาพข้อมูลที่ถูกขับในส่วนของเศรษฐกิจของสถาบันมีปัญหา ตามเนื้อผ้าความต้องการสำหรับโซลูชั่นข้อมูลที่มีคุณภาพถูกผลักดันโดยมีขนาดใหญ่มากองค์กรเช่นGlobal 2000 บริษัท . พวกเขามีทรัพยากรในการปรับใช้ซอฟต์แวร์ที่ซับซ้อนของระบบสำหรับการรวบรวมข้อมูลและพวกเขาเป็นคนแรกที่สังเกตเห็นและทุกข์ทรมานจากdataquality หลีกเลี่ยงไม่ได้ปัญหาที่เป็นผลจากความซับซ้อนนี้. ดังนั้นแนวทางการพัฒนาโดยนักวิจัยด้านเทคโนโลยีสารสนเทศการสำรวจพื้นที่ของข้อมูลที่มีคุณภาพ(Lee et al. 2006) มีแนวโน้มที่จะเน้นการประเมินข้อมูลสถิติธุรกิจวิศวกรรมกระบวนการและองค์กรที่ครอบคลุมนโยบายการประกันข้อมูล ด้วยขนาดของพวกเขาลูกค้าข้อมูลที่มีคุณภาพในช่วงต้นมีทรัพยากรที่จะนำมาใช้เหล่านี้ที่ใช้แรงงานเข้มข้นและดังนั้นจึงมีราคาแพงการแก้ปัญหา โซลูชั่นข้อมูลที่มีคุณภาพแบบดั้งเดิมมีแนวโน้มที่จะต้องพึ่งพาการดำเนินงานด้วยตนเองในสองประการที่แตกต่างกัน. ครั้งแรกข้อมูลมักจะมือทำความสะอาดโดยการทำสัญญากับหน่วยงานของพนักงานภายนอก นักวิเคราะห์ธุรกิจแรกที่จะระบุชนิดของข้อมูลที่มีคุณภาพการทำงานที่จำเป็นจะต้องดำเนินการและที่ข้อมูล. ชุดข้อมูลขนาดใหญ่จะถูกแบ่งออกเป็นที่เหมาะสมขนาดและใส่ลงไปในกระดาษคำนวณ ข้อมูลนี้จะถูกกระจายให้กับประชาชนพร้อมกับคำแนะนำสำหรับการทำความสะอาด หลังจากการทำงานด้วยตนเองในสเปรดชีตที่เสร็จอาจเกิดการทำงานที่อาจจะข้ามการตรวจสอบโดยผู้ปฏิบัติงานอื่นและแตกต่างใดๆการตรวจสอบ เมื่อข้อมูลเสร็จมันถูกประกอบเป็นรูปแบบที่เหมาะสมสำหรับการโหลดกลับเข้ามาของระบบไอที คู่มือดังกล่าวพยายามที่มีข้อบกพร่องที่ชัดเจนรวมทั้งเวลาที่จำเป็นในการวงจรผ่านกระบวนการทั้งหมดที่เป็นไปได้สำหรับข้อผิดพลาดด้วยตนเองและความจำเป็นในการส่งออกและนำเข้าผลสุดท้าย การส่งออกมักจะค่อนข้างง่าย การนำเข้าเกือบเสมอปัญหาที่ใหญ่กว่า ตรรกะนำเข้ามักจะต้องมีการระบุไม่เพียงแต่ที่เฉพาะสาขาและมีการบันทึกการปรับปรุงแต่ยังวิธีการจัดการกับการลบหรือข้อมูลรวมและวิธีการที่จะบรรลุนี้โดยไม่ต้องมีการแนะนำข้อผิดพลาดใหม่ ปัญหาก็คือว่าการทำงานเพิ่มเติมเป็นสิ่งจำเป็นในการสร้างและทั่วถึงทดสอบเครื่องมือที่นำเข้า สุดท้ายคู่มือทั้งกระบวนการมีห้องเล็ก ๆ สำหรับการกลับมาเพิ่มขึ้นในการลงทุน ลูกค้าที่มีการชำระเงินสำหรับคู่มือการทำงานในแต่ละข้อมูลเวลาทำความสะอาดหมายความว่าผลประโยชน์ทางเศรษฐกิจของระบบอัตโนมัติจะไม่ได้ตระหนักถึง. ประการที่สองก่อนหน้านี้ผู้ผลิตที่มีคุณภาพให้ข้อมูลโซลูชั่นเทคโนโลยีในการแก้ไขปัญหาคุณภาพข้อมูลและคู่มือการติดตั้งเหล่านี้อย่างมีนัยสำคัญที่จำเป็น เหตุผลในการติดตั้งคู่มือการรวมธุรกิจการวิเคราะห์เพื่อเข้าใจความต้องการข้อมูลที่มีคุณภาพขององค์กรที่บัตรประจำตัวที่มีคุณภาพข้อมูลสุดท้ายกระบวนการทำงานและจากนั้นการเขียนโปรแกรมที่เกิดขึ้นจริงและการกำหนดค่าที่จะนำวิธีการแก้ปัญหาข้อมูลที่มีคุณภาพในสถานที่ ในคำอื่น ๆ ที่ บริษัท เหล่านี้ได้รับการสร้างโซลูชั่นที่มีคุณภาพโดยใช้ข้อมูลที่กำหนดเองdataquality อินเตอร์เฟซการเขียนโปรแกรมประยุกต์ของผู้ขาย(API) เมื่อการแก้ปัญหาที่ถูกขังอยู่ในสถานที่ที่อัตโนมัติลดความพยายามด้วยตนเองเพื่อให้มีความยาวขอบฟ้าสำหรับผลตอบแทนการลงทุนได้รับการยอมรับ. โซลูชั่นเหล่านี้ทำงานได้ดีสำหรับ บริษัท ขนาดใหญ่ที่สามารถจ่ายได้ทั้งปัญหาขององค์กรเริ่มต้นระบบที่รวบรวมข้อมูลและการแก้ปัญหา. วันนี้ใช้งานทางธุรกิจที่มีความซับซ้อนที่มีการใช้โดยแม้กระทั่งองค์กรที่มีขนาดเล็กที่สุด; ดังนั้นความพยายามคู่มือที่เกี่ยวข้องกับข้อมูลที่มีคุณภาพจะต้องอยู่ในแนวเดียวกันกับทรัพยากรของเหล่านี้องค์กรขนาดเล็ก โซลูชั่นข้อมูลที่มีคุณภาพจะต้องใช้ประโยชน์จากระบบอัตโนมัติและที่เดียวกันเวลาให้ผู้ใช้ทางธุรกิจที่มีการใช้งานง่ายเข้าถึงผลการประมวลผลและความสามารถในการลบล้างผล. การวิจัยข้อมูลที่มีคุณภาพยังได้เห็นอย่างมีนัยสำคัญความคืบหน้ากับรุ่นแรกของใหม่ACM วารสารของคุณภาพข้อมูลและสารสนเทศที่เผยแพร่ใน2009 กรอบสำหรับการวิจัยข้อมูลที่มีคุณภาพได้รับการแนะนำ (Madnick 2009 วัง 1995) เช่นเดียวกับแบบจำลองทางคณิตศาสตร์ที่เฉพาะเจาะจงสำหรับการแก้ไขปัญหาการเชื่อมโยงการบันทึก (Fellegi และ Sunter 1969) งานวิจัยล่าสุดในการเชื่อมโยงการบันทึกรวมถึงการพัฒนาและการใช้งานของขั้นตอนวิธีการเชื่อมโยงความคิดสร้างสรรค์มากขึ้น(Moustakides และ Verykios 2009 เคลอร์ 2006) การเชื่อมโยงข้อมูลเป็นปัญหาหลักในการดำเนินงานข้อมูลการทำความสะอาดจำนวนมากและเป็นกระบวนการในการระบุว่าทั้งสองแยกบันทึกหมายถึงนิติบุคคลเดียวกัน เชื่อมโยงสามารถใช้สำหรับทั้งระบุระเบียนที่ซ้ำกันในฐานข้อมูลเช่นเดียวกับการระบุระเบียนที่คล้ายกันทั่วชุดข้อมูลที่แตกต่างกัน. โซลูชั่นActivePrime ผลิตภัณฑ์เริ่มต้นและการบริการที่มุ่งเน้นไปที่การเพิ่มคุณภาพ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ไดรเวอร์หลายธุรกิจและเทคโนโลยีจะกระทบ
โลกของซอฟต์แวร์ขององค์กรและที่ในการเปิดเป็น
ต้องขับรถเพื่อแก้ปัญหาคุณภาพข้อมูลมีประสิทธิภาพมากขึ้น เหล่านี้ไดรเวอร์
รวมถึงการยอมรับธุรกิจของ software-as-a-service
( SaaS ) รูปแบบการยอมรับกว้างของเว็บเป็นแพลตฟอร์มถล่ม
ขององค์กรโปรแกรมไซโล , การรวมข้อมูลจากหลากหลาย
แหล่งข้อมูลภายใน และภายนอก ความคิดว่องไว และภาวะเศรษฐกิจทำให้ความคล่องตัว
.
SaaS เป็นการใช้งานซอฟต์แวร์รุ่นที่ผู้ให้บริการ
ใบอนุญาตโปรแกรมเพื่อใช้เป็นบริการในความต้องการส่วนใหญ่มักจะ
เข้าถึงได้ผ่านทางเบราว์เซอร์ ในปี 2007 SaaS ชัดเจนได้รับโมเมนตัม
กับภาคมี 3 พันล้านดอลลาร์ในรายได้โดย
;รายได้ปี 2556 อาจถึง 50 เปอร์เซ็นต์ของรายได้โปรแกรมซอฟต์แวร์
( นแฮม 2006 ) ลูกค้าได้รับประโยชน์จาก
SaaS การใช้งานรวมถึงการใช้งานมากเร็วและง่ายขึ้น , การอัพเกรดค่อนข้างยุ่ง

การเข้าถึงทั่วโลกผ่านเบราว์เซอร์ , ต้นทุนรวมที่ลดลงของการเป็นเจ้าของ และผู้ผลิตซอฟต์แวร์
ร่วมกันมากขึ้นของความเสี่ยง ( หลวงพ่อ et al . 2007 ) ที่เกี่ยวข้องกับ SaaS เป็น
กะอย่างอื่นย้ายจากแพลตฟอร์มที่เป็นกรรมสิทธิ์
ไปยังเว็บเป็นแพลตฟอร์ม อีกครั้งผู้ใช้ประโยชน์เพราะน้อย
ผู้ขายล็อคอิน , เปิดเอกสารและมาตรฐาน คือกว้าง
มาตรฐานที่ได้รับการยอมรับ และสัญญาระยะยาว โดยอุตสาหกรรมซอฟต์แวร์
เป็นทั้ง ทั้งหมดนี้ส่งผลให้โซลูชั่นคุณภาพสูง
ข้ามอุตสาหกรรม ตลอดจนเร่งนวัตกรรมและ
เพิ่มเติมตัวเลือกและโซลูชั่นที่ยืดหยุ่นใช้ได้กับผู้ใช้ .

ลิขสิทธิ์บทความสงวนลิขสิทธิ์ 2553 สมาคมเพื่อความก้าวหน้าของปัญญาประดิษฐ์ สงวนลิขสิทธิ์ ชื่อ 0738-4602 ฤดูใบไม้ผลิ 2010 65

ยอดเยี่ยมคุณภาพข้อมูลตรงกัน และการใช้ฉลาด

และ คลินท์ bidlack
ไมเคิลพี เวลแมน

n ความก้าวหน้าล่าสุดในองค์กรบนเว็บซอฟต์แวร์สร้างความต้องการที่ซับซ้อน
แต่ใช้งานง่ายคุณภาพของข้อมูลโซลูชั่น ประเภทใหม่
คุณภาพโซลูชั่นข้อมูลที่กรอกนี้
ต้องใช้จับคู่ฉลาดและสืบค้น
ขั้นตอนวิธีนี้ โซลูชั่นจะเน้นเกี่ยวกับลูกค้าและข้อมูลการขาย

ไม่ละเอียดและรวม Realtime ค้นหา การประมวลผล และการโยกย้ายข้อมูล

ผู้ใช้อำนาจในการรักษาที่สูงขึ้นส่งผลให้คุณภาพข้อมูล

ให้มีประสิทธิภาพมากขึ้นการขายและการตลาดงาน ผู้จัดการฝ่ายขาย
ใช้เวลามากขึ้นกับลูกค้าและการจัดการข้อมูลเวลาน้อย
.
กว่าสองสามทศวรรษองค์กรซอฟต์แวร์โซลูชั่นที่มีผลในข้อมูล

ในไซโล ในตัวอย่าง ใช้ระบบบัญชีที่สามารถแบ่งปันข้อมูลด้วย

ระบบการจัดการความสัมพันธ์ลูกค้า มูลค่าทางธุรกิจที่มีศักยภาพ ,
หรือประโยชน์

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.