in information. The data-users (in this case, the companies) need to ensure the quality and trustworthiness of data and be able to trust in it in their businesses. At first, when collecting data, the user wants to ensure the reliability of the data and the data source, leaving out suspicious data. Secondly, when further processing and analyzing the data, the user wants to ensure that the quality and relevancy of data are appropriate for the specific situation. Reliable and valuable data enhancesbusinessdecisionmakinginseveralways,enabling, for example, real-time demand predictions, the estimation of trends, and innovation of potential new products/services. The usage of unreliable data, such as data from suspicious sources, or corrupted, subjective, inaccurate or incomplete data,hasahighriskforacompany’sbusiness,andmayleadto poor or incorrect business decisions. Furthermore, the usage ofvaluelessandirrelevantdataforcertainsituationscausesa lot of unnecessary effort and expenses for companies. The evaluation of data quality has relevance in one or more data processing phase(s) of big data architecture (i.e.bigdatapipeline);indataextraction,dataprocessingand analysis, and finally in decision making. Therefore, quality evaluation of big data must be considered during architecture design, when designing how the data goes through the pipelineofabigdatasystem.Difficultiesinqualityevaluation are determined by the fact that data quality cannot be judged withoutconsideringthecontextathand[10];thesamequality attributeisapplicabletodifferentsituationsbuttheevaluation metricisdifferent.Inaddition,therearenoagreeddefinitions of quality attributes or classification of their applicability to certain contexts. Furthermore, the characteristics of big data, [6], [11], and [12] as such, set special challenges for quality evaluation. The growing amount of semi-structured and unstructured data, new ways of delivering information and user’s changed expectations and perceptions of data quality have been recognized as new challenges in data quality research [8]. Thus, it is obvious that new means are required for data quality evaluation for such kinds of big data. The purpose of this paper is to describe how to ensure the quality and trustworthiness of social media data for company’s business decision making. We introduce a novel solution for data evaluation, in which the data consumer can selecttheapplicable qualityattributesandevaluationmetrics for the context and situation at hand, and evaluate the quality attributes with evaluation metrics. The solution follows the pipeline of the big data reference architecture of [7]. This paper is organized according to the following: Section 2 defines the basic terms used in this work, and provides state-of-the-art of the big data architectures, and theapplicationofmetadata,qualityattributes,qualitymetrics and quality policies in business usage. Section 3 introduces our solution for data quality evaluation in big data architecture. Section 4 provides a case example of how the developments are used in practice; an industrial case company achieves insight into customer needs utilizing social media data. Section 5 provides the validation of the trial
usage of the solution and identifies the shortcomings and development targets. Finally, section 6 concludes the work.
ในข้อมูล ข้อมูลผู้ใช้ (ในกรณีนี้ บริษัท) ต้องการคุณภาพและความน่าเชื่อถือของข้อมูล และสามารถเชื่อมั่นในธุรกิจของตน ที่แรก เมื่อเก็บรวบรวมข้อมูล ผู้ใช้ต้องการความน่าเชื่อถือของข้อมูลและแหล่งข้อมูล ออกจากข้อมูลที่น่าสงสัย ประการที่สอง เมื่อการประมวลผล และวิเคราะห์ข้อมูล ผู้ใช้ต้องการให้แน่ใจว่า คุณภาพและความเกี่ยวข้องของข้อมูลที่เหมาะสมสำหรับสถานการณ์ specific ข้อมูลเชื่อถือได้ และมีค่า enhancesbusinessdecisionmakinginseveralways ให้ เช่น คาดคะเนความต้องการแบบเรียลไทม์ การประเมินแนวโน้ม และนวัตกรรมของผลิตภัณฑ์ใหม่และบริการการ การใช้ข้อมูลที่น่าเชื่อถือ เช่นข้อมูลจากสงสัยแหล่งที่มา หรือข้อมูลเสียหาย อัตนัย ไม่ถูกต้อง หรือไม่สมบูรณ์ hasahighriskforacompany'sbusiness, andmayleadto การตัดสินใจทางธุรกิจที่ดี หรือไม่ถูกต้อง นอกจากนี้ ความพยายามที่ไม่จำเป็นและค่าใช้จ่ายจำนวนมากใช้ ofvaluelessandirrelevantdataforcertainsituationscausesa บริษัท การประเมินคุณภาพของข้อมูลมีความเกี่ยวข้องในการประมวลผลข้อมูลอย่าง น้อยหนึ่ง phase(s) ของข้อมูลขนาดใหญ่ (i.e.bigdatapipeline);indataextraction,dataprocessingand วิเคราะห์ และ finally ในการตัดสินใจ ดังนั้น การประเมินคุณภาพของข้อมูลต้องพิจารณาระหว่างการออกแบบสถาปัตยกรรม ออกแบบวิธีข้อมูลไปผ่านการ pipelineofabigdatasystem กำหนด โดยความจริงที่ว่า คุณภาพของข้อมูลไม่สามารถตัดสิน withoutconsideringthecontextathand [10]; Difficultiesinqualityevaluation thesamequality attributeisapplicabletodifferentsituationsbuttheevaluation metricisdifferent โรงแรมนี้มี therearenoagreeddefinitions แอตทริบิวต์คุณภาพหรือ classification ของความเกี่ยวข้องของพวกเขากับบริบทบางอย่าง นอกจากนี้ ลักษณะของข้อมูลขนาดใหญ่, [6], [11], และ [12] เช่น ตั้งความท้าทายพิเศษสำหรับการประเมินคุณภาพ เพิ่มจำนวนข้อมูลกึ่งโครงสร้าง และไร้โครงสร้าง วิธีการใหม่ของการส่งข้อมูลและผู้ใช้เปลี่ยนแปลงความคาดหวัง และการรับรู้ของคุณภาพข้อมูลได้รับการยอมรับความท้าทายใหม่ในข้อมูลวิจัย [8] ดังนั้น จึงเห็นได้ชัดว่า ใหม่จำเป็นสำหรับการประเมินคุณภาพของข้อมูลเช่นชนิดของข้อมูลขนาดใหญ่ วัตถุประสงค์ของเอกสารนี้จะอธิบายวิธีการคุณภาพและความน่าเชื่อถือของสังคมข้อมูลสำหรับการตัดสินใจทางธุรกิจของบริษัททำให้ เราแนะนำโซลูชั่นใหม่สำหรับการประมวลผลข้อมูล ซึ่งข้อมูลผู้บริโภคสามารถ qualityattributesandevaluationmetrics selecttheapplicable สำหรับบริบทและสถานการณ์มือ และประเมินคุณลักษณะคุณภาพกับการวัดประเมินผล การแก้ปัญหาตามขั้นตอนของสถาปัตยกรรมอ้างอิงข้อมูลขนาดใหญ่ของ [7] เอกสารนี้ถูกจัดระเบียบตาม: defines 2 ส่วนพื้นฐานเงื่อนไขใช้ในงานนี้ และให้รัฐของการศิลปะของสถาปัตยกรรมข้อมูลขนาดใหญ่ theapplicationofmetadata, qualityattributes, qualitymetrics และคุณภาพของนโยบายในการใช้งานทางธุรกิจ ส่วนที่ 3 เป็นการแนะนำผลิตภัณฑ์สำหรับการประเมินคุณภาพของข้อมูลในข้อมูล หมวดที่ 4 แสดงตัวอย่างของวิธีใช้การพัฒนาในทางปฏิบัติ บริษัทกรณีอุตสาหกรรมให้ความเข้าใจในลูกค้าที่ต้องการใช้งานข้อมูลสังคม ส่วนที่ 5 มีการตรวจสอบของการทดลองการใช้งานของโซลูชัน และ identifies ข้อบกพร่อง และพัฒนาเป้าหมาย ในที่สุด ส่วนที่ 6 สรุปการทำงาน
การแปล กรุณารอสักครู่..
ในข้อมูล ข้อมูลผู้ใช้ ( ในกรณีนี้ บริษัทต้องมั่นใจในคุณภาพและความน่าเชื่อถือของข้อมูล และสามารถที่จะไว้ใจในธุรกิจของพวกเขา ที่จึงตัดสินใจเดินทางไป เมื่อรวบรวมข้อมูลผู้ใช้ต้องการที่จะให้ความน่าเชื่อถือของข้อมูลและแหล่งข้อมูล ออกจากข้อมูลที่น่าสงสัย ประการที่สอง เมื่อแปรรูปและวิเคราะห์ข้อมูลที่ผู้ใช้ต้องการเพื่อให้มั่นใจว่าคุณภาพและความเกี่ยวข้องของข้อมูลที่เหมาะสมสำหรับกาจึง C สถานการณ์ เชื่อถือได้ และ enhancesbusinessdecisionmakinginseveralways ข้อมูลที่มีคุณค่าการใช้งาน ตัวอย่างเช่น การคาดคะเนความต้องการเวลาจริงการประเมินแนวโน้มและนวัตกรรมของสินค้า / บริการใหม่ที่มีศักยภาพ การใช้ข้อมูลที่ไม่น่าเชื่อถือ เช่น ข้อมูลจากแหล่งข้อมูลที่น่าสงสัยหรือความเสียหาย , อัตนัย , ข้อมูลไม่ถูกต้อง หรือ ไม่ครบ hasahighriskforacompany'sbusiness andmayleadto ไม่ดีหรือผิด , การตัดสินใจทางธุรกิจ นอกจากนี้ การใช้ ofvaluelessandirrelevantdataforcertainsituationscausesa มากเสียเวลาและค่าใช้จ่ายสำหรับ บริษัท การประเมินคุณภาพของข้อมูลที่มีความเกี่ยวข้องในหนึ่งหรือมากกว่าหนึ่งขั้นตอนการประมวลผลข้อมูล ( s ) ของสถาปัตยกรรมข้อมูลใหญ่ ( i.e.bigdatapipeline ) ; indataextraction การวิเคราะห์ dataprocessingand และจึงแนลลี่ ในการตัดสินใจ ดังนั้น การประเมินคุณภาพของข้อมูลที่ใหญ่ที่ต้องพิจารณาในการออกแบบสถาปัตยกรรม เมื่อออกแบบแล้วข้อมูลไปผ่าน pipelineofabigdatasystem . ดิฟ cultiesinqualityevaluation จึงถูกกำหนดโดยความเป็นจริงที่ไม่ได้คุณภาพของข้อมูลจะถูกตัดสิน withoutconsideringthecontextathand [ 10 ] ; thesamequality attributeisapplicabletodifferentsituationsbuttheevaluation metricisdifferent และ therearenoagreedde จึง nitions ลักษณะหรือคุณภาพจึง classi ไอออนบวกของการบังคับใช้ของพวกเขากับบริบท แน่นอน นอกจากนี้ ลักษณะของข้อมูลใหญ่ [ 6 ] , [ 11 ] และ [ 12 ] เช่นการตั้งค่าความท้าทายพิเศษสำหรับการประเมินคุณภาพ ส่วนปริมาณการเติบโตของข้อมูลแบบกึ่งโครงสร้างและไม่มีโครงสร้าง วิธีการใหม่ในการส่งมอบข้อมูลและผู้ใช้เปลี่ยนความคาดหวังและการรับรู้คุณภาพของข้อมูลที่ได้รับการยอมรับว่าเป็นความท้าทายใหม่ในข้อมูลวิจัยคุณภาพ [ 8 ] ดังนั้นจึงเป็นที่ชัดเจนว่าวิธีการใหม่ที่จำเป็นสำหรับการประเมินคุณภาพข้อมูลเช่นชนิดของข้อมูลใหญ่ การวิจัยครั้งนี้มีวัตถุประสงค์เพื่ออธิบายวิธีการเพื่อให้มั่นใจในคุณภาพและความน่าเชื่อถือของ บริษัท สื่อสังคมข้อมูลเพื่อการตัดสินใจทางธุรกิจ เราแนะนำโซลูชั่นใหม่สำหรับการประเมินข้อมูล ซึ่งข้อมูลที่ผู้บริโภคสามารถ selecttheapplicable qualityattributesandevaluationmetrics สำหรับบริบทและสถานการณ์ในมือ และประเมินคุณภาพคุณลักษณะกับการวัดประเมินผล โซลูชั่นดังนี้ท่อใหญ่ของข้อมูลอ้างอิงสถาปัตยกรรม [ 7 ] กระดาษนี้จะจัดตามดังต่อไปนี้ มาตรา 2 เด จึงไม่มีเงื่อนไขพื้นฐานที่ใช้ในงานนี้ และมีรัฐ - of - the - art ของใหญ่สถาปัตยกรรมข้อมูลและ theapplicationofmetadata qualityattributes , , และ qualitymetrics นโยบายคุณภาพในการใช้งานทางธุรกิจ ส่วนที่ 3 แนะนำโซลูชั่นสำหรับการประเมินคุณภาพข้อมูลในสถาปัตยกรรมข้อมูลใหญ่ มาตรา ๔ให้กรณีตัวอย่างของวิธีการพัฒนาที่ใช้ในการปฏิบัติงาน บริษัทกรณีอุตสาหกรรมที่มีความเข้าใจในความต้องการของลูกค้าโดยการใช้ข้อมูลสื่อสังคม มาตรา 5 ให้ตรวจสอบของการทดลองการใช้โซลูชั่น และ identi ES จึงบกพร่องและพัฒนาเป้าหมาย ในที่สุด ส่วนที่ 6 สรุปผลงาน
การแปล กรุณารอสักครู่..