Data source has dramatically increased from traditional transactional processing to others that
include Internet data (e.g., clickstream and social media), research data (e.g., surveys and
industry reports), location data (e.g., mobile device data and geospatial data), images (e.g.,
surveillance and satellites), supply chain data (e.g., EDI, vendor catalogs), and devices data (e.g.,
sensors and RFID devices), (Minelli et al., 2013). Big Data concerns structured, semi-structured
and unstructured data. Structured data are data with a formal structure of data models such as
fixed fields in a record or a file, or columns and rows in a relational table. Unstructured data are
data with no identifiable formal structure of data models. They include unstructured text in
documents, emails and blogs, PDF files, audio, video, images, click streams and Web contents.
Semi-structured data type does not fit into a formal structure of data models, but it contains tags
that separate semantic elements, which includes the capability to enforce hierarchies within the
data (Minelli et al., 2013). Data variety contributes to the complexity of capturing, storing,
processing and performing analytics of Big Data. IBM (2013) provided examples of variety that
include monitoring hundreds of live video feeds from surveillance cameras to target points of
interest, and exploiting the 80% data growth in images, video and documents to improve
customer satisfaction.
แหล่งข้อมูลได้อย่างมากเพิ่มขึ้นจากการประมวลผลทรานแซคชันแบบอื่นที่รวมข้อมูลอินเทอร์เน็ต (เช่น clickstream และสังคม) การค้นคว้าข้อมูล (เช่น สำรวจ และอุตสาหกรรมรายงาน), ข้อมูลสถาน (เช่น ข้อมูลโทรศัพท์มือถือและข้อมูล geospatial), ภาพ (เช่นเฝ้าระวังและดาวเทียม), ใส่โซ่ข้อมูล (เช่น EDI แค็ตตาล็อกของผู้จัดจำหน่าย), และข้อมูลอุปกรณ์ (เช่นเซนเซอร์และอุปกรณ์ RFID), (Minelli et al., 2013) ข้อมูลขนาดใหญ่ที่เกี่ยวข้องกับโครงสร้าง กึ่งโครงสร้างและไม่มีโครงสร้างข้อมูล โครงสร้างข้อมูลเป็นข้อมูลที่ มีโครงสร้างเป็นแบบจำลองข้อมูลเช่นเขตข้อมูลที่ถาวรในระเบียน หรือ แฟ้ม หรือคอลัมน์ และแถวในตารางที่สัมพันธ์กัน ไม่มีโครงสร้างข้อมูลข้อมูลที่ มีโครงสร้างอย่างเป็นทางการไม่ระบุของแบบจำลองข้อมูล รวมข้อความที่ไม่มีโครงสร้างในเอกสาร อีเมล์ และบล็อก ไฟล์ PDF เสียง วิดีโอ ภาพ กระแสคลิ กเนื้อหาเว็บชนิดข้อมูลกึ่งโครงสร้างไม่เหมาะทางโครงสร้างของแบบจำลองข้อมูล แต่จะไม่ประกอบด้วยแท็กที่แยกองค์ประกอบความหมาย ซึ่งรวมถึงความสามารถในการบังคับใช้ลำดับชั้นภายในข้อมูล (Minelli et al., 2013) ข้อมูลต่าง ๆ สนับสนุนความซับซ้อนของการจับภาพ เก็บประมวลผล และการวิเคราะห์ข้อมูลขนาดใหญ่ ตัวอย่าง IBM (2013) ให้หลากหลายที่รวมของสดวิดีโอตัวดึงข้อมูลจากกล้องวงจรจุดเป้าหมายของการตรวจสอบดอกเบี้ย และ exploiting เติบโต 80% ข้อมูลในรูปภาพ วิดีโอ และเอกสารเพื่อปรับปรุงความพึงพอใจของลูกค้า
การแปล กรุณารอสักครู่..

แหล่งข้อมูลได้เพิ่มขึ้นอย่างมากจากการประมวลผลการทำธุรกรรมแบบดั้งเดิมที่คนอื่น ๆ
ที่มีข้อมูลทางอินเทอร์เน็ต(เช่นเส้นทางและสื่อสังคม) ข้อมูลการวิจัย
(เช่นการสำรวจและรายงานภาคอุตสาหกรรม) ข้อมูลสถานที่ (เช่นข้อมูลอุปกรณ์มือถือและข้อมูลเชิงพื้นที่) ภาพ (
เช่นการเฝ้าระวังและดาวเทียม) ข้อมูลห่วงโซ่อุปทาน (เช่น EDI, แคตตาล็อกของผู้ขาย) และข้อมูลอุปกรณ์
(เช่นเซ็นเซอร์และอุปกรณ์RFID), (Minelli et al., 2013)
ความกังวลเกี่ยวกับข้อมูลขนาดใหญ่ที่มีโครงสร้างกึ่งโครงสร้างและข้อมูลที่ไม่มีโครงสร้าง
ข้อมูลที่มีโครงสร้างเป็นข้อมูลที่มีโครงสร้างอย่างเป็นทางการของรุ่นข้อมูลเช่นสาขาการแก้ไขในบันทึกหรือแฟ้มหรือคอลัมน์และแถวในตารางสัมพันธ์
ข้อมูลที่ไม่มีโครงสร้างเป็นข้อมูลที่ไม่มีโครงสร้างอย่างเป็นทางการระบุตัวตนของรูปแบบข้อมูล พวกเขารวมถึงข้อความที่ไม่มีโครงสร้างในเอกสาร, อีเมลและบล็อกไฟล์ PDF, วิดีโอ, เสียง, ภาพคลิกลำธารและเนื้อหาเว็บ. ชนิดข้อมูลกึ่งโครงสร้างไม่พอดีกับโครงสร้างอย่างเป็นทางการของรุ่นข้อมูลแต่จะมีแท็กที่แยกองค์ประกอบความหมายซึ่งรวมถึงความสามารถในการบังคับใช้ภายในลำดับชั้นข้อมูล(Minelli et al., 2013) หลากหลายข้อมูลที่ก่อให้เกิดความซับซ้อนในการจับภาพและจัดเก็บประมวลผลและการวิเคราะห์ที่มีประสิทธิภาพของข้อมูลขนาดใหญ่ ไอบีเอ็ม (2013) ให้ตัวอย่างของความหลากหลายที่รวมถึงการตรวจสอบหลายร้อยภาพวิดีโอสดฟีดจากกล้องวงจรปิดที่จะกำหนดเป้าหมายจุดที่น่าสนใจและการใช้ประโยชน์จากข้อมูลการเจริญเติบโต80% ในภาพวิดีโอและเอกสารในการปรับปรุงความพึงพอใจของลูกค้า
การแปล กรุณารอสักครู่..

แหล่งข้อมูลได้เพิ่มขึ้นอย่างมากจากการประมวลผลธุรกรรมแบบดั้งเดิมไปยังผู้อื่นว่ารวมข้อมูลบนอินเทอร์เน็ต ( เช่น clickstream และสื่อสังคม ) , ข้อมูล ( เช่น การสำรวจและวิจัยรายงานอุตสาหกรรม ) , ข้อมูลเชิงพื้นที่ ( เช่นอุปกรณ์มือถือและข้อมูล geospatial ข้อมูล ) , ภาพ ( เช่นการเฝ้าระวังและดาวเทียม ) , จัดหาข้อมูลโซ่ ( เช่น EDI , ผู้ขายแคตตาล็อก ) และข้อมูลอุปกรณ์ ( เช่นเซนเซอร์และอุปกรณ์ RFID ) , ( มิเนลลี่ et al . , 2013 ) ข้อมูลกึ่งโครงสร้างใหญ่เกี่ยวกับโครงสร้างและข้อมูลที่ไม่มีโครงสร้าง . คือ ข้อมูลที่เป็นข้อมูลที่มีโครงสร้างของแบบจำลองข้อมูลเช่นการแก้ไขเขตข้อมูลในระเบียนหรือแฟ้มหรือคอลัมน์และแถวในความสัมพันธ์ของตาราง ข้อมูลที่ไม่มีโครงสร้างเป็นข้อมูลที่มีโครงสร้างที่ไม่ระบุของแบบจำลองข้อมูล มีข้อความใหม่ในเอกสาร , อีเมล์ , บล็อก , ไฟล์ PDF , วิดีโอ , เสียง , ภาพ , และลำธารคลิกเว็บเนื้อหากึ่งโครงสร้างชนิดข้อมูลที่ไม่เข้ากับโครงสร้างของข้อมูลแบบ แต่มันมีแท็กที่แยกองค์ประกอบของความหมาย ซึ่งรวมถึงความสามารถในการบังคับใช้ลำดับชั้นภายในข้อมูล ( มิเนลลี่ et al . , 2013 ) หลากหลายข้อมูลที่ก่อให้เกิดความซับซ้อนในการจับ , จัดเก็บการประมวลผลและการวิเคราะห์ข้อมูลใหญ่ IBM ( 2013 ) ให้ตัวอย่างของความหลากหลายที่รวมถึงการตรวจสอบหลายร้อยฟีดวิดีโอสดจากกล้องไปยังจุดเป้าหมายของดอกเบี้ย และการใช้ประโยชน์จากข้อมูล 80% ของภาพวิดีโอ และเอกสาร เพื่อปรับปรุงความพึงพอใจของลูกค้า
การแปล กรุณารอสักครู่..
